仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-163-302
请扫码咨询

新闻动态

NEWS CENTER

什么情况下咱们需要进行特征挑选

2023-08-29

什么情况下咱们需要进行特征挑选

训练数据包括许多冗余或无用的特征,移除这些特征并不会导致丢掉信息。其间冗余是指一个自身很有用的特征与别的一个有用的特征强相关,或它包括的信息能从其它特征推演出来;

特征许多但样本相对较少,也便是某一个维度的信息数据量太少,覆盖度较低。

关于特征挑选的4个进程

以下是模型特征挑选的4个进程,策略产品经理以了解为主:

  1. 发生进程:发生特征或特征子集候选集合;
  2. 评价函数:衡量特征或特征子集的重要性或许好坏程度,即量化特征变量和方针变量之间的联络以及特征之间的彼此联络。为了避免过拟合,可用交叉验证的方法来评估特征的好坏;
  3. 中止原则:为了削减核算复杂度,需设定一个阈值,当评价函数值到达阈值后搜索中止;
  4. 验证进程:在验证数据集上验证选出来的特征子集的有效性。

四、模型挑选

相关推荐