用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
非学术论文,常见的工程处理中,方法如下,仅供参考:
1.值的信息饱和程度
比如:常常会观察值的IV值,提取更高信息量的变量;会观察变量之间的协方差矩阵,删除共线性高的变量等等
2.原始变量组合
以变量组合后,信息量减少最少的方式产出新变量Vi,常见于PCA等
3.模型筛选
比如randomforest中的importance,lasso回归等,压缩变量个数降低维度
4.模型训练
在模型训练过程中,前馈或者后馈式的删减新增变量,观察模型前后的AIC值、recall值的变化
5.业务经验
比如,一个人的信用程度和他是不是帅气没有关系,可以直接删除
要先做KMO和Bartlett检验来看该数据集是否适合降维
昵称*
E-Mail*
回复内容*
回复 ( 2 )
非学术论文,常见的工程处理中,方法如下,仅供参考:
1.值的信息饱和程度
比如:常常会观察值的IV值,提取更高信息量的变量;会观察变量之间的协方差矩阵,删除共线性高的变量等等
2.原始变量组合
以变量组合后,信息量减少最少的方式产出新变量Vi,常见于PCA等
3.模型筛选
比如randomforest中的importance,lasso回归等,压缩变量个数降低维度
4.模型训练
在模型训练过程中,前馈或者后馈式的删减新增变量,观察模型前后的AIC值、recall值的变化
5.业务经验
比如,一个人的信用程度和他是不是帅气没有关系,可以直接删除
要先做KMO和Bartlett检验来看该数据集是否适合降维