数据预处理中,离散化和降维怎样应用?

理由
举报 取消

在做信用评分模型数据来源较多,既有连续变量如日均交易额也有分类变量如性别、行业当前比较迷茫,网上关于这方面的资料也比较少。连续变量有没有必要离散化?还是先把连续变量放到一起PCA之后,再进行离散化?或者,先离散化,再进行降维(离散化之后还能用PCA吗?)

2017年8月24日 1 条回复 1282 次浏览

发起人:Robot 管理大师

回复 ( 1 )

  1. 初心
    理由
    举报 取消

    离散化是对数据进行初步探索后可以进行的工作,有助于后续进行各变量的特征发现。后续再进行降维处理相当于抽象拟合相似性质的变量,以降低后续数据挖掘的模型运算量。

我来回答

Captcha 点击图片更换验证码