数据预处理中,离散化和降维怎样应用? 举报 理由 举报 取消 在做信用评分模型数据来源较多,既有连续变量如日均交易额也有分类变量如性别、行业当前比较迷茫,网上关于这方面的资料也比较少。连续变量有没有必要离散化?还是先把连续变量放到一起PCA之后,再进行离散化?或者,先离散化,再进行降维(离散化之后还能用PCA吗?) 2017年8月24日 1 条回复 1282 次浏览 分析,学习,数据,机器
回复 ( 1 )
离散化是对数据进行初步探索后可以进行的工作,有助于后续进行各变量的特征发现。后续再进行降维处理相当于抽象拟合相似性质的变量,以降低后续数据挖掘的模型运算量。