机器学习模型中的分类变量最多可以有多少个值?
比如说LR回归里面有个 城市变量,那么这个城市变量下面有1000个多个值。这么多值的分类变量模型能够进行很好的运算么?或者有没有其他好的处理方式??
查看全文中航信移动科技公司发展前景如何?
大家好,我是一名本硕985应届生,刚刚拿到中航信移动科技的offer,想了解一下这家公司的未来前景以及作为毕业生第一份工作是否合适?HR跟我谈薪资是税前12W,有户口。正常的五险一金,其他福利没有。想做技术相关的工作的话是不是不太合适去这样的公司,毕竟是国企~~请各位熟悉的高人指点迷津
查看全文机器学习模型的泛化能力不足,有什么改进思路?
二分类问题,采用Adaboost方法,80:20划分训练集和测试集进行交叉验证。通过调整基础分类器的个数,训练集的分类正确率控制在0.6~1.0范围内时,测试集的分类正确率都在0.6左右徘徊,很难提升。通过降低模型复杂度的方式,降低了训练集的分类准确率,但并不能获得更好的泛化能力(测试集表现),请问各位大神有什么提升办法?多谢各位的回答,bow~提问时为了简单明了,已经做的一些尝试没有提到,补充说明一下哈:1.关于模型选择,已经做过,数据集本身线性不可分,用tree族和非线性kernal的svm效果都不错,从效率出发选了tree族的,random forest和adaboost也做了比较,ada更好2.关于模型的参数调优,可以尝试的 […]
查看全文有监督的学习标签是否与取值有关?
如题,一个机器学习分类算法,假设之前的类别标签是1,2,3.如果我现在改成1,3,6.会影响分类器性能吗?求解释,谢谢!
查看全文机器学习中,用什么算法可以解决用户对商品属性的选择偏好问题?
有一个研究课题想用机器学习的经典算法解决:已知某一用户的历史购买数据和其购买的某一类商品的属性(如价格、外观等),通过这些数据,找出该用户对购买这类商品时的选择偏重(如在选择时优先考虑价格、其次是外观),并且可以赋予权值。用什么算法可以做到?决策树,层次分析法、关联分析,还是其它?
查看全文