我把对象数据按排序后分1,0 两类比例按一个百分比然后发现训练集百分比低至0.3就会全部选0,反则0.6以上就全部选1请问为什么呢
查看全文谁能告诉我怎么装插件让eclipse当Pythonxy的ide?不是python是Pythonxy。
在eclipse上开发python我知道怎么装插件,但是matplotlib总是用不了,现在换成了pythonxy,什么包都有了,但是比较习惯用eclipse开发环境,请问怎么装插件??就用的是实现数据挖掘算法的,跪谢!
查看全文用R学习机器学习,理解算法后,是应该用package还是自己写?
题主是上海某高校统计学硕士,平时用R比较多,对机器学习有浓厚兴趣并开始学习,现在看了一些机器学习理论的书,对算法有个大致了解了,想知道以后如果想往这方面发展,是应该自己去编程实现呢?还是用R中那些成熟的package去实现呢?
查看全文新世界畅学网xsjclass的网校模式你怎么看?
畅学网是新世界教育集团旗下的专注小语种培训的网校,目前从9月1日上线以来,注册用户突破10万,新增上线课程突破300门,依托新世界教育全国的地面培训中心和樱花日语的优质外教师资资源,即有成熟的渠道运营模式,也有线上的一系列运作手法和内容产出,你怎么看这个网站的趋势?
查看全文分布的相似度(距离)用什么模型比较好?
如果在处理的数据中,有的是分布:比如工厂内分贝值的分布,或者电机转速的分布。一般一个分布(一维的)就是一个向量,满足每一个维度都大于0且L^1(V)=1,平时我们也直接当成向量进行处理,求欧氏距离,但是觉得这样做并不科学,因为作为向量就默认了“维度”这一坐标是没有意义的,可是实际上,分布里的横坐标有着很实际的意义,比如分贝或者转速。请问用什么方法可以更好地衡量两个分布之间的相似度(或者距离)?
查看全文