svm实践中出现某一类分类消失的问题?
我把对象数据按排序后分1,0 两类比例按一个百分比然后发现训练集百分比低至0.3就会全部选0,反则0.6以上就全部选1请问为什么呢
查看全文谁能告诉我怎么装插件让eclipse当Pythonxy的ide?不是python是Pythonxy。
在eclipse上开发python我知道怎么装插件,但是matplotlib总是用不了,现在换成了pythonxy,什么包都有了,但是比较习惯用eclipse开发环境,请问怎么装插件??就用的是实现数据挖掘算法的,跪谢!
查看全文机器学习与搜索如何结合写一篇硕士学位论文?
是这样的,题主正在纠结硕士学位论文开题。因为实习的原因,手头上有一些 搜索的日志(数据量够大,特征够多)。 想利用这个资源,与机器学习相结合写一篇论文。(自学了一年机器学习。)目前本人找到了两个点,一个是排序学习(learning to rank)的研究, 但是这个算法方面不知道自己能不能提出什么创新点?第二个是一个相关query的推荐系统的应用实现。但是这个又 感觉不够新颖?这两个方面有比较符合要求(研究方面要有一定的创新点, 应用方面要有一定的技术含量。)的题目(方向)?除此之外,还有什么 比较好的方向和题目? 抛开搜索,有比较好的数据来源的应用点, 也可考虑。还有 不到一个月就要开题了。 由于某些原因,只能靠自己来想。 真心求 […]
查看全文用R学习机器学习,理解算法后,是应该用package还是自己写?
题主是上海某高校统计学硕士,平时用R比较多,对机器学习有浓厚兴趣并开始学习,现在看了一些机器学习理论的书,对算法有个大致了解了,想知道以后如果想往这方面发展,是应该自己去编程实现呢?还是用R中那些成熟的package去实现呢?
查看全文未来大数据发展到一定的时候在经过专业人士的分析后能否真正的预测一个人的人生和改变他的人生轨迹?
当大数据时代发展到极致时,经专业人士针对性的具体分析后能否对一个人进行神指引,预测其的人生轨迹,生活等各方面的走向等;如果真的走到这一步应该怎么办?
查看全文计算机专业和数学专业的哪个更适合做数据挖掘类的工作?
从数据挖掘类岗位(比如数据挖掘工程师)的长远发展来看,究竟是计算机与数学专业中的哪个更具有潜力?或者说,具备更加合适的知识结构与思维方式?
查看全文分布的相似度(距离)用什么模型比较好?
如果在处理的数据中,有的是分布:比如工厂内分贝值的分布,或者电机转速的分布。一般一个分布(一维的)就是一个向量,满足每一个维度都大于0且L^1(V)=1,平时我们也直接当成向量进行处理,求欧氏距离,但是觉得这样做并不科学,因为作为向量就默认了“维度”这一坐标是没有意义的,可是实际上,分布里的横坐标有着很实际的意义,比如分贝或者转速。请问用什么方法可以更好地衡量两个分布之间的相似度(或者距离)?
查看全文