算法 - 12Reads管理问答

有人使用过xgboost吗？

江志良 2017-06-05 2051 次浏览

最近在用xgboost进行数据分类，xgboost是最近很牛逼的一个boost实现，在很多数据挖掘比赛(比如kaggle)上都大放异彩我使用的是xgboost的java版本，用了它自带的例子没有任何问题，分类很正确，但是用自己生成的数据测试就不对劲了，我生成了一组用肉眼就可以区分的数据1,1,1,1,1,1,1,21,1,1,1,1,1,1,2…1,1,1,1,1,1,1,22,2,2,2,2,2,2,42,2,2,2,2,2,2,4…2,2,2,2,2,2,2,4并转换成了SVM格式的数据文件，结果用xgboost训练时只有50%的准确率，这是为毛啊？xgboost的参数我都是按照默认来的没动过(̶ […]

查看全文

数据分析有希望转算法工程师吗？

Robot 2017-06-03 1211 次浏览

由于没接触过算法工程师，不清楚自己有没有转型的可能性，有些迷茫。请问什么样的职位或职业经历比较有帮助？有哪些职位可以作为过度或学习路径？多谢！说说本人经历：# — begin统计本科毕业，不过刚毕业的4年里，工作经历涉及更多的是商业分析和dw相关的项目；有时会用R，Python的处理数据；hql和streaming也没问题。机器学习方面的知识，主要靠业余时间看国外的书，比如ISL，ESL还有一堆动物书，算法了解也就限于书上这些。目前的工作是数据挖掘，其实多数时间还是写hql和Python处理数据……建模调用R和scikit里的包；coding经验主要是数据处理和可视化，也能用Python写出主流算法的toy代码。数学基础 […]

查看全文

Offer比较：华为供应链和厦门亿联音频算法工程师哪个好？

戴旭晟 2017-05-31 1368 次浏览

各位好，我是物理系应届硕士毕业生，目前纠结于工作上的选择，希望有了解上述两类岗位的给点意见，跪谢

查看全文

如何评价k

沈怀喻 2017-05-29 843 次浏览

和其他主流的聚类算法有什么区别？为什么数据挖掘和机器学习的书籍中都很少提到？

查看全文

学会用聚类算法进行数据挖掘需要怎样的数学基础？

岳海亮 2017-05-27 1085 次浏览

目前有一个需要做的工作是基于经纬度进行聚类，数学只学过微积分，线代，概率统计，复变这样的基础课程。

查看全文

如何看待“工作和兴趣的区别还是蛮大的，大部分算法工程师，数据挖掘工程师都只是在不停地跑数据调参数”？

卓寿杰 2017-05-24 1430 次浏览

查看全文

陈立人这个蓄水池抽样写错了么?

Robot 2017-05-21 1271 次浏览

图灵社区 : 阅读 : 忘我之乘积；及蓄水池抽样精妙解法我觉得和很多帖子的都不同，正确的应该用第i(i>k)个元素替换第randi = rand(1, i)个(if randi <= k)是k/i 的概率，而不替换是(i-k)/i的概率而陈立人替换概率写成1/i了 (所有下标1-based)

查看全文

offer比较：sap中国研究院software engineer vs 拉勾网大数据挖掘算法工程师？

Xiaofan CHEN 2017-05-21 964 次浏览

拉勾的是核心团队，但sap感觉毕竟高大上一点。求分析！主要从以后的发展角度。例如5年，10年，20年后的情况。非常感谢！！！

查看全文

随机森林中是怎么对数据进行随机选择的？

雷天琪 2017-05-20 1373 次浏览

在随机森林中使用Bagging方法，比如有1000个样本，每一次采用Bootstrap采样（有放回），那么就是说每次选1000个（有重复），但是有的样本在采样中没有被选择过，就把它们当作out-of-bag来进行测试，是这样吗？还是在1000个样本中随机选择一些，比如500个，然后用剩下的500个进行测试？

查看全文

写一篇关于分类预测算法论文的问题？

hyufeng 2017-05-19 1675 次浏览

读过《机器学习实战》和《数据挖掘导论》，本科也是学习过统计学，R语言，接触过python，自己本来也就是计算机本科。由于联系论文老师一直得不到回复（可能是本科论文水，老师太忙没功夫），自己想写一篇比较有水平的论文，不要太高深（自己全看不懂没意思），但是有一定挑战性。自己想到了3个方向：1.由于分类算法比较多，可以整理出来然后比较优劣性。 2.关注于某一个算法,比如SVM，研究一下数学原理。 3.编程实现一些算法。所以自己也是比较踌躇，需要一些指导意见，由于自己也是初学者，也可有其他的方向。

查看全文

1 … 9 10 11

帐户注册

登录

找回密码