原数据只是抽出来的一个3万来条的样本,大约60%为0,40%为1。单机用的是R下的randomForest包,准确率能有85%,这个结果还是蛮可靠的。但是同样的数据,放到服务器上用Spark的MLlib跑,准确率只有60%左右,混淆矩阵也看不出问题。分类型变量也用categoricalFeaturesInfo命令注明了,这是怎么回事呢?
查看全文如何看待「编诗姬」机器人写诗?
今天看到朋友圈分享的一个机器人自动作诗软件。可以填词作诗也可以随机生成。附上链接:帮你写诗的编诗姬你对这个机器人作诗软件怎么看?机器人创作是否会在未来取代人类创作?相比于人工作诗,机器人作诗的局限在哪里?有哪些算法实现一个作诗系统?需要考虑哪些特征?做一个写故事的机器人又有多难?
查看全文看懂CS顶会论文需要补充哪些数学知识?
本人大四,本科CS专业,发现在看ICML等顶会论文时比较吃力,感觉是数学知识不足,但我不知道具体是哪方面,希望有前辈能推荐一些数学书(或者课程),中英文均可,谢谢。
查看全文有没有什么全自动的不用人工操作的饮料机、冰淇淋机或者小食机什么的?
想要问一下有没有单卖的小机器,像有些大城市地铁站有的那种自动可以买饮料或者食物不用人工的那种。可以投币或者扫码自己买冰淇淋饮料爆米花什么的。按键或者屏幕操作。家里有开小吃店,想放在门口卖。但没有多余的人手。重点是不需要人工。像冰淇淋机肯德基麦当劳那种不行。类似自动饮料机但不是直接卖成品,机器有加工功能的。希望告诉我这些机器都有什么,哪里可以买到。谢谢!
查看全文现在学机器学习会不会成为下一个通信的牺牲品?
机器学习,数据挖掘,计算机视觉 现在都是炙手可热的方向,从NIPS, ICML, CVPR等顶会的投稿人数,参与程度以及研究热度来看,都是达到了一个空前的高潮,相应地,工业界的薪水着实吸引人。这吸引了包括我在内的很多大学生,研究生想要投身其中,然而物极必反,如此多的人涌向其中,竞争激烈,供过于求也是很有可能的,等到你毕业的时候,未必有如今的高薪和发展,甚至一片萧条也有可能。几年前,通信行业大发展的时候,无数人挤破脑袋进通信,而现在呢,读完研究生毕业发现,曾经的热门高薪行业已经不再光鲜,又转向了高薪的互联网了。所以,机器学习到底会像通信一样,热了几年之后,就没有大发展了,还是会像互联网一样,在2000年泡沫破裂之后,重新成为下一个风口 […]
查看全文三年时间题主可以写出一个价值百万的算法的概率有多大?
背景说明:题主2014年夏毕业,专业是土木工程;到现在(2016/01/20)为止 从事javaEE开发一年半。—————————–如果工作之余学习大数据或者机器学习,三年时间根据开源的大数据平台或者人工智能系统写出一个价值百万算法的概率有多大?(目前大数据和机器学习水平为零)
查看全文如何更通俗地理解信息论中的熵及其在其他领域中的应用?
熵在决策树模型中被应用,然而关于熵的含义理解还是非常浅显。神人可否出来给一个自己的更通俗的理解?
查看全文