在图像识别中,用到很多特征抽取的方法, 可是每一个图片所抽取出来的信息不一样, 例如一个建筑,它所包含的信息量有100个, 而一朵花却没有那么多个, 如果进行分类器训练,我们的特征数目不一致,那要如何去解决呢?求教!
查看全文同样是跑随机森林,为什么用单机的R跑和在服务器上用Spark的MLlib结果差好多?
原数据只是抽出来的一个3万来条的样本,大约60%为0,40%为1。单机用的是R下的randomForest包,准确率能有85%,这个结果还是蛮可靠的。但是同样的数据,放到服务器上用Spark的MLlib跑,准确率只有60%左右,混淆矩阵也看不出问题。分类型变量也用categoricalFeaturesInfo命令注明了,这是怎么回事呢?
查看全文如何看待「编诗姬」机器人写诗?
今天看到朋友圈分享的一个机器人自动作诗软件。可以填词作诗也可以随机生成。附上链接:帮你写诗的编诗姬你对这个机器人作诗软件怎么看?机器人创作是否会在未来取代人类创作?相比于人工作诗,机器人作诗的局限在哪里?有哪些算法实现一个作诗系统?需要考虑哪些特征?做一个写故事的机器人又有多难?
查看全文看懂CS顶会论文需要补充哪些数学知识?
本人大四,本科CS专业,发现在看ICML等顶会论文时比较吃力,感觉是数学知识不足,但我不知道具体是哪方面,希望有前辈能推荐一些数学书(或者课程),中英文均可,谢谢。
查看全文