帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

学习机器学习,面对以后的职业选择,现在有点迷茫了。请大家给点意见,让我知道现在该怎么做,看什么书?

我的情况是:(刚刚入学研究所二年级,明年三四月就得准备找实习了,所以现在很紧张)能力方面:1.学习过机器视觉和图像识别的相关知识,了解常用的机器学习算法原理(SVM LDA HMM CRF等,看过<<机器学习实战>>和<<统计学习方法>>正在看<<集体智慧编程>>)。也了解一些深度学习的知识,但没有实际使用过。2.做过简单的文本分类,聚类,熟悉Hadoop spark的工作过程和他们的差异 看过<< hadoop海量数据处理>>和一部分《hadoop权威指南》。3.编程能力 C/C++ JAVA Python.4.项目方面:本科毕设做的人 […]

查看全文

大公司里面有人专门负责标注数据吗?

比如分词类的工具,可能跟领域相关,用该领域的词典和语料来训练CRF效果应该比通用的分词器效果要好很多(特别是一些术语)。这种情况下,工程上的做法是自己找人分词?还是用规则方法结合领域词典来解决?哪个性价比更高?

查看全文

adaboost有训练数据和测试数据之分吗,还是所有的数据都用作训练数据?

最近研究AdaBoost,但是网上的讲解都是使用所有的数据训练用做最终分类器的训练,而没有测试过程。这样怎么检测它的泛化能力呢?如果有测试数据的话,对测试数据进行训练当然可以达到很高的分类真确率,但是不一定会有高的泛化能力啊,请大神们解答疑惑,谢谢!

查看全文