图片中红色框框中的一系列的数据是啥意思呢?另外,我的分类结果是0或1,为啥只有在0类别下显示这些数据呢?
查看全文python读取图片内存不足?
如题,我有800多张图片,一共有200m,想通过numpy读取后然后存到csv文件中,但提示内存不足,怎么优化?
查看全文学习机器学习,面对以后的职业选择,现在有点迷茫了。请大家给点意见,让我知道现在该怎么做,看什么书?
我的情况是:(刚刚入学研究所二年级,明年三四月就得准备找实习了,所以现在很紧张)能力方面:1.学习过机器视觉和图像识别的相关知识,了解常用的机器学习算法原理(SVM LDA HMM CRF等,看过<<机器学习实战>>和<<统计学习方法>>正在看<<集体智慧编程>>)。也了解一些深度学习的知识,但没有实际使用过。2.做过简单的文本分类,聚类,熟悉Hadoop spark的工作过程和他们的差异 看过<< hadoop海量数据处理>>和一部分《hadoop权威指南》。3.编程能力 C/C++ JAVA Python.4.项目方面:本科毕设做的人 […]
查看全文大公司里面有人专门负责标注数据吗?
比如分词类的工具,可能跟领域相关,用该领域的词典和语料来训练CRF效果应该比通用的分词器效果要好很多(特别是一些术语)。这种情况下,工程上的做法是自己找人分词?还是用规则方法结合领域词典来解决?哪个性价比更高?
查看全文能否分享实际的经历说明 对机器学习算法理论的深入理解给工程问题解决的帮助?
不太懂,模型算法选择,参数调整到底需要理解这些算法到什么程度,太深的东西对算法调优有什么帮助吗?
查看全文截至 2016 年 3 月,机器学习、数据挖掘、计算机视觉等的泡沫有多大?
知乎上搜过,google上也用中英文搜过,没有找到近期(一年以内)对这个问题比较详细的论述
查看全文学习排队论是否有助于分布式计算、机器学习?
不知排队论是否对后续的大数据项目有用,处理数据时是否需要排队论的知识来实现分布式计算的负载平衡?
查看全文adaboost有训练数据和测试数据之分吗,还是所有的数据都用作训练数据?
最近研究AdaBoost,但是网上的讲解都是使用所有的数据训练用做最终分类器的训练,而没有测试过程。这样怎么检测它的泛化能力呢?如果有测试数据的话,对测试数据进行训练当然可以达到很高的分类真确率,但是不一定会有高的泛化能力啊,请大神们解答疑惑,谢谢!
查看全文