火电厂每天有大量监控数据(包括各转机的轴承温度/震动,还有流量什么的)不知道这些数据有什么用
查看全文如何在windows安装部署spark 求大神们的告知…?
准备初次接触这个,该怎么学习spark,求建议准备完成 基于spark的分类算法的设计与研究 这个毕设 之前不了解数据挖掘 不了解spark 难度高么 求大神们的指点
查看全文想做金融有关的职业,但是本人有一个缺点就是不愿意搜集信息,这样的我适合什么工作?
具体说就是我自己不愿意搜集信息,平生最烦就是向excel里面录入信息,但是非常喜欢在众多已有的信息中搜寻自己需要的信息,并分析。也比较喜欢分析数据,喜欢做预测。这样的我适合什么与金融相关的职业
查看全文对于女生来说,数据挖掘这个研究方向以后好找工作吗?
我现在刚上研一,不想读博,想了解一下数据挖掘这个方向对于女生来说,研究生出来后好就业吗?是不是很难学,只能学点皮毛,企业也不会收?我们实验室有嵌入式,软件编程,PLC,现在有点迷茫,请各位知友给点意见,谢谢^O^
查看全文如何进行feature selection以及weka上的具体操作?
我有一组数据,有50多个属性(记为Attribute 1, Attribute 2, …, Attribute n),均为数值型,现在我想对Attribute1进行预测,并想知道Attribute 2-n哪些属性对预测Attribute 1 有帮助,需要进行 feature selection。 请问我应如何进行feature selection呢?在Weka上怎么实现?
查看全文ML/DM方向的CS硕士 考虑去欧美读金融工程硕士(MFE) 如何定位未来就业方向?
本人海外CS硕毕业正在IT行业工作,硕士期间的研究方向是数据挖掘data mining和机器学习machine learning以及大数据分析big data analysis。由于之前工作实习期间和各行各业人士的接触,对金融工程产生兴趣,从而萌生了去欧美读一个MFE的想法。最近看了一些国内国外的帖子,逐渐对这一行业有所了解,同样是quant(当然是各种quant),各种背景出身的人(如math/physics/cs/engineering phd或是mfe等等)将来适合的职业发展道路相差很大。而我虽然算是门外汉,但也想在选择读mfe前对将来的职业道路有一定的规划。个人不想做完全是developer的工作(如金融系统开发),而对其他 […]
查看全文sklearn中的模型对于大数据集如何处理?
今天用sklearn的svm.svc训练模型,fit的时候出现了MemoryError。另外在用cross_validation.cross_val_score做交叉检验的时候也出现了同样的问题。由于数据比较稀疏,改用了linearsvc,不会出现这种错误了,训练的也比较快。但是考虑到这种情况,如果数据集比较大,没办法一次读入内存或者一次训练完成的话,sklearn有没有提供分批读入并训练的方式呢?还请大神赐教。
查看全文挖掘同义词有哪些比较好的方法呢?
挖掘同义词有哪些比较好的方法呢?比如优劣和好坏就是一对同义词。或者有小伙伴用word2vec来挖掘过吗?效果怎么样,具体有什么方法呢?
查看全文如何得到列车时刻表的数据?
网络建模课需要做一个项目,打算做关于中国城市之间每天的火车车次数量。从网上找不到完整的列车时刻表数据,请问有什么方便的办法得到这些数据吗?如果没有办法直接下载到,也请教一下怎么用爬虫来获取数据。PS:一般来说火车时刻表还是固定的,所以只要是最近的某一天的时刻就行了。
查看全文随机森林中训练每一棵树输入的m个特征都是随机选取的吗?
RF要有很多树,每棵树选同等数目的特征,比如第一棵树随机选1,3,5号特征,第二棵树随机选2,4,6号特征,是这个意思吗?还是所有树都随机选出1,3,5呢?
查看全文