读过《机器学习实战》和《数据挖掘导论》,本科也是学习过统计学,R语言,接触过python,自己本来也就是计算机本科。由于联系论文老师一直得不到回 复(可能是本科论文水,老师太忙没功夫),自己想写一篇比较有水平的论文,不要太高深(自己全看不懂没意思),但是有一定挑战性。 自己想到了3个方向:1.由于分类算法比较多,可以整理出来然后比较优劣性。 2.关注于某一个算法,比如SVM,研究一下数学原理。 3.编程实现一些算法。 所以自己也是比较踌躇,需要一些指导意见,由于自己也是初学者,也可有其他的方向。
查看全文如何用神经网络实现连续型变量的回归预测?
我发现绝大多数用神经网络、深度学习方法解决的问题都是分类问题。对于连续型变量的回归预测问题(比如预测身高、体重、年龄、温度、质量得分),我也见过几篇用神经网络的文章,但结论都是神经网络不适用,推测原因是神经元中非线性映射函数的存在。之前一个朋友的解决方法是把连续型变量按区间划分,转化为离散的类别变量……但我总觉得这样不太好。请教各位大神们,有没有很好的用神经网络实现连续型变量回归预测的方法?或者相关的讨论或结论?
查看全文数据分析如何转数据挖掘?
本科通信,毕业后一直从事与数据不太相关的工作。去年6月份转到一家互联网公司做数据分析师,半年来大部分工作是SQL提数,活动效果跟踪,写分析报告等工作,想转数据挖掘,但发现挖掘岗位对专业要求高,一线公司基本需要科班出身。自学过统计学,数据挖掘相关只看过一本《数据挖掘导论》,都是野路子,不得其法。请教大牛们,分析岗位想转挖掘,有无可行方法建议?
查看全文数据挖掘过程疑问?
数据挖掘没人带,自己琢磨现在有一个数据集和spark集群关于分词1、在单机分词,生成分词后的数据集,然后在spark上进行挖掘2、直接在spark集群进行分词,挖掘哪种方案合适?如果是1的话,单机执行效率会不会很慢如果是2的话,如何在分词时加载自定义词库,好多分词工具好像都不支持从hdfs中获取词典吧,那如何保证在集群中每个节点可以加载自定义词典,难道每个节点都要存放一份关于算法选择和验证如果数据量很大,跑一次要很久,那么如何选择合适的算法和验证1、使用spark集群抽样,使用部分数据来选择2、取一部分数据,使用scikit-learn来选择,验证完成后在使用spark集群哪种方案比较合适?
查看全文请问德国哪些大学的数据挖掘或者数据分析方向不错?
本人某211软件工程专业大三女生,对这个方向很感兴趣,想申请到德国读研,想知道1.这个方向属于德国哪个专业里的2.我的本科专业是否可以申请到德国这方面的研究生3.哪些大学这个方面不错,研究或者应用类谢谢
查看全文如何應聘百度大数据算法工程师?
小弟在某中大型國際型企業擔任大數據與BI工作已近兩年,而在算法相關領域工作也有一二年之譜,對Java或大型系統開發也算熟練,但小弟履歷在各招聘網站上卻總是被百度HR退回,請問是為什麼呢?百度大数据算法工程师的要求究竟是什麼?
查看全文