用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
半年前从纯数学专业转行到了互联网行业做数据挖掘和推荐系统,在做具体的业务的时候 遇到了一些知识点,于是自己整理出来。如果有后来人需要转行的话,可以用这份资料来 参考一下。大牛请忽视以下的内容,小白可以参考下。 从数学专业转行到工业界做数据挖掘需要的知识储备: 1. Hadoop,HIVE,SQL数据库操作需要会。 Hive用于提取数据,做基本的数据分析。hive的基本函数,比如聚合函数,数学函数,字 符串的函数,连接表格函数等。hive的各种语句,比如if else,case等语句。 EXCEL的基本操作需要掌握,用熟悉了其实挺方便的。 2. 编程语言最好会python,c/c++,或者java,至少一种。做机器学习的话感觉用python 会多一些。 3. Linux系统,脚本语言Shell。 4. 数据挖掘和机器学习的基础知识和算法: LR,SVM,聚类算法,神经网络算法,决策树,随机森林,GBDT,异常值检测等常用算法需 要掌握。 特征工程的基础知识:根据相应的产品进行必要的特征构造,物品特征,交叉特征等。 工程上的最优化论文推荐: Ad Click Prediction a View from the Trenches: 需要了解的是相关论文的背景SGD算法,Truncated Gradient算法,RDA算法,FOBOS算法, FTRL算法等。 5. 统计学: 时间序列模型,变量的相关系数,ROC和AUC曲线,交叉验证,主成分分析。 6. 大数据,推荐系统,计算广告学的科普书籍。
这对于你来说应当不难啊, 数据分析的理论基础就是概率论,统计学, 其次就是机器学习的一些算法, 然后就是各种数据分析工具的使用, 常用的工具如SAS, R, IBM modeler 等。这些对于数学专业的人来说应当不难。
具体到各个行业领域, 就需要深刻理解数据背后所代表的现实意义了(具体来说, 就是你要理解这个行业里面的数据,x 代表什么, y 代表什么等等), 然后结合数据分析的技能进行现实的分析了, 其实很多行业都需要数据分析, 你得选一个你切入的行业, 这很重要!
昵称*
E-Mail*
回复内容*
回复 ( 2 )
这对于你来说应当不难啊, 数据分析的理论基础就是概率论,统计学, 其次就是机器学习的一些算法, 然后就是各种数据分析工具的使用, 常用的工具如SAS, R, IBM modeler 等。这些对于数学专业的人来说应当不难。
具体到各个行业领域, 就需要深刻理解数据背后所代表的现实意义了(具体来说, 就是你要理解这个行业里面的数据,x 代表什么, y 代表什么等等), 然后结合数据分析的技能进行现实的分析了, 其实很多行业都需要数据分析, 你得选一个你切入的行业, 这很重要!