发起人:

回复 ( 2 )

  1. 张戎
    理由
    举报 取消
    半年前从纯数学专业转行到了互联网行业做数据挖掘和推荐系统,在做具体的业务的时候
    遇到了一些知识点,于是自己整理出来。如果有后来人需要转行的话,可以用这份资料来
    参考一下。大牛请忽视以下的内容,小白可以参考下。
    
    从数学专业转行到工业界做数据挖掘需要的知识储备:
    1. Hadoop,HIVE,SQL数据库操作需要会。
    Hive用于提取数据,做基本的数据分析。hive的基本函数,比如聚合函数,数学函数,字
    符串的函数,连接表格函数等。hive的各种语句,比如if else,case等语句。
    EXCEL的基本操作需要掌握,用熟悉了其实挺方便的。
    
    2. 编程语言最好会python,c/c++,或者java,至少一种。做机器学习的话感觉用python
    会多一些。
    
    3. Linux系统,脚本语言Shell。
    
    4. 数据挖掘和机器学习的基础知识和算法:
    LR,SVM,聚类算法,神经网络算法,决策树,随机森林,GBDT,异常值检测等常用算法需
    要掌握。
    特征工程的基础知识:根据相应的产品进行必要的特征构造,物品特征,交叉特征等。
    
    工程上的最优化论文推荐:
    Ad Click Prediction a View from the Trenches:
    需要了解的是相关论文的背景SGD算法,Truncated Gradient算法,RDA算法,FOBOS算法,
    FTRL算法等。
    
    5. 统计学:
    时间序列模型,变量的相关系数,ROC和AUC曲线,交叉验证,主成分分析。
    
    6. 大数据,推荐系统,计算广告学的科普书籍。 
    
  2. cyclone
    理由
    举报 取消

    这对于你来说应当不难啊, 数据分析的理论基础就是概率论,统计学, 其次就是机器学习的一些算法, 然后就是各种数据分析工具的使用, 常用的工具如SAS, R, IBM modeler 等。这些对于数学专业的人来说应当不难。

    具体到各个行业领域, 就需要深刻理解数据背后所代表的现实意义了(具体来说, 就是你要理解这个行业里面的数据,x 代表什么, y 代表什么等等), 然后结合数据分析的技能进行现实的分析了, 其实很多行业都需要数据分析, 你得选一个你切入的行业, 这很重要!

我来回答

Captcha 点击图片更换验证码