如何快速入行数据分析师? 举报 理由 举报 取消 我本科学习的国际贸易,毕业后从事出纳工作,有两年经验。上学期间接触过统计学相关知识,对数据分析一直比较有兴趣,现在想从出纳转行做数据分析师,已经开始学习R语言和PYTHON。之前从网上对数据分析做了些了解,但大多是介绍了些应该看的书、应该学会的技能之类,看完之后对数据分析师的印象还是停留在文字上。希望有数据分析大牛能结合自己所在的行业,介绍下自己日常的工作内容有哪些,并给我一些快速求职入行的建议或是工作中的心得体会。 2018年2月17日 8 条回复 2195 次浏览 分析,分析师,工具,数据,数据挖掘,能力
回复 ( 8 )
谢邀。抱歉这么久才回,不是不想回答,而是实在不知道说什么。
我读完四年本科+四年博士成为数据科学家,却偏偏很多人问我怎么才能速成,我要是知道不就不用花这么多年了吗(哭笑不得)?
事实上我不认为世上做任何事有速成的捷径。一分耕耘一分境界,老老实实学吧。
同意这一点的话,可以参考下我另一个问题下的回答,关于数据分析师,科学家都在干什么:
如何着手商业数据分析? – 知乎用户的回答
数据分析师日常工作是什么? – 知乎用户的回答
=================
有人说速成是指不走弯路,不浪费时间。特补充以下内容:
首先,我不认为我真的有什么经历是无用的,即便在数学本科时候学了很多不直接相关的课程,也对培养严谨的思维逻辑有极大的帮助。统计博士的学习让我对各种课本上学不到的模型和算法有了深刻的认识。也许从公司的角度看,我有些科研经历是无用的,我提出的有些方法他们觉得是rocket science根本派不上用场(其实是他们不懂而已),但同样是从我的以往经历中,可以找出对公司业务发展大有用处的模型方法。一些项目经验、建模的想法和技巧可以抽出来整合到新的问题中,而整个思考操作的过程是跟之前严谨的思维训练分不开的。
然后,我对这一类为了进某一行求速成(包括不想走弯路)问题都不太感冒,我觉得个人发展是个追求本心+适应现实的过程。不能一味只想着自己要干什么,也不能一心只想着现实是怎样的。从本心出发,想学就去学(网上超级多推荐的教材和技能),一边了解市场的需求,看自己能做什么,和自己的兴趣有哪些结合的地方。有一定积累后自然就会对自己想要在哪一个领域继续发展有一定的线索。
最后,数据分析行业尚处于刚开始的扩张阶段,指代的内容实在太杂。知乎上有些是数据分析领域的码农,有些是只会用一点数据分析的传统商业分析从业者,有些是数据科学家(从数据获取到成品全都会,个人觉得真要到这一步太难,精力太分散,而且什么都会其实就是什么都不会),有些是专注研发新模型算法的数据科学家(比如本人)。也很难给出一个简单明确的答复,什么有用什么没用。这样笼统地求速成只能越问越糊涂,码农会告诉你要学R、Python,Ruby、MapReduce、Hadoop、HIVE、PIG。。。所以你该去学各种软件,做传统商业分析的告诉你数据模型只是工具,你要学习一个企业是怎么运作,业务要怎样开展。像我这样的数据科学家会告诉你,想发展到我这一步,你必须去读个博士。全能型数据科学家告诉你,上面你全得做。以上每条路都不一样,需要的技能侧重也不相同。真正要思考的是个人发展规划。所以我一般只会写介绍性的东西,而不会告诉别人怎么速成。
数据分析无法快速入门。
找一份数据分析的工作
找一个靠谱的老师带你
每天背数据培养感觉
闲暇时间研究统计学和统计软件
慢慢进步……
数据分析不能停留在书本上和软件上,要实操、积累、总结、回顾……
Ps:统计学和R/Python这些东西上手没那么简单,门槛不低,光靠自己的兴趣肯定坚持不下去的,要么有及其严苛的学习计划,要么有一个老师在一直带你,自学很难的…
半年前从数学专业转行到了互联网行业做数据挖掘和推荐系统,在做具体的业务的时候遇到了一些知识点,于是自己整理出来。如果有后来人需要转行的话,可以用这份资料来参考一下。大牛请忽视以下的内容,小白可以参考下。
从数学专业转行到工业界做数据挖掘需要的知识储备:
1. Hadoop,HIVE,SQL数据库操作。
Hive用于提取数据,做基本的数据分析。hive的基本函数,比如聚合函数,数学函数,字符串的函数,连接表格函数等。hive的各种语句,比如if else,case等语句。
EXCEL的基本操作需要掌握,可以进行各种数据的处理、统计分析和辅助决策操作,用熟悉了其实挺方便的。
2. 编程语言
最好会python,c/c++,或者java,至少一种。做机器学习的话感觉用python会多一些。
3. 操作系统
Linux系统,脚本语言Shell。
4. 数据挖掘和机器学习的基础知识和算法
逻辑回归算法 Logistic Regression(LR),
支持向量机算法 Support Vector Machine(SVM),
物质扩散和热传导算法(Heat Spreading),
Gradient Boosting Decision Tree(GBDT),
聚类算法,神经网络算法,决策树,随机森林,异常值检测等常用算法需要掌握。
特征工程的基础知识:根据相应的产品进行必要的特征构造,物品特征,交叉特征等。
其中LR使用广泛:由于LR是使用线性方法来处理非线性的问题,导致特征工程十分复杂,交叉项多(二维或者三维的交叉)。
工程上的最优化论文推荐:
Ad Click Prediction a View from the Trenches
需要了解的是相关论文的背景SGD算法,Truncated Gradient算法,RDA算法,FOBOS算法,FTRL算法等。
5. 统计学
时间序列模型,变量的相关系数,ROC和AUC,交叉验证,主成分分析。
6. 业务背景
大数据,推荐系统,计算广告学的科普书籍。
以上就是笔者在公司工作半年了的一些简单的总结,如果有啥不正确的地方,还希望大家赐教。
…………………………………………………
欢迎大家关注我的公众账号
(长按图片,识别二维码即可添加关注)
数据分析没那么玄乎。业内有人招人的时候一定要别人背出置信度的计算公式才觉得这个人是个合格的分析师,但是我觉得踏踏实实的工作态度胜过一切。
楼主不是爱数据分析想要转行么,那么就转行吧,没那么困难,转行以后有个谦虚的学习态度和认真的办事态度就成功了一半。
我记得当年入行,痴迷于数据,我会从公司数据库中调出各种数据,以我所知所学的各种方法在闲暇时间试着做出各种分析,得出结论,然后对比分析结果和自己的常识以及业界他人的结论,这大概是我用过的最快的方法,也是外人眼中最枯燥最耗时间的方法了。
所以楼主,人生短短几十年,如果你热爱数据分析,你去做就数据分析好了,管他人说什么呢。
最基本的要求:对数字敏感,会Excel,能写SQL,熟练使用PPT将研究的内容思路清晰的展示出来。
反正不要去学什么坑人的CDA数据分析师就成,坑人的培训,但可以通过其他渠道体系化学习。看清真面目哈人大的CDA数据分析师培训以及考试怎么样? – 大数据
统计学是基础
有几门课或者书是一定要看的:回归,时间序列,罗辑回归等。用r的话可以网上学习一些machine learning的东西,用r自带的package几行就搞定,主要是要了解原理和应用范围。