本科生如何规划并将自己培养成数据分析师? 举报 理由 举报 取消 某211工业工程(工学)本科生,准备考研。考哪个专业是和数据分析师对口的?管理科学与工程下设大数据下的商务管理方向,不知是否有关。愿前辈不吝赐教 2017年6月6日 4 条回复 1179 次浏览 分析,数据
回复 ( 4 )
谢邀!
自学成才的数据科学家告诉你 5个学习大数据的正确姿势!
关于全世界移动设备使用情况的地图
数据可以计算出关于你的城市很多新鲜有趣的事情,比如所有设备在互联网上的映射、找到真正的NBA球员的位置,今年又哪些地方有难民,或者是其他事情。数据科学的伟大之处是有无限有趣的东西可以发现——那就是问问题然后找到一个方法来得到答案。
二、在实践中学习
学习神经网络、图像识别和其他尖端技术是很重要的,但大多数数据科学工作不涉及这些:
90%的工作将是数据清理。
精通几个算法比知道一点许多算法要好。
如果你知道线性回归、k – means聚类和逻辑回归,可以解释和诠释他们的研究结果,并可以用这些完成一个项目,你将比如果你知道每一个演算法,但不使用它们更优秀。
大多数时候,当你使用一种算法,它将是库中的一个版本(你很少会自己编码支持向量机实现——这需要太长时间)。
所有这些意味着最好的学习方法是在项目工作中学习,通过项目,你可以获得有用的技能。
一种方法是在一个项目中先找到一个你喜欢的数据集,回答一个有趣的问题。
这里有一些好的地方
100+有趣的数据集的统计数据100+ Interesting Data Sets for Statistics
三、学会沟通
数据科学家需要不断展示他们的分析结果。这个过程可以区别数据科学家的水平。
交流的一部分是对主题的理解和理论, 另一个是理解如何组织你的结果。最后一部分是能够清楚地解释您的分析。
我很难找到关于有效沟通的概念,但有些事情你该尝试一下:
开始写博客。 展示你的数据分析的结果。
试着教那些对数据科学技术知识并没有什么概念的人,比如你的朋友和家人这可以可以帮助您理解概念。
试着在聚会上演讲。
使用github管理你所有的分析。
在一些社区中活跃,比如Quora , DataTau , machine learningsubreddit。
四、向同行学习
你根本想不到你会从同行身上学到多少东西,在数据工作中,团队合作非常重要。
在聚会中找一些同伴。
开源软件包。
给哪些写有趣的数据分析博客发消息看有没有合作的可能。
尝试参加Kaggle 比赛看看可不可以找到队友。
五、不断增加学习的难度
你完全熟悉这个项目的工作了? 你最后一次使用一个新概念是在一周前? 那么是时候做些更加困难的挑战了。如果你停止攀登,那么不进则退。
如果你发现自己太舒适,这里有一些建议:
处理更大的数据集。 学习使用spark。
看看你能不能让你的算法更快。
你将如何将算法扩展到多个处理器? 你能做到吗?
理解更多的理论算法并使用。这会改变你的假设吗?
试图教一个新手去做你现在正在做同样的事情。
上面这些这至少是一个思路告诉你在开始学习数据科学的时候到底要做什么。如果你完成了这些,你将发现你的能力自然而然就提升了。
我不喜欢那些“一个清单”这样的建议,因为这让我很难按部就班去做。我发现很多人在跟着书单或者mooc的课程学习中半途而废。我个人相信如果你有正确的目标任何人都可以学习数据科学。
我还是Dataquest的创始人。这是一个帮助你学习大数据的网站,其中包括了很多优秀的学习经验和讨论。你可以分析一些有趣的数据集,比如美国中央情报局的文件和球员统计。还可以完成一些项目,比如建立一个投资组合。如果你不知道如何分析,这也不是问题,我们会教你python。我们教Python因为它是最初级的友好语言,用于大量生产数据的科学工作,可用于各种各样的应用。
相关:一个考过研找过工作的统计学本科刚毕业的数据爱好者。
可能我回答的不是那么切题,我是真的很想读研也很努力的学了,考的首都经贸的统计学,无奈极其不擅长考试,只能老老实实寻求不考研的工作数据分析之路。
下面简单说说我的数据分析师追梦之路:
因为毕业于东北一个小城市的学校,虽然我经常泡网上,不过感觉视野严重欠缺,因此我开启了毕业旅行之路,几乎走了半个中国的繁华地区。西北中心-西安,西南中心-成都,中国地理中央-武汉,南部互联网中心-深圳,长三角新型互联网中心-杭州。不过我停在杭州了,要不就去北京了,我去的地方不仅仅这几个,周边也都去了,慢慢找工作加上了解城市,拓宽自己的视野,得出一些结论。
暂时来说,互联网公司的数据分析相关招聘是比较多的,对学历要求没那么高。在西安时候,没有发现有多少数据分析有关的工作,成都有不过相对少,创业公司比较多,大公司的分公司比较多,得益于国家的发展西南的资金环境,不过还是相对较少。
在深圳,我确实了解了很多,分析数据分析师现在太混乱了,没有明确的定义。举个几个栗子:
还有现在相关的名字:
我记忆也有点模糊了,列举这些就是表面现实这个行业的混乱,证书我就不列举的,更多的不行,也不知道考哪个好。在深圳真是涨知识了。
下面我就简单总结一下。
数据分析师的,确实是一个可以定义的很广泛的职业,从采集数据底层,到整理数据,清洗数据,分析数据,得出结论或建议,数据可视化呈现,每一步都需要很多知识和不同人的合作。暂时还没有形成体系,一个数据分析师基本上自己都要会一些,跨的学科之广,计算机 编程 算法、统计、数学、分析软件、还有你从事的相关行业的基础知识。比如医疗统计师就要懂医疗数据。
如果你想从事相关职业,把自己的方向定义好。数据分析前段的采集部分,主要学好数据库等计算机知识,再学统计的分析,你搞清源才能搞清分析的后面。如果有人给你数据摆好了,让你分析,这样也可以,主要学习统计软件,还有编程相关的一些东西。当然还有挖掘,就是数据量变成大数据的时候,计算机程序才是主要工作者,要学些编程,更重要的要学算法。
先说这些,我眼界差不多就这样吧,比较3个月前我还迷茫的再知乎上提问题。
要是觉得我说的不好不过还有点用处,我会再补充的,谢谢
题主方便求方式交流一下吗?跟题主相同境遇。
目前国内纯数据的硕士项目,我只知道清华有一个,然后复旦正在搞一个。其实如果想做的稍微高端一点,建议更多考虑应用数学或者计算科学或者计算机这类字样的硕士,可能会收获更大,以后工作后劲也更足。工业工程或者管理科学的硕士可能更多学运筹和制造一类的,电子商务这类方向容易学成文科,对你本科就是工业工程的背景估计提高不会太大。