想学数据分析,但没有相关专业背景,从零开始难吗? 举报 理由 举报 取消 现大四即将毕业,学的是平面设计,最近时间看看多了大数据就喜欢上了,但没有统计,计算机专业知识。这能从零开始转业吗?希望知友们给点建议,谢谢! 2018年1月23日 2 条回复 1466 次浏览 可视化,数据,数据统计
回复 ( 2 )
还是很难的,隔行如隔山呀
作为时代发展而衍生的一个全新的领域,数据分析的高速发展让各行各业都感受到它的炙热的存在,同时也让企业在战略调整方面做出新的变革,获得更大的经济利益。而与此同时,人们在数据分析领域的知识匮乏也逐渐显现。这意味着在未来将有更多的人投入到这一领域之中,学习它使用它。
“数据分析难吗?”“我想要专攻互联网数据分析,要具备哪些知识呢?”“数据分析师发展如何?”等等这些个问题都是初学者踏入门槛所需要解答的疑惑。通常采用的办法就是到书店抱回来一落资料,然后随波逐流的选择一个培训班进行学习,但是数据分析你说它难它也不难,没有任何经验的人也可以学,但是你说它不难,你又必须和线性代数和统计学打交道。所谓工欲善其事必先利其器,想要系统的学习数据分析的首要任务必须选择一家适合你的培训机构,比如你想学习互联网数据分析的,小编建议你可以选择西线学院,上海唯一一家专门开设互联网数据分析课程的培训机构。或许我们不具备编程的学习背景,但只要你释放你的“洪荒之力”,成为数据分析师都是分分钟的事!
但是想要有个完美的结果,过程很重要,就算你找到好的学习资源,没有正确的打开方式一样白搭。所以我们不能光按照在学校的那套模式循规蹈矩的学习,海量阅读的方式不一定适合所有的人,所以数据分析小编建议大家不断的积累和尝试,清楚自己的需求,在学习的过程中获得新的技能!
如果你真的想要成为数据分析师,小编要告诫大家,不要因为大数据发展而盲目的随波逐流,你必须要热爱它你才能征服它,而不是通过学习线性代数货统计数据去
这就是为什么我不认为你的第一个目标应该是学习线性代数或统计数据。如果你想学数据科学,你的第一个目标应该是学会爱数据。如果你感兴趣,我将带你一起了解如何真正学到科学数据的方法。
关键一:热爱数据
数据科学是一个难以界定的领域,它很广泛甚至有些模糊,所以难以掌握。很多转行转型的数据分析入门小白可能学到一半开始自我怀疑,这很正常,我们总是一味地投入到学习新的技术中,却常常忽略自己的学习动机,没有动力、没有得到正确的指导。所以当下我们应该寻得一些能够刺激学习的新鲜事物,打开你的脑洞,让枯燥的公式看起来也能浮想联翩。
学习需要桥梁,搭建一个能够让线性代数、统计分析学等专业课程与学习神经联系到一起的桥梁,那些“接下来我该学什么”的问题也会迎刃而解。所以说数据科学的伟大之处在于你可以和成千上万有趣的事物一起工作:它可以找出你所在城市中新鲜有趣的东西;在地图上标出互联网上所有的设备;以年的频率更新世界各地的难民位置…这一切的一切,都是在发现问题,然后努力去找到解决问题的答案。
关键二:通过实际操作来学习数据科学
学习神经网络、图像识别和其他尖端的技术是很重要的,但遗憾的是大多数的数据科学并不是直接教授你这些的:
l 90%的时间都是在做数据清理l 懂得一些算法比一无所知要好很多
l 如果你了解线性回归、K-means聚类和逻辑回归,能够解释和翻译它们的结果,并且能够从头到尾的完成整个步骤,你将比那些了解单个算法但不会使用的人,更受用人单位的青睐。
这些都在告诉我们,最好的学习办法就是进入项目组去一同工作。通过项目组的合作,你可以快速获得一些实用性和用处很大的技能。当然,你也能够通过这种途径找到自己的投资拍档。
项目的开始,你需要找到一个不错的数据集,然后回答一个你感兴趣的问题,开始不断重复清洗。以下是一些寻找数据集的好去处:
l 100+ Interesting Data Sets for Statisticsl Datasets subreddit
l UCI machine learning repository
另一种方法是找到一个深层问题。比如预测股票市场,其实可以拆分成很多小的步骤。我第一次连接到雅虎财经API的时候,我获取到了每日的价格数据;然后我创建了一系列的指标,比如过去一段时间里的平均价格,然后运用它去预测未来的趋势。这里并没有用到真正的算法,仅仅是技术上的分析。后来我发现这样的办法并不奏效,于是我开始学习统计学,掌握线性回归的办法。我之后又连接到另一个API,抓取到了每一分钟的数据,并把它们保存到一个SQL数据库,如此反复,直到我的算法越来越完美。
这样做的好处是为我之后的学习找到了方向。我不仅学习了SQL语法,我还运用它储存了关于价格的数据。这恰恰说明只学习而不操作,最终只能是徒劳无功的,并且对于你今后从事数据科学的工作起不到半点作用。
3、 学会和别人沟通你的见解
数据科学家需要不断地向别人传达他们的技能和研究结果,这一点,恰恰也是一个合格的数据科学家和一个伟大的数据科学家之间的区别。虽然沟通的理念有时候很复杂,但这里有一些你可以尝试做的事情:
开通一个博客,发表你的数据分析成果
多向你的朋友和家人练习讲授数据科学的理念,你会惊奇地发现,自己在这个过程中对数据科学的领悟会不断加深
学会在聚会上演讲
使用github来掌控所有的分析
多浏览一些诸如Quora和DataTau的社区
4、 向你的同行学习
你会惊奇地发现和别人团队合作能学到很多东西,在数据科学领域,团队合作甚至在岗位设置上非常重要,这里我有一些想法:
利用聚会寻找能够一起合作的人
为开源软件包做贡献
给那些常常写相关博客的人发消息以寻求合作
积极参加数据科学竞赛,你可以从中结识到很多朋友
5、 不断给自己增加新的困难和挑战
你是否对你从事的项目已经轻车熟路?你是否已经很久没有尝试一个新的理念了?那么,你需要一些更高一等级的困难来磨练自己了。数据科学是一座需要一步一步攀登的高山,如果你安于现状,你将很快被淘汰。如果你觉得自己已经太安逸于所学,这里有一些建议给你:
尝试处理更大的数据集
看看是否可以使你的算法更快
如何将算法扩展到多个处理器?你能做到吗?
尝试理解你使用做多的算法,看看它们是否改变了你的假设?
尝试教一些新手你正在做的事情
学习任何新知识都需要正确的方法,数据科学也是如此。当你想要达到一个很远的地方时,你的手里首先需要一个合适的指导方针。任何人都可以学习数据科学,只要你能保持一个正确的心态。
可以到我的主页看看我的文章,希望可以帮到你。有书籍推荐、学习方法……