大数据方向实习生到底该做些什么? 举报 理由 举报 取消 最近逃离学校在某大数据公司实习,虽然我不认为大数据像现在很多人说的那么邪乎,但是我认为互联网时代所带来的大量数据是很有价值的。所以便在这个公司做实习生,已经一个多星期了,都是做一些简单的搜索,排序,去重的活。excel就完全搞定了。每天需要找的东西毫无技术含量,却挺耗费时间。不知道这是不是实习的融入期。大三就逃离学校,冒的风险也挺大的。我该学点什么,做点什么准备才能让未来走的更快。毕业目标,在北上广年薪10w+这个目标容易实现么,需要具备什么样的素质。甚是疑惑,求指点。 2017年8月18日 10 条回复 1569 次浏览 互联网,分析,数据,数据挖掘
回复 ( 10 )
Excel2013目前可以支持104万行数据,即使是这样也远远算不上大数据。
以下是华院数据整理的2015年大数据相关公司排名
话说回来,对于一个实习生来说,让你处理Excel不能说不合理,因为Excel处理是数据分析的基础中的基础,拉拉数据透视表,写写vlookup等函数甚至用vb写一些自动化,一旦熟悉了对于你的数据分析是大有卑益的!还别说,一般公司的数据分析师岗位或者说一些市场调研公司还就只是要求会Excel和PPT。
说到薪资,对于北上广来说10W+是应届毕业生的程序员职位的起薪,如果你仅会Excel,去一些靠谱的市场调研公司做数据分析,大一点的公司如尼尔森、华通明略这种可以拿到6K左右的薪资,6*13就是8W左右了,如果你想去BAT这种公司里边做数据分析,只会Excel是不够的,你还需要至少懂点SPSS或者R,当然如果能进去的话10W+是有的。
个人建议的话,最好不要为了钱而去学一样东西,这样内在驱动力不会大到让你走得比别人快,尽快确定一个感兴趣的方向,随着大数据概念的兴起以及企业的越加重视,数据相关的岗位细分越来越多,每一个细分都足够你好好钻研个10年+。
看到评论区有人问到是否会SPSS就可以进BAT做数据分析,答案是肯定的,并不是说进BAT一定要会撸代码,因为随着数据职位的细分,互联网公司需要一些有产品思维并且略有统计背景的人来做数据分析,以下贡献一张图。
说说市场调研,这种职位是最靠近业务的,他们的工作主要是调研外部数据,比如产品目标用户的情况,竞争对手的情况,整个行业的情况等,为产品的每一个改版提供数据支撑,对于互联网公司来说这种职位一般会放在UED(用户体验部)或者产品部下面,日常工作比如去各个城市开用户访谈会,用调研问卷的形式收集用户数据,打用户调研电话,设计访谈问卷等,岗位要求不会涉及到编程,一般的要求就是统计学基础知识,EXCEL跟PPT,SPSS懂一些更好,BAT及其他中小型互联网公司都有岗位招聘。对于这种类型的岗位,建议一开始可以去咨询公司,市场上有非常多好的咨询公司可以选择,比如全球最大的尼尔森、华通明略、易普索、盖洛普之类,互联网行业的有艾瑞、艾媒、易观之类,都是不错的选择。从职业发展道路来讲,市场调研除了是各个行业普适的职位之外(快速消费品行业对市场调研的需求量很大),在大公司纵向发展可以做到市场调研总监,横向发展可以去做品牌经理或者互联网公司产品策划类的产品经理。
数据分析师,各行各业都有做数据分析的岗位,但估计是最近1,2年在互联网公司才有数据分析师这个title的职位出现,之前一直是产品经理或者运营经理在做数据分析的活,之所以细分出来是因为随着数据量越来越大以及数据价值的凸显,做数据分析的门槛越来越高,举个栗子,做数据分析你需要取数据吧,取数据一般需要写SQL语句从数据库里取,你让一个产品经理或者运营经理去写SQL估计有些难度,当然技术出身的除外,另外说到分析,数据量大的话Excel总归不好分析,你得会点能处理大数据量的工具如SAS或者R,如果是SAS的EG模块还可以图形化操作,如果是R的话就是纯编程了,所以我认为数据分析岗位有30%在于技术,是因为在数据处理层面它需要涉及很多大数据量的操作。从业务端来看,数据分析师的价值在于能够为公司搭建数据流,通过数据来对产品功能进行反馈,支持日常的业务部门取数,以及为产品改版提供数据支撑,做到这些你需要跟进整个数据流从头到尾的流动过程,源头端比如产品开发时候的数据埋点,你需要跟产品经理及开发沟通哪个功能需要上报哪些数据,有数据上报了你需要跟进这些上报的数据要录入哪个数据库的哪张表,数据录入口径怎么定,数据存在数据库了你需要让这些数据产生价值,除了业务部门跑来跟你要数据之外,你需要主动地定一些分析课题,自己取数自己用工具进行分析,最后写成PPT呈现给业务部门并最终影响决策,如果业务部门的取数任务多了,你需要思考怎么去将这些重复性的取数工作形成报表,自动化地呈现数据,这时你需要去跟后端开发以及数据仓库的人沟通,并从头到尾跟进报表的实现。
另外有一种职位叫数据产品经理,它跟数据分析师的职责有重叠的部分,不同的地方是这个职位关注的点是数据分析的产品化。这是普通互联网公司数据产品经理的日常:
在大的互联网公司,产品经理有各种细分的,有偏向功能界面设计的产品经理,这类型的产品经理关注的是产品界面的美观吸引,他们要会用Axure画各种界面按钮,最好有绘画功底,他们跟数据相关的地方在于需要通过数据反馈来改进产品界面;有偏向功能实现的产品经理,这类型的产品经理关注的是产品功能实现是否满足用户预期,效率是否够高,实现步骤是否够短,他们要求最好有技术背景,能了解开发的各种实现逻辑,他们跟数据相关的地方在于需要通过数据反馈来提高功能实现的成功率,降低崩溃率以及提高实现速度;前面两者都是属于前端的产品经理,而后端的产品经理除了帮助各个部门搭建管理平台的产品经理外,剩下的就是数据产品经理了。
从以上可以看到,产品经理有各种细分,而数据产品经理也有他不一样的要求和关注点。
这是智联上某公司数据产品经理的职位描述:
职位描述:
1) 负责门户端、APP端数据统计产品开发及推荐算法迭代等相关工作,独立负责产品线的日常迭代工作,以数据为导向对运营结果负责。
2) 监管全部产品核心KPI数据,可对运营团队及时输出价值数据。
3) 负责产品上线后的数据管理和运营工作,对相关数据进行持续监控和分析,并定期对自身产品、整体行业、竞争对手等进行数据分析并评估,不断优化产品,完成产品生命周期管理。
4) 汇报项目核心数据指标和项目进度,对产品生命周期内各项指标负责。
5) 负责产品的持续运营,不断优化、改进、迭代,深度挖掘用户需求。
从以上描述可以看到该数据产品经理职位有三个关注点:一是数据统计后台;二是推荐系统;三是对产品数据的监控和分析。那么延伸出来该职位的要求应该是对数据要敏感,了解一定的数据挖掘算法,于是一个数学或统计学的学位会有所助益。
下图简单地从背景以及工作中打交道的人来区分数据产品经理和其他产品经理:
终于说到数据挖掘工程师了,在数据相关职位里,我认为数据挖掘和数据架构门槛最高,也是最能体现数据价值的职位。大部分公司在招聘数据挖掘工程师时的门槛都是数学、统计学或者计算机的硕士以上,为什么本科不行非要硕士?大部分企业认为,只有4年的本科学习不足以理解数据挖掘相关算法的推导以及应用场景,要做好数据挖掘,除了坚实的数学和统计学基础之外,算法的代码实现也是很重要的考察地方。数据挖掘何以门槛这么高,他对企业真有那么高的价值么?如果将其应用场景搬出来便知分晓。某音乐公司A成立多年,一直以界面小清新用户体验绝佳著称,可惜多年来对音乐版权的重视程度不够,导致用户因下载不了喜欢的歌曲而频频流失。后来公司痛定思痛,决定另辟蹊径于是重金聘请了一支数据挖掘工程师团队,打造了音乐界最好的推荐系统,一下子挽回了大量用户,现在用户占有率稳居行业前三。是的,推荐系统可以说是数据挖掘最重要的应用场景,最初来源于电商网站的浏览了该商品的用户还浏览了什么,购买了该商品的用户还购买了什么,现在发展到各种复杂的特征度提取并从各个维度来计算相关性。很多著名的数据挖掘算法,如朴素贝叶斯、神经网络、逻辑回归等,都需要扎实的统计学基础以及相关项目经验才能成熟地应用于业务实践。数据挖掘是随着大数据技术的发展而崛起的一门职业,过去由于技术的局限,很多时候只能通过抽样来选取训练数据,导致最后通过算法出来的预测概率只有60%左右,而大数据的成熟让工程师能够对接近全量的数据进行建模,导致最后出来的预测概率能达到80%甚至90%,从而更能体现数据挖掘的价值。从职业发展角度来说,BAT是最适合做数据挖掘的地方,巨量的数据,对技术的重视甚至崇拜以及成熟的应用场景让数据挖掘工程师如鱼得水。一个硕士毕业并有1,2年工作经验的数据挖掘工程师在互联网行业能轻易拿到25K往上的月薪。
最后,请关注我,我会好好维护你的时间线的 *\( ^ v ^ )/*
有一篇关于数据相关职位的学历剖析,可以参考看看
大数据岗位更看重学历还是工作经验?
关于数据相关职位的起源,可以看一下我另外一个问题下的答案
我说点实话吧。 真是看不下去了。
没有大数据方向。。 就像当年说我是电子商务方向的一样,我估摸着以后还得开一个互联网+方向,你说学点什么好呢?
数据分析行业一直就没变,统计数据需要的是新点子,观察数据靠的是眼界和远见。
那些张口就是各种分布式工具的,比如必须要提一波hadoop这种,根本就不是数据分析行业相关,他们是数据仓库工程师。
作为分析人员你要对公司的数据和业务负责。你的分析和数据会成为你公司下一个新业务的基石,也是你老板口中的谈资。
所以这个行业想要做好做精,需要有丰富的行业经验,和实践经验,并且这很重要。
至于钱,我就不多说了,新人千万别看钱。
有句话叫苦尽甘来。
干这行年薪10w+不难,具体能拿多少取决于你能产生多大价值。
实习阶段最重要的事情在于打开眼界,从学校到社会是一个很残酷的蜕变过程,实习让你有个缓冲,实际上是一个很难得的机会。你不用太过在意工作时你在做什么,任何一家有一定规模的公司都不会把太过重要的事情交给实习生做,即使这些事情你有能力可以做好。
你要做的是多看多问多交朋友,和前辈们去聊,结交一些行业朋友,向他们提出你现在这个问题以及种种工作上的疑问或者对这个社会、行业的疑问,相信一定会有人指导你。
睁眼看世界,这是你的首要任务,看到真实的世界之后就该低头做事,结合你所见所闻踏踏实实学习几个方向的先进技术,当你毕业的时候至少应当做到能独立完成工作。
如果你认为你所在的公司是一个血汗工厂,那也很不错,见识一下社会的凶险也很好,你年轻,你玩得起。
如果做事,无论多么简单无聊的工作,请务必兢兢业业做好做仔细,养成好的工作习惯和工作节奏,你在以后的工作中将会受用无穷…
人家就是让你打打下手,去观察下别人在做什么吧
有些答案,实在是没法看。
大数据就一定要大么?一个相对的概念而已!
数据的分析结论的应用价值才是最终目的,我见过某行业大牛分析师,工具只会用excel,没见过谁因为这个否认他的工作成果的。
———————————
这几个冷嘲热讽的答案不看也罢。楼主实习而已,什么公司也不会把实习作为一个关键岗位,所以也别期望你会真实现关键岗位的职能。
把你现在经历的作为学习的一部分,你能一天做好的东西,是否可以一个小时坐好。每天手动的流程,是否可以自动完成。
大数据只是一个概念,excel也就是一个工具。搞不懂为什么,就先做着吧
说难听点,只用excel做个屁大数据,一个200万行的数据集,你用excel 打都到不开。
什么算大数据?
我处理过2亿行的数据,6GB大小,只能算小数据,大数据的工具都用不到! 达到10TB级别才算稳稳的是个大数据。
数据挖掘根本不用EXCEL
不是不用EXCEL,数据挖掘顶多只用EXCEL看数据和制表制图。但是就是不搞大数据,搞普通数据,几百兆大小的,你数据清洗用Excel试试,建模用Excel试试,你做过决策树用Excel 试试。
拜托学好SAS,R其中一种,SQL必须学好。
这个问题题目太对我胃口了!大三升大四的暑假的时候实习内容与大数据有点相关,零基础没导师开始的,主要靠一起实习的学长的指点。现在回过去小结,希望对你有帮助。
关于知识块学习(建议直接网上搜索先学一遍有初步认识,之后有兴趣/机会可以再深入学):Hadoop、函数式编程,语言学python、spark-sql、Scala(这三个都是简单粗暴地过了几遍,写不出来的时候继续度娘谷歌),算法方面当时主要接触了聚类和随机森林。
关于大数据相关工作:1、excel下给指标取字段名(因为比较多,记一下防忘)、计算方法(防开始算的时候思路乱)、数据来源(有时候不能直接用源表,需要自己做中间表方便之后的计算)、字段分类;2、各种取数据合表方便之后计算(主要用了python、sql);3、计算(Scala、python、sql都可能用到);4、最坑爹的部分找出各种结果值不合理的字段一步一步倒着追溯哪一步出错,改了再顺一遍,改不出来的记excel;5、建模(部分和4夹杂着进行)。
对大数据接触不多,以上方法能走通,但不知道这个方法科学么,热烈欢迎大神批评指正ε-(´∀`; )
建议题主考虑这么几个问题:
1. 数据分析师,数据挖掘工程师,大数据平台工程师等有什么区别?
2. 你毕业后想从事怎样的岗位?
3. 对于你想从事的岗位,一般企业在招人时有怎样的要求?(学历,工具熟悉,比赛经历,实习经历等)
4. 自己目前在哪些方面还达不到要求的?
5. 从现在到校招,能做些怎样的提升?
1、VBA学好是一个大数据分析的实习生应该学会的基本。
2、Matlab SAS R这些统计软件相信大家都会用,但是我在实习的时候发现了一个脱节的地方,就是很多方法我会,但是要么原理搞不清楚,要么前提假设没弄懂,导致没发很精准的分析问题。
3、可视化软件才是核心竞争力。学会数据处理是第一步,把数据分析用可视化软件做出来才是牛逼。推荐Tableau等新兴可视化软件,有空多学学。
4、清洗处理数据前,多看报告,少走弯路。
看到楼主的问题,首先说声感谢,原因是作为大四的我 正在培训机构学大数据,无论好坏,我选择了他,也认为前景可以,但是困难是有的,无论技术上,性格上,思维上,我都感觉到力不从心,但我不会放弃。从Java,Linux,MySQL,Hadoop,spark….等等,需要自己学习去扩展的太多太多,基本很多都要了解。楼主所说的只是基础(虽然我并我经验可谈),但是大数据跟我以上所说的肯定是有很大联系,范围确实太广泛,只能逐步去学习。