做大数据必须掌握R或者pyhon吗? 举报 理由 举报 取消 感觉pyhon用的更多一些,R语言次之,还有各种各样新出来的语言,当然,我用的还是R,觉得和pyhon也是相通的。 2017年7月29日 4 条回复 1110 次浏览 数据
回复 ( 4 )
什么?数据科学家必须掌握的一种语言不是R也不是Python!
作为招聘人员,我们会评估候选人的技术、能力,我们看他们在kaggle上完成的项目情况,我们可以做一个严格的技术测试来确定他们的专业水平——这些都是可衡量的。他们要么有相关知识和技术,要么就没有。
然而一个好的数据科学家之间的区别通常不是他们的技术能力和数学水平。数据科学的存在是为了提供服务,如果他们不能轻松的和非专业的同事和老板沟通,就会大大减少数据科学的有效性,他们需要很容易与人沟通、理解。
他们必须理解他们的业务和问题,提供数据达到最好的解决方案。他们必须善于促进循环连续的对话——从业务到大数据团队然后回到业务,大数据科学家不仅能解决业务问题,还会选择提出对组织最有价值和正确的问题。
他们必须能够用简单和清晰的方法展示他们的研究成果,用商业语言而不是他们的专业术语。准确的数字和图标是一回事,从中提取出关键业务的结论是另一回事,他们必须解释和翻译。
最初许多中层候选人都会缺少这些能力,因为他们大多在公司中相对孤立,不会和高管们有很多互动。解决方案就是让他们更多的接触业务,同时要向所有部门中层级别以上的同时介绍大数据的价值。
这样组织才能充分利用大数据团队来帮助他们的业务发展,他们将作为一个团队一起成长,学会更有效的相互交谈,他们将学会对方的语言!
其实,大数据的核心是数据挖掘,对于有巨量数据的公司,根本不需要爬虫软件再去爬取网络数据。
一流公司创造数据,二流公司交换数据,初创公司爬取数据,pyhon这些软件用来爬取数据确实挺好用。
真那么想学,看过来。
掌握scala也可以。
做大数据,sql比r和python重要。聚类、回归这种东西,思路对了,用sql作计算工具都能做出来。