用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
爱尔兰海归狗,Catholicism,数据分析控…
scala有前景,但是会限定在特定应用场景。原因主要是在人员上。讲个twitter的故事吧:
当初twitter有个很庞大的data scientist团队,里面编程水平什么样的都有。大家都写写pig或者sql的时候还相安无事⋯⋯后来他们就改了scala。这个决定迅速造成了分裂,一大群没有能力或者没有意愿学们新编程语言的data scientist生产力急剧下降,不得不依赖工程师们adhoc产生大量数据,可是谁爱给你干这个呀,于是很快大批离职了。
目前懂machine learning,有analytical mindset,还能hack的数据科学家太少。我司还算是稍微有点热度的初创公司了,hr收简历收到手软但是找个人仍然千难万难。组里有几个小伙天天安利scala,有个什么架构问题就嚷嚷着换语言⋯⋯然并卵。本来大伙就非要忙死了还要迁徙平台还要试错谁受得了啊,所以嚷嚷归嚷嚷最后还是继续对着jupyter码python上pandas撸sklearn。
同意楼上的,spark都有Python接口,所以他们没有必要去花时间学scala。说实话,我见过的研究data mining的人编程水平都一般,甚至有点低。毕竟这个行业理论研究比较多,花时间去练编程不如花时间去研究数学。
目前看来还是python在data science玩得溜
这样判断的来源是 各种data science书籍好多都是用python作为开发语言
scala感觉门槛可能高了点 不好判断前景
scala语言是单独比较适合spark框架,语言本身复杂属函数式动态语言语言其他场景适用性低,但机器学习方向上python更好,apache也推出R版本也支持spark框架MLLIB除spark中graphx部分(graphx只支持scala目前)。个人建议不涉及图论用python比较合适
在apache spark上用Scala是不错的选择
昵称*
E-Mail*
回复内容*
回复 ( 5 )
scala有前景,但是会限定在特定应用场景。原因主要是在人员上。讲个twitter的故事吧:
当初twitter有个很庞大的data scientist团队,里面编程水平什么样的都有。大家都写写pig或者sql的时候还相安无事⋯⋯后来他们就改了scala。这个决定迅速造成了分裂,一大群没有能力或者没有意愿学们新编程语言的data scientist生产力急剧下降,不得不依赖工程师们adhoc产生大量数据,可是谁爱给你干这个呀,于是很快大批离职了。
目前懂machine learning,有analytical mindset,还能hack的数据科学家太少。我司还算是稍微有点热度的初创公司了,hr收简历收到手软但是找个人仍然千难万难。组里有几个小伙天天安利scala,有个什么架构问题就嚷嚷着换语言⋯⋯然并卵。本来大伙就非要忙死了还要迁徙平台还要试错谁受得了啊,所以嚷嚷归嚷嚷最后还是继续对着jupyter码python上pandas撸sklearn。
同意楼上的,spark都有Python接口,所以他们没有必要去花时间学scala。说实话,我见过的研究data mining的人编程水平都一般,甚至有点低。毕竟这个行业理论研究比较多,花时间去练编程不如花时间去研究数学。
目前看来还是python在data science玩得溜
这样判断的来源是 各种data science书籍好多都是用python作为开发语言
scala感觉门槛可能高了点 不好判断前景
scala语言是单独比较适合spark框架,语言本身复杂属函数式动态语言语言其他场景适用性低,但机器学习方向上python更好,apache也推出R版本也支持spark框架MLLIB除spark中graphx部分(graphx只支持scala目前)。个人建议不涉及图论用python比较合适
在apache spark上用Scala是不错的选择