发起人:None 管理专家

爱尔兰海归狗,Catholicism,数据分析控…

回复 ( 5 )

  1. Rorschach
    理由
    举报 取消

    scala有前景,但是会限定在特定应用场景。原因主要是在人员上。讲个twitter的故事吧:

    当初twitter有个很庞大的data scientist团队,里面编程水平什么样的都有。大家都写写pig或者sql的时候还相安无事⋯⋯后来他们就改了scala。这个决定迅速造成了分裂,一大群没有能力或者没有意愿学们新编程语言的data scientist生产力急剧下降,不得不依赖工程师们adhoc产生大量数据,可是谁爱给你干这个呀,于是很快大批离职了。

    目前懂machine learning,有analytical mindset,还能hack的数据科学家太少。我司还算是稍微有点热度的初创公司了,hr收简历收到手软但是找个人仍然千难万难。组里有几个小伙天天安利scala,有个什么架构问题就嚷嚷着换语言⋯⋯然并卵。本来大伙就非要忙死了还要迁徙平台还要试错谁受得了啊,所以嚷嚷归嚷嚷最后还是继续对着jupyter码python上pandas撸sklearn。

  2. 李冰
    理由
    举报 取消

    同意楼上的,spark都有Python接口,所以他们没有必要去花时间学scala。说实话,我见过的研究data mining的人编程水平都一般,甚至有点低。毕竟这个行业理论研究比较多,花时间去练编程不如花时间去研究数学。

  3. Reid Chan
    理由
    举报 取消

    目前看来还是python在data science玩得溜

    这样判断的来源是 各种data science书籍好多都是用python作为开发语言

    scala感觉门槛可能高了点 不好判断前景

  4. Semon
    理由
    举报 取消

    scala语言是单独比较适合spark框架,语言本身复杂属函数式动态语言语言其他场景适用性低,但机器学习方向上python更好,apache也推出R版本也支持spark框架MLLIB除spark中graphx部分(graphx只支持scala目前)。个人建议不涉及图论用python比较合适

  5. 磨豆君
    理由
    举报 取消

    在apache spark上用Scala是不错的选择

我来回答

Captcha 点击图片更换验证码