有哪些好的spark的学习资料?

理由
举报 取消

最近在学习用spark做数据处理(之前一直用的是hadoop实在太难用),但是实在是没有找到十分满意的学习资料。看了几章《fast data processing with spark》,可能是代码更新速度太快,书里面的代码到现在很多都不能用了,而且解释也太过简陋让人看得云里雾里,想问大牛们通过哪些渠道可以迅速系统地学习spark呢?

2017年11月5日 9 条回复 1202 次浏览

回复 ( 9 )

  1. 数据哥
    理由
    举报 取消

    Introduction to Big Data with Apache Spark

    这是edX上的一门入门课,需要有python基础,希望对你有帮助。

    如果你英语好的话,国外还是有一些不错的教程和课程的。有关注大数据欢迎加我们信微:idacker

  2. Reid Chan
    理由
    举报 取消

    learning spark 2nd edition

    你看得是1st的吧

    第二版应该比第一版只是更新了些代码内容 目录差别不大 我没看过一版

    迅速系统的…

    一个星期内把书吃遍 二个星期内不断回顾?这算迅速吗?

    看得云里雾里就看spark官网提供的资料

    或者去csdn搜搜关键字

  3. 翟士丹
    理由
    举报 取消

    首先,不推荐《大数据Spark 企业级实战》这本书,厚厚的一本,密密麻麻的代码截图,东拼西凑的内容,没有深度,浪费纸张。

    Spark项目很活跃,代码更新也比较快,看过一些Spark源码分析的书,如《Apache Spark源码剖析》,不过看来看去还是官方资料最好。

    建议先读一下Spark的文档:Overview – Spark 1.6.1 Documentation,这里面包含项目介绍,代码示例,配置,部署,调优等等,入门使用足够了。

    更进一步话,可以到这里找资料:Documentation,想了解Spark的一些核心设计原理可以看一下他们的论文资料。

    最最重要的是,要动手做做Spark的项目,深入学习就去研究下Spark的源码,Spark用到了上百个开源的库,代码质量也很高,读读它的源码,必有很多收获;关注社区的mail-list和GitHub的项目动态,此外还有stackoverflow的Newest ‘apache-spark’ Questions

  4. bigdataer
    理由
    举报 取消

    上官网,看文档,spark 的API文档写的还是很不错的,文档有例子,可以自己跟着做一做,然后想深入了解的话读源码。我一直觉得读源码是最好的学习一门语言或者一个系统的方法。

  5. 褚超
    理由
    举报 取消

    “Advanced Apache Spark- Sameer Farooqui
    (Databricks)” (
    )

    这是databricks的一个training, 放到youtube上的是一个三天的培训课程浓缩到1天的版本,信息量挺大的,但是内容非常好

  6. 匿名用户
    理由
    举报 取消

    documentation, source code, stackoverflow, google …

    表打我。。。我觉得这比书好用。。。

  7. Nice冲
    理由
    举报 取消

    国家图书馆

  8. 用户头像
    理由
    举报 取消

    最近也在学Spark,属于初学者,说一下我觉得好的学习资料

    1 博客 关于Spark有哪些大牛们的博客? 这个问题下的博客,感谢这些博主的分享!

    2 官方文档

    3 RDD的论文,如果读原文有困难,可以看中文翻译

    4 Spark中的example

    5 《Spark快速大数据分析》

    6 一个好的实验。自己想一个数据分析需求,动手做实验。实践从某方面来说是最好的学习方式。

    7 《大数据日知录-架构与算法》,搞清楚大数据相关概念。

    8 待补充

    ps:个人觉得Spark亚太研究院的学习资料不是很好

我来回答

Captcha 点击图片更换验证码