有哪些好的spark的学习资料? 举报 理由 举报 取消 最近在学习用spark做数据处理(之前一直用的是hadoop实在太难用),但是实在是没有找到十分满意的学习资料。看了几章《fast data processing with spark》,可能是代码更新速度太快,书里面的代码到现在很多都不能用了,而且解释也太过简陋让人看得云里雾里,想问大牛们通过哪些渠道可以迅速系统地学习spark呢? 2017年11月5日 9 条回复 1202 次浏览 Scala,Spark,数据
回复 ( 9 )
Introduction to Big Data with Apache Spark
这是edX上的一门入门课,需要有python基础,希望对你有帮助。
如果你英语好的话,国外还是有一些不错的教程和课程的。有关注大数据欢迎加我们信微:idacker
动物书
learning spark 2nd edition
你看得是1st的吧
第二版应该比第一版只是更新了些代码内容 目录差别不大 我没看过一版
迅速系统的…
一个星期内把书吃遍 二个星期内不断回顾?这算迅速吗?
看得云里雾里就看spark官网提供的资料
或者去csdn搜搜关键字
首先,不推荐《大数据Spark 企业级实战》这本书,厚厚的一本,密密麻麻的代码截图,东拼西凑的内容,没有深度,浪费纸张。
Spark项目很活跃,代码更新也比较快,看过一些Spark源码分析的书,如《Apache Spark源码剖析》,不过看来看去还是官方资料最好。
建议先读一下Spark的文档:Overview – Spark 1.6.1 Documentation,这里面包含项目介绍,代码示例,配置,部署,调优等等,入门使用足够了。
更进一步话,可以到这里找资料:Documentation,想了解Spark的一些核心设计原理可以看一下他们的论文资料。
最最重要的是,要动手做做Spark的项目,深入学习就去研究下Spark的源码,Spark用到了上百个开源的库,代码质量也很高,读读它的源码,必有很多收获;关注社区的mail-list和GitHub的项目动态,此外还有stackoverflow的Newest ‘apache-spark’ Questions。
上官网,看文档,spark 的API文档写的还是很不错的,文档有例子,可以自己跟着做一做,然后想深入了解的话读源码。我一直觉得读源码是最好的学习一门语言或者一个系统的方法。
“Advanced Apache Spark- Sameer Farooqui
(Databricks)” (
)
这是databricks的一个training, 放到youtube上的是一个三天的培训课程浓缩到1天的版本,信息量挺大的,但是内容非常好
documentation, source code, stackoverflow, google …
表打我。。。我觉得这比书好用。。。
国家图书馆
最近也在学Spark,属于初学者,说一下我觉得好的学习资料
1 博客 关于Spark有哪些大牛们的博客? 这个问题下的博客,感谢这些博主的分享!
2 官方文档
3 RDD的论文,如果读原文有困难,可以看中文翻译
4 Spark中的example
5 《Spark快速大数据分析》
6 一个好的实验。自己想一个数据分析需求,动手做实验。实践从某方面来说是最好的学习方式。
7 《大数据日知录-架构与算法》,搞清楚大数据相关概念。
8 待补充
ps:个人觉得Spark亚太研究院的学习资料不是很好