MapReduce - 12Reads管理问答

Spark中的narrow/wide dependency如何理解，有什么作用?

张楠 2018-02-15 1924 次浏览

我在RDD的论文中看到他们的定义是这样的”narrow dependencies, where eachpartition of the parent RDD is used by at most one partitionof the child RDD, wide dependencies, where multiplechild partitions may depend on it”我的理解是narrow就是独生子女，一个父亲只有一个孩子；wide是一个父亲多个孩子。但是我感觉这个定义与论文中区分这两种dependency的作用是矛盾的：“First, narrowdependencies allow for pipelin […]

查看全文

工作两年了，为了转行去做实习生是否合适？

Robot 2018-01-26 2032 次浏览

先说一下基本情况吧，我是名牌大学本科毕业，但是毕业之后并没有从事本专业的工作，而是做了系统运维工程师。虽然是在一家大公司，但是却在一个可有可无的部门，基本什么东西都没有学到，如今已经过去将近两年了。在职期间一直利用业余时间在学习大数据相关技术，对Hadoop，MapReduce和Hive都有了比较深入的了解，也仔细地阅读过部分源代码，对RPC框架，序列化机制等等都作了深入的探索。也写过很多MR算法和Hive UDFs。最近想从公司离职去追求自己的梦想–大数据相关工作，但是从简历反馈和面试情况来说都不太乐观，各家公司都对相关经验及其看重，让我有些迷茫了。我想问，有没有什么好的途径或者办法可以让我迅速积累相关经验？我想到的是 […]

查看全文

为什么spark支持多种语言编程，而mapreduce只支持java？

cola coco 2017-11-13 1372 次浏览

为什么spark支持多种语言编程，而mapreduce只支持java？spark对python、scala、java的支持都很好，而mapreduce只支持java，mapreduce用streaming和pipe也可以支持多种语言，但是相比java有很多限制。这是为什么呢？spark可以对多语言支持的这么好，后边的原理是什么？微软都提供了C#的支持（Microsoft/SparkCLR · GitHub）

查看全文

可以去哪儿找一些hadoop MR程序来练习？

香蕉你个巴辣 2017-10-22 1461 次浏览

本人最近在面试hadoop/hive开发相关的职位，由于没有写过实际的hadoop MR程序和hive开发，导致面试中碰壁较多。所以还想请教下大家，我可以去哪儿找一些题目/项目来练练手？或者大家有什么好的建议可以分享一下么？以下是个人情况：可以在集群上搭建hadoop环境，可以自主解决一些hadoop常见问题。(对hadoop和hive的基本原理是理解的)阅读和修改过hadoop的部分源码，写过wordcount和一些简单的MR程序。hive只是对基本操作熟悉一些。没有写过实际的hadoop MR程序，也没有hive实际开发经验欢迎大家不吝赐教。。

查看全文

GraphLab 和 MapReduce 的区别是什么？

肖浚 2017-10-08 1299 次浏览

GraphLab 的出现是对 MapReduce 算法的替代吗？

查看全文

QQ好友通过六层关系能够将多少人连成一张网，也就是连通图？

one no 2017-07-16 1420 次浏览

自己的QQ好友的好友的好友的好友的好友的好友（共六层）总过有多少人一般情况，不要说自己的QQ好友没有人

查看全文

Hadoop在什么情况下会在一个节点启动多个Map task或者Reduce task?

张楠 2017-07-16 940 次浏览

我知道每个datanode只会产生一个Mapper或者一个Reducer，这不是代表一个Map task或Reduce task吗？

查看全文

帐户注册

登录

找回密码

Spark中的narrow/wide dependency如何理解，有什么作用?

工作两年了，为了转行去做实习生是否合适？

为什么spark支持多种语言编程，而mapreduce只支持java？

可以去哪儿找一些hadoop MR程序来练习？

GraphLab 和 MapReduce 的区别是什么？

QQ好友通过六层关系能够将多少人连成一张网，也就是连通图？

Hadoop在什么情况下会在一个节点启动多个Map task或者Reduce task?