hadoop中map方法读数据的问题?

理由

举报取消

看了两天hadoop，有个基础概念没明白，假设块大小是64M，我有128M的数据，按理说会启两个mapper，但是mapper默认是按行读数据，比如说64M有1000行，是每个mapper会循环执行map方法1000次？最后每个mapper汇总这1000次的结果交给reducer? 我在程序里设置了 NLineInputFormat.setNumLinesPerSplit(job, 5); map方法里打印一个tag，测试数据有10行，结果打印了10次tag

2017年10月16日 1 条回复 1476 次浏览

Hadoop,Java,分布式,推荐,数据,电商,计算

找回密码

hadoop中map方法读数据的问题?

发起人：陈群 初入职场

回复 ( 1 )

我来回答

帐户注册

登录

找回密码

hadoop中map方法读数据的问题?

发起人：陈群 初入职场

回复 ( 1 )

我来回答

发起人：陈群初入职场