MR程序的组件combiner怎么使用
在MapReduce中,Reducer阶段的每个任务都会运行一个用户自定义的combiner程序来对输入的中间结果进行合并处理。Combiner的运行时机是在每个Reducer任务处理完Map阶段的输出结果之后,Reducer任务开始对其进行分组处理之前。
Combiner程序的用户自定义逻辑是和Reducer程序的用户自定义逻辑相同的,只不过Combiner程序运行在每个Reducer任务的本地环境中,而Reducer程序运行在集群的统一环境中。
Combiner程序的输入和输出类型必须和Reducer程序的输入输出类型相同。Combiner程序的输入是Mapper程序输出的中间结果,输出类型是Reducer程序的输入类型。
Combiner程序可以有效地减少网络传输量,从而提高程序的运行效率。
相关文章