spark RDD算子中Key-Value型Transformation算子的示例分析
Spark RDD的Key-Value型Transformation算子主要有两类:一类是对Key做操作的算子,另一类是对Value做操作的算子。
对Key做操作的算子主要有两个:keyBy和groupByKey。
keyBy算子:将RDD中的元素转换为(key,value)对,其中key是由指定的函数计算得到的。
groupByKey算子:对(key,value)对的RDD按照key分组。
对Value做操作的算子主要有两个:mapValues和flatMapValues。
mapValues算子:对(key,value)对的RDD中的value应用一个函数,返回一个(key,value)对的RDD。
flatMapValues算子:对(key,value)对的RDD中的value应用一个函数,返回一个(key,value)对的RDD,与mapValues算子的区别是,flatMapValues算子可以将value映射成一个序列,然后将这些(key,value)对平铺开。
相关文章