spark RDD算子中Key-Value型Transformation算子的示例分析

2023-04-07 22:36:00 rdd 算子 Spark

Spark RDD的Key-Value型Transformation算子主要有两类:一类是对Key做操作的算子,另一类是对Value做操作的算子。

对Key做操作的算子主要有两个:keyBy和groupByKey。

keyBy算子:将RDD中的元素转换为(key,value)对,其中key是由指定的函数计算得到的。

groupByKey算子:对(key,value)对的RDD按照key分组。

对Value做操作的算子主要有两个:mapValues和flatMapValues。

mapValues算子:对(key,value)对的RDD中的value应用一个函数,返回一个(key,value)对的RDD。

flatMapValues算子:对(key,value)对的RDD中的value应用一个函数,返回一个(key,value)对的RDD,与mapValues算子的区别是,flatMapValues算子可以将value映射成一个序列,然后将这些(key,value)对平铺开。

相关文章