零进程入门Spark keyBy操作(Java版)

市面上大多都是Scala的教程 , 这里专门介绍如何使用Java编写相关Spark程序 。
什么是JavaRDD keyBy操作keyBy操作其实就是把JavaRDD转换成键值对的JavaPairRDD , 键就是keyBy参数返回的值 , 值就是元素本身 。 keyBy参数就是生成键的函数 。
JavaRDD keyBy操作简单例子【零进程入门Spark keyBy操作(Java版)】如图把JavaRDD转成键值对的JavaPairRDD, 键就是元素字符串长度 , 值就是元素本身 。
零进程入门Spark keyBy操作(Java版)文章插图
总结keyBy操作就是把JavaRDD转换成为JavaPairRDD 。 keyBy的参数就是生成key的函数 。 keyBy跟groupBy函数的参数都是生成key的函数 , 这是他们的一样的地方 。 不同地方就是JavaPairRDD中的值 , 一个是原来的元素 , 一个是分组后的集合 。