SparkFastDataAnalysis
《Spark 快速大数据分析》学习笔记
View on GitHub
4.1 动机
Spark 为包含键值对类型的 RDD 提供了一些专有的操作。这些 RDD 被称为 pairRDD。
Pair RDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口。