4.1 动机

Spark 为包含键值对类型的 RDD 提供了一些专有的操作。这些 RDD 被称为 pairRDD。
Pair RDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口。