4.3.2 数据分组

对于有键的数据,一个常见的用例是将数据根据键进行分组。

groupByKey()

如果数据已经以预期的方式提取了键, groupByKey() 就会使用 RDD 中的键来对数据进行分组。
对于一个由类型 K 的键和类型 V 的值组成的 RDD,所得到的结果 RDD 类型会是 [K, Iterable[V]] 。

groupBy()