SparkFastDataAnalysis
《Spark 快速大数据分析》学习笔记
View on GitHub
4.3 Pair RDD的转化操作
Pair RDD 可以使用所有标准 RDD 上的可用的转化操作。
聚合操作
数据分组
连接
数据排序
常见Pair RDD转化操作
Scala
Java
Python
只访问 pair RDD 的值部分
Spark 提供了 mapValues(func) 函数,功能类似于 map{case (x, y): (x,func(y))} 。