4.2 创建Pair RDD

在 Spark 中有很多种创建 pair RDD 的方式:

Java

JavaPairRDD<Integer,Integer> rdd = sc.parallelizePairs(Arrays.asList(new Tuple2(1,2),new Tuple2(3,4),new Tuple2(3,6)));

Python

pairs = sc.parallelize( {(1, 2), (3, 4), (3, 6)})

Scala

val pairs = sc.parallelize(List(Tuple2(1,2),Tuple2(3,4),Tuple2(3,6)))