SparkFastDataAnalysis
《Spark 快速大数据分析》学习笔记
View on GitHub
4.3.4 数据排序
当把数据排好序后,后续对数据进行 collect() 或 save() 等操作都会得到有序的数据。
sortByKey() 函数接收一个叫作 ascending 的参数,表示我们是否想要让结果按升序排序(默认值为 true )。
也可能想按完全不同的排序依据进行排序。
要支持这种情况,我们可以提供自定义的比较函数。
代码
Python
Scala
Java