3.4 向Spark传递函数

Spark 的大部分转化操作和一部分行动操作,都需要依赖用户传递的函数来计算。
在我们支持的三种主要语言中,向 Spark 传递函数的方式略有区别。

3.4.1 Python

传递函数时需要小心的一点是,Python 会在你不经意间把函数所在的对象也序列化传出去。

3.4.2 Scala

如果在 Scala 中出现了 NotSerializableException ,通常问题就在于我们传递了一个不可序列化的类中的函数或字段。
记住,传递局部可序列化变量或顶级对象中的函数始终是安全的。