使用并行流处理大规模数据集:MapCollect 模型
基本内容
小结
-
使用 Stream 框架提供的多个版本的 collect() 方法对流的元素进行转换和分组。
- collect() 方法需要一个收集器来处理流的数据并且生成一个数据结构,该数据结构则由形成该流的一个聚合操作集返回。
- 一个收集器可以处理三种不同的数据结构,包括输入元素的数据结构、处理输入元素时使用的中间数据结构,以及返回的最终数据结构。
使用 Stream 框架提供的多个版本的 collect() 方法对流的元素进行转换和分组。