第 5 章 数据读取与保存
介绍数据读取与保存。
本章目录
- 动机
- 文件格式
2.1 文本文件
2.2 JSON
2.3 逗号分隔值与制表符分隔值
2.4 SequenceFile
2.5 对象文件
2.6 Hadoop 输入输出格式
2.7 文件压缩 - 文件系统
3.1 本地 /“常规”文件系统
3.2 Amazon S3
3.3 HDFS - Spark SQL 中的结构化数据
4.1 Apache Hive
4.2 JSON - 数据库
5.1 Java 数据库连接
5.2 Cassandra
5.3 HBase
5.4 Elasticsearch本章总结
- 将数据读取到 Spark 中,并将计算结果以你所希望的方式存储起来。