第 5 章 数据读取与保存

介绍数据读取与保存。

本章目录

  1. 动机
  2. 文件格式
    2.1 文本文件
    2.2 JSON
    2.3 逗号分隔值与制表符分隔值
    2.4 SequenceFile
    2.5 对象文件
    2.6 Hadoop 输入输出格式
    2.7 文件压缩
  3. 文件系统
    3.1 本地 /“常规”文件系统
    3.2 Amazon S3
    3.3 HDFS
  4. Spark SQL 中的结构化数据
    4.1 Apache Hive
    4.2 JSON
  5. 数据库
    5.1 Java 数据库连接
    5.2 Cassandra
    5.3 HBase
    5.4 Elasticsearch

    本章总结

    • 将数据读取到 Spark 中,并将计算结果以你所希望的方式存储起来。