Summary 快速上手 独立应用程序 编程指南 初始化 Spark 并行集合RDD 操作 使用键值对Actions 共享变量 Spark Streaming 关联离散流DStream中的转换缓存或持久化部署应用程序 性能调优 设置正确的批容量 容错语义 开始 RDDsHive表 其它SQL接口Spark SQL数据类型 开始图操作符图构造者图算法 部署 在yarn上运行Spark RDD 持久化