Spark编程指南
介绍
概述
连接到Spark
初始化Spark
使用Shell
弹性分布式数据集
并行集合
外部集合
RDD操作
基础
传递函数到Spark
理解闭包
例子
本地模式与集群模式
打印RDD的元素
使用Key-Value鍵值对
转换
行动
混洗操作
背景
性能影响
RDD持久化
选择哪种存储级别?
移除数据
共享变量
广播变量
累加器
部署到集群
使用Java或Scala发布Spark作业
单元测试
从Spark 1.0迁移
何去何从
Powered by
GitBook
使用Java或Scala发布Spark作业
使用Java或Scala发布Spark作业
org.apache.spark.launcher
包提供了使用简单的Java API来发布Spark作业作为子进程的类。
results matching "
"
No results matching "
"