HBase和Spark
Apache Spark是一个在内存中处理数据的分布工软件框架,在很多情况下可以用来替代MapReduce。
Spark本身超出本文档的范围,需要关于Spark项目及其子项目更详细的信息,请参考Spark网站。本文档将描述Spark和HBase的4个主要的交互点。这些交互点是:
Basic Spark
Spark Streaming
Spark Bulk Load
SparkSQL/DataFrames
Apache Spark是一个在内存中处理数据的分布工软件框架,在很多情况下可以用来替代MapReduce。
Spark本身超出本文档的范围,需要关于Spark项目及其子项目更详细的信息,请参考Spark网站。本文档将描述Spark和HBase的4个主要的交互点。这些交互点是:
Basic Spark
Spark Streaming
Spark Bulk Load
SparkSQL/DataFrames