HBase和Spark

Apache Spark是一个在内存中处理数据的分布工软件框架,在很多情况下可以用来替代MapReduce。

Spark本身超出本文档的范围,需要关于Spark项目及其子项目更详细的信息,请参考Spark网站。本文档将描述Spark和HBase的4个主要的交互点。这些交互点是:

Basic Spark

Spark Streaming

Spark Bulk Load

SparkSQL/DataFrames

results matching ""

    No results matching ""