创建Datasets

Datasets与RDDs类似,然而,对于处理或在网络上传输,Datasets不是Java序列化或Kryo,他们使用一个指定的解码器(Encoder)来序列化对象。尽管在解码器与标准的序列化的职责都是将一个对象转换成字节,但解码器是运态产生的代码,且使用一个允许Spark来执行任意操作(如filtering,sorting,hashing),而不需要反序列化字节成一个对象的格式.

results matching ""

    No results matching ""