理解闭包

当在一个集群上执行代码时,理解变量和方法的范围和生命周期,是Spark的一个难点。RDD操作在变量的范围之外修改了他们,这是一个频繁引起混乱的源。在以下的例子中,我们将看到代码使用foreach()来累加一个计数器,但是对于其他的操作,也会发生类似的问题。

results matching ""

    No results matching ""