在最简单的格式中,对于所有的操作,会使用默认的数据源(parquet,除非通过spark.sql.sources.default配置)
parquet
spark.sql.sources.default
val df = sqlContext.read.load("examples/src/main/resources/users.parquet") df.select("name", "favorite_color").write.save("namesAndFavColors.parquet")