大佬教程收集整理的这篇文章主要介绍了如何并行运行 Spark.read 方法,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我想使用 spark.read 从不同来源加载数据,但希望并行运行 spark.read 以便可以一次加载所有数据。在给定的火花会话中是否可能?
例如,如果您正在读取文件,您可以拥有多个文件,以便可以并行读取,或者您必须拥有可拆分的文件类型,例如 Parquet。
TLDR:如果您想并行化,则取决于您的数据源
以上是大佬教程为你收集整理的如何并行运行 Spark.read 方法全部内容,希望文章能够帮你解决如何并行运行 Spark.read 方法所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。