大佬教程收集整理的这篇文章主要介绍了来自 S3 的 PySpark read.json -- 自动将名称更改为不正确的文件名,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在尝试从 AWS S3 存储桶中读取 Json 文件。出于奇怪的原因,存储桶中文件的键包含 "/./" ,例如 "/./filename.Json"。 PySpark 的 read.Json 方法似乎会自动调整此文件名,以便删除“.”。
当我跑步时
df = spark.read.Json("s3a://bucketname/./filename.Json")
我收到错误消息:
pyspark.sql.utils.AnalysisException:u'Path 不存在: s3a://bucketname/filename.Json
我试图解决这个替换“。”使用“*”通配符或转义字符,但它没有帮助(尽管 read.Json 没有自动消除通配符星号 *)。有没有人知道如何检索这个文件?
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)
以上是大佬教程为你收集整理的来自 S3 的 PySpark read.json -- 自动将名称更改为不正确的文件名全部内容,希望文章能够帮你解决来自 S3 的 PySpark read.json -- 自动将名称更改为不正确的文件名所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。