大佬教程收集整理的这篇文章主要介绍了如何使用 Pandas.read_excel、openpyxl 读取 xlsx 文件(无需手动重新保存文件)?,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在使用 openpyxl 读取 excel 'xLSX' 文件。它适用于大多数文件,但对某些文件无效。
df = pd.read_excel('file.xLSX',ENGIne='openpyxl')
有问题的文件,我们称之为 file1
,无法正确读取,这是它返回的内容:
df = pd.read_excel(file1.xLSX,ENGIne='openpyxl')
# OUTPUT
# Empty DataFrame
# columns: [column 1] <- It does read the first column
# Index: []
当我用 excel 手动打开所述文件并简单地重新保存它(相同的名称,相同的所有内容)时,它可以工作:
df = pd.read_excel(resaved_file1.xLSX,ENGIne='openpyxl')
# OUTPUT
# column 1 ... column 70
# 0 12 ... hIDden
# 1 13 ... hIDden
# 2 15 ... hIDden
# 3 111 ... something
# 4 213 ... private_data
# [5 rows x 70 columns]
我遇到的问题是它应该是一个自动化过程,所以我将无法打开数千个文件并手动修改它们。
我不能使用过时的 xlrd=1.2.0,因为它不安全,尤其是对我而言。 xlrd 开发人员实际上是在大喊不要使用旧版本,因为它已被破坏。不知道的朋友们,xlrd=2.x.x 已经不支持 xLSX 文件了。
另外,很抱歉,我不允许向您展示实际数据,因为它非常敏感。
一种可能性:我们可以使用命令行来运行excel,打开所有文件并重新保存所有文件。我在这个过程中遇到的问题是我无法区分“损坏”的文件和好的文件,所以我必须将此过程应用于所有内容,从而减慢整个系统的速度。如果这是唯一的解决方案,我会将它作为最后的手段。
TL;DR Microsoft 使用其封闭源软件获得了很多乐趣,但使用起来并不安全。
版本:
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)
以上是大佬教程为你收集整理的如何使用 Pandas.read_excel、openpyxl 读取 xlsx 文件(无需手动重新保存文件)?全部内容,希望文章能够帮你解决如何使用 Pandas.read_excel、openpyxl 读取 xlsx 文件(无需手动重新保存文件)?所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。