程序问答   发布时间:2022-06-01  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了自动化 pdfminer.six LAParams 配置大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决自动化 pdfminer.six LAParams 配置?

开发过程中遇到自动化 pdfminer.six LAParams 配置的问题如何解决?下面主要结合日常开发的经验,给出你关于自动化 pdfminer.six LAParams 配置的解决方法建议,希望对你解决自动化 pdfminer.six LAParams 配置有所启发或帮助;

我们正在构建一个应用程序,我们需要从许多 pdf 电子书中提取数据。它们有不同的格式、字体大小、行距等...

我们目前正在为每个 pdf 配置 pdfminer.layout.LAParams,但这是不可行的。

LAParams(line_overlap=0.5,char_margin=2.0,line_margin=0.3,word_margin=0.1,Boxes_flow=0.5,detect_vertical=false,all_texts=falsE)  

最大的问题是,对于某些书籍,无法识别段落,因此我们最终只有一行段落。

是否有任何已知的方法可以为每个 pdf 自动配置?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

大佬总结

以上是大佬教程为你收集整理的自动化 pdfminer.six LAParams 配置全部内容,希望文章能够帮你解决自动化 pdfminer.six LAParams 配置所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。