PHP   发布时间:2022-04-04  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了php-如何确定是否扫描了.pdf文件的内容大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

因此,我有一个.pdf文件,我需要能够确定它是否是通过扫描为PDF而创建的.我正在尝试确定它是否是pdf文件,我可以将其显示为文本.

我有PHP& Zend可供我使用.
我想我可能可以使用Zend的

$pdf->properties['Producer']

但我不确定100%.

有什么办法可以确保我正在处理哪种.pdf文件

@L_801_8@:

对我来说听起来很难.周围有成千上万个不同的“生产者” ID,其中许多都支持从任何类型的源(无论是通过扫描,来自传真,文字处理机还是其他方式)生成PDF.创建PDF文件方法有很多,您将永远无法追溯到哪里.

如果要确定是否可以将其显示为文本,为什么不尝试从中@L_262_15@一些实际的文本呢?如果已扫描(或任何其他类型的嵌入式图像),则该文本应该没有或只有很少的文本内容.但是,随后有OCR程序创建了扫描的PDF,并且该文件还带有机器可读的文本.您想如何处理?

您的最终目标是什么?

大佬总结

以上是大佬教程为你收集整理的php-如何确定是否扫描了.pdf文件的内容全部内容,希望文章能够帮你解决php-如何确定是否扫描了.pdf文件的内容所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: