大佬教程收集整理的这篇文章主要介绍了php-如何确定是否扫描了.pdf文件的内容,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
因此,我有一个.pdf文件,我需要能够确定它是否是通过扫描为PDF而创建的.我正在尝试确定它是否是pdf文件,我可以将其显示为文本.
我有PHP& Zend可供我使用.
我想我可能可以使用Zend的
$pdf->properties['Producer']
但我不确定100%.
@L_801_8@:
对我来说听起来很难.周围有成千上万个不同的“生产者” ID,其中许多都支持从任何类型的源(无论是通过扫描,来自传真,文字处理机还是其他方式)生成PDF.创建PDF文件的方法有很多,您将永远无法追溯到哪里.
如果要确定是否可以将其显示为文本,为什么不尝试从中@L_262_15@一些实际的文本呢?如果已扫描(或任何其他类型的嵌入式图像),则该文本应该没有或只有很少的文本内容.但是,随后有OCR程序创建了扫描的PDF,并且该文件还带有机器可读的文本.您想如何处理?
您的最终目标是什么?
以上是大佬教程为你收集整理的php-如何确定是否扫描了.pdf文件的内容全部内容,希望文章能够帮你解决php-如何确定是否扫描了.pdf文件的内容所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。