Android   发布时间:2022-04-28  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了android – Tesseract的自定义词典大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我目前正在使用tesseract OCR为 Android开发项目.我希望通过添加字典来微调给用户的结果.根据 http://code.google.com/p/tesseract-ocr/wiki/FAQ,最好的办法是

但是在tessdata文件夹中没有eng.user-words文件,我假设如果我只是用一个文本文件与我的字典,它永远不会被使用..

有谁有类似的经验,知道该怎么办?任何建议将是一个很大的帮助.

解决方法

如果你使用tesseract 3(我假设你是).
你必须重建你的eng.Trainddata文件
我打算用完全替换word-dawg文件来尝试获得更好的结果(即 – 我检测的字总是相同的).

当您编译tesseract时,您将需要在训练目录中的combine_tessdata和wordlist2dawg可执行文件.

>打开所有东西(我做了这个只是为了备份我的eng.word-dawg,你还需要unicharset)

./combine_tessdata -u eng.Traineddata
>创建一个wordlist文本文件(wordlistfilE)
>创建一个eng.word-dawg

./wordlist2dawg wordlistfile eng.word-dawg TraineddaT_Backup / .unicharset
>替换word-dawg文件

./combine_tessdata -o eng.Traineddata eng.word-dawg

应该是

大佬总结

以上是大佬教程为你收集整理的android – Tesseract的自定义词典全部内容,希望文章能够帮你解决android – Tesseract的自定义词典所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。