大佬教程收集整理的这篇文章主要介绍了ruby – 模糊文件匹配/文本指纹识别的最佳库,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我想知道什么图书馆(能够与Ruby进行接口,理想情况下)将是做最好的“指纹识别”.我已经看到了Lucene的模糊匹配,但这似乎在一个单词级别上工作,而在这种情况下,我们可能希望提交一个更大的文档子集.做模糊比赛的原因是有些人可能会使用Word.doc预印本,有些人可能会有最终的PDF等.
我真的很欣赏这里的一些想法.搜索“感知哈希”让我进入一堆新的材料.我试图总结我的许多发现here.
看起来像SimHash,例如the C implementation将是走的路,但我仍然需要更多的实验.
以上是大佬教程为你收集整理的ruby – 模糊文件匹配/文本指纹识别的最佳库全部内容,希望文章能够帮你解决ruby – 模糊文件匹配/文本指纹识别的最佳库所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。