比较了几个软件的OCR功能。使用的是一个很干净的屏幕截图的图像,都是印刷体。
结果见下面图。
我的一个需求是识别中英文混排的文本,产生可搜索的图像,可拷贝文本。
在这方面,做的最好的是福昕。虽然识别中有少量错误,但是至少是可用的。
其他两家Acrobat和OneNote,要么识别出的单词带空格,例如ac t or,这种我搜索actor就搜不到。
要么单词间没有空格,拷贝出去后需要大量编辑工作。
要么不能同时达到中英文都很好的识别效果。
如果不考虑可搜索图像功能的话,那么微信做的非常好。
在免费的情况下,识别结果准确率非常高。
而且它是在传图片的同时,默默的就把ocr给做了。
当然,如果想处理大量图片的话,可能还是白描更方便一些。
--
FROM 202.98.13.*