- 主题:现在 OCR 都用 tesseract-ocr 是吗?
识别一张纸币和其上面的数字不需要深度学习即可做到,用深度学习做是最简单的方案。
【 在 BubbleshibiRider 的大作中提到: 】
: 是的,后面应该有数据库支持
:
--
FROM 27.91.71.*
号码的特征还是很明显的,而且纸币也没有多少种类型
单纯的数字和图案识别,在深度学习或者机器学习成熟流行之前就已经做的比较漂亮了
深度学习是靠着从100万张网络图片里识别1000种事物,准确率超过受训博士生出道的,这么暴力的算法识别纸币是绰绰有余的
【 在 BubbleRider 的大作中提到: 】
: 不好做的
: 每种纸币的号码位置不一样,而且有很多干扰信息
: 照片拍的规格乱的话,直接用OCR定位的话,结果很差
: ...................
--
FROM 27.91.71.*
传统方法搞细分是很容易做到的,深度学习是解决了那些人类知道怎么判断却不知道判断依据的问题
不过现在用深度学习也是更容易实现就是了
【 在 BubbleRider 的大作中提到: 】
: 这一行玩的纸币,不是我们熟知的那些流通货币,大概2000种是有的
: 而且有些细分版本的区别,是非常细微的
:
--
FROM 27.91.71.*
你可以先识别控件本身啊
【 在 vale 的大作中提到: 】
: 是的,我用tesseract做gui自动测试,想识别窗口控件的文字,除非人为的框定区域还行,否则让它sparse得去找,效果很差。最终也就放弃了,直接比较预存的图片
--
FROM 27.91.71.*
AI自动测试肯定是个大项目,要是只为了测自家东西就不合适折腾了
这个东西我看现在技术是能搞定的,应该比扫描各国收据更简单点
【 在 vale 的大作中提到: 】
: 没那么容易。比如droplist拉下来,可长可短,有边没边,怎么框出搜索范围。不同控件风格还不一样。再比如字下面加个下划线。各种问题没法整。
: 我最后还是用图形比对,反正测试对象都是已知的,速度比ocr也快的多
: :
--
FROM 27.91.71.*