- 主题:现在 OCR 都用 tesseract-ocr 是吗?
你准备用opencv干什么?
【 在 hgoldfish 的大作中提到: 】
: 结合 opencv 和 tesseract 的准确率如何?
--
FROM 155.64.23.*
tesseract据我了解主要是在纯粹的OCR领域使用,需合理设定DPI才有最好的效果。
如果从图像和视频里面识别不特定的字出来,就比OCR更困难,需要上深度学习手段了
【 在 hgoldfish 的大作中提到: 】
: 哦。。图像与视频中的文字区域需要被识别出来。
:
--
FROM 27.91.71.*
你可以自己研究一下图像的各种分割算法,OCR虽然做的很漂亮了,但任意文字识别还是个未解决难题,不然也没有captcha了
【 在 hgoldfish 的大作中提到: 】
: 大神,深度学习 OCR 用什么?
:
--
FROM 27.91.71.*
百度又立功了。。。你好歹也得看看人家问的是什么再闹事
【 在 lvsoft 的大作中提到: 】
: fots
: 我记得这都是18年的论文,挺老的了,商汤搞的。
--
FROM 27.91.71.*
佩服你照着我说的关键字搜,然后用结果反驳我的乐观心态。以前跟你反复讲过,谈论深度学习之前要先搞清基本概念才能少闹笑话。
从任意视频里面切割出文字是个尚未完美解决的问题,这和OCR不一样。用tesseract识别本站截图,比你的阅读准确率要高不少的。
【 在 lvsoft 的大作中提到: 】
: paddle只是宣传的好而已,我找的这个fots现在都不是最好的。
: 不过前面两张图我是直接google image search里面找的案例,应该不是fots的结果。
:
--
FROM 27.91.71.*
你是这么定义你全站PA我的行为的?
【 在 lvsoft 的大作中提到: 】
: blablabla,只会扯谈的苍蝇又来啦
--
FROM 27.91.71.*
这类问题目前是没有通用方案的,识别车牌,captcha和文章用的算法完全不一样,商汤那个FOTS从摘要看就知道不能取代其他方案
有什么样的数据集就有什么样的SOTA,你还是得把自己想干的事情整理一下
【 在 hgoldfish 的大作中提到: 】
: 大神,,给几个关键字吧。。我想在这个方向点一两个技能点。
:
--
FROM 27.91.71.*
tesseract做传统意义上的OCR应该是到头了,但楼主想做的从一般图像和视频里识别文字区域是个非常大的坑,事实上等价于通用人工智能。
比如用任何现有e2e方案识别车牌都有大问题,非常容易就能做出来看起来是1234实际上是5678的牌子来,且肉眼都无法判别造假。
【 在 dormouseBHU 的大作中提到: 】
: tesseract 准确度挺好的。如果只是ocr,没必要引入opencv…
: 我一般是qt获取图像,tesseract 识别输出结果
--
FROM 27.91.71.*
识别纸币种类年份成色的?
这不就是最基本的分类
【 在 BubbleRider 的大作中提到: 】
: 有个微信小程序,PMG易拍,谁帮看下这个里面用的什么识别技术。
--
FROM 27.91.71.*
价钱什么的肯定是和后台已有数据匹配了
【 在 BubbleRider 的大作中提到: 】
: 识别品种、成色,纸币号码,还要生成最新市场价区间。
:
--
FROM 27.91.71.*