现在 OCR 都用 tesseract-ocr 是吗？

水木社区手机版

主题:现在 OCR 都用 tesseract-ocr 是吗？
1楼|xiaoju|2021-04-21 15:23:48|展开
你准备用opencv干什么？

【在 hgoldfish 的大作中提到: 】
: 结合 opencv 和 tesseract 的准确率如何？
--
FROM 155.64.23.*
3楼|xiaoju|2021-04-21 16:20:22|展开
tesseract据我了解主要是在纯粹的OCR领域使用，需合理设定DPI才有最好的效果。

如果从图像和视频里面识别不特定的字出来，就比OCR更困难，需要上深度学习手段了

【在 hgoldfish 的大作中提到: 】
: 哦。。图像与视频中的文字区域需要被识别出来。
:
--
FROM 27.91.71.*
5楼|xiaoju|2021-04-21 16:57:34|展开
你可以自己研究一下图像的各种分割算法，OCR虽然做的很漂亮了，但任意文字识别还是个未解决难题，不然也没有captcha了

【在 hgoldfish 的大作中提到: 】
: 大神，深度学习 OCR 用什么？
:
--
FROM 27.91.71.*
11楼|xiaoju|2021-04-21 19:04:16|展开
百度又立功了。。。你好歹也得看看人家问的是什么再闹事

【在 lvsoft 的大作中提到: 】
: fots
: 我记得这都是18年的论文，挺老的了，商汤搞的。
--
FROM 27.91.71.*
13楼|xiaoju|2021-04-21 19:10:02|展开
佩服你照着我说的关键字搜，然后用结果反驳我的乐观心态。以前跟你反复讲过，谈论深度学习之前要先搞清基本概念才能少闹笑话。

从任意视频里面切割出文字是个尚未完美解决的问题，这和OCR不一样。用tesseract识别本站截图，比你的阅读准确率要高不少的。

【在 lvsoft 的大作中提到: 】
: paddle只是宣传的好而已，我找的这个fots现在都不是最好的。
: 不过前面两张图我是直接google image search里面找的案例，应该不是fots的结果。
:
--
FROM 27.91.71.*
14楼|xiaoju|2021-04-21 19:11:56|展开
你是这么定义你全站PA我的行为的？

【在 lvsoft 的大作中提到: 】
: blablabla，只会扯谈的苍蝇又来啦
--
FROM 27.91.71.*
15楼|xiaoju|2021-04-21 19:25:01|展开
这类问题目前是没有通用方案的，识别车牌，captcha和文章用的算法完全不一样，商汤那个FOTS从摘要看就知道不能取代其他方案

有什么样的数据集就有什么样的SOTA，你还是得把自己想干的事情整理一下

【在 hgoldfish 的大作中提到: 】
: 大神，，给几个关键字吧。。我想在这个方向点一两个技能点。
:
--
FROM 27.91.71.*
18楼|xiaoju|2021-04-21 20:28:46|展开
tesseract做传统意义上的OCR应该是到头了，但楼主想做的从一般图像和视频里识别文字区域是个非常大的坑，事实上等价于通用人工智能。

比如用任何现有e2e方案识别车牌都有大问题，非常容易就能做出来看起来是1234实际上是5678的牌子来，且肉眼都无法判别造假。

【在 dormouseBHU 的大作中提到: 】
: tesseract 准确度挺好的。如果只是ocr，没必要引入opencv…
: 我一般是qt获取图像，tesseract 识别输出结果
--
FROM 27.91.71.*
21楼|xiaoju|2021-04-25 16:24:47|展开
识别纸币种类年份成色的？

这不就是最基本的分类

【在 BubbleRider 的大作中提到: 】
: 有个微信小程序，PMG易拍，谁帮看下这个里面用的什么识别技术。
--
FROM 27.91.71.*
23楼|xiaoju|2021-04-25 16:48:35|展开
价钱什么的肯定是和后台已有数据匹配了

【在 BubbleRider 的大作中提到: 】
: 识别品种、成色，纸币号码，还要生成最新市场价区间。
:
--
FROM 27.91.71.*