Re: 有人用百度ocr文字识别吗？

水木社区手机版

主题:Re: 有人用百度ocr文字识别吗？
2楼|a0123456789q|2021-11-18 14:51:57|展开
C# 可以用tesseract，准确率还行。

【在 zhtoad 的大作中提到: 】
:
: 我用百度免费的。发现识别不准，数字和英文大小写混搭。百度ocr居然丢了数字。大小写也能错了。
: 感觉不是技术问题吧。
: ...................
--
FROM 183.95.135.*
4楼|a0123456789q|2021-11-19 22:06:58|展开
你读文档没？

你要用nuget添加Tesseract。

然后，
你要把 chi_sim.traineddata 放在 tessdata目录下

然后，

using (var engine = new TesseractEngine(@"./tessdata",
                    "chi_sim"
                    , EngineMode.Default))
                {
                    using (var img = Pix.LoadFromFile(testImagePath))
                    {

                        using (var page = engine.Process(img))
                        {
                            var text = page.GetText();


                            return text;// text;

                        }

                    }
                }

【在 zhtoad 的大作中提到: 】
: 非常感谢你。
: 我试了一下，没有成功。
: 我在debug目录下放了dll：
: ...................
--
修改:a0123456789q FROM 183.95.135.*
FROM 183.95.135.*
5楼|a0123456789q|2021-11-19 22:07:45|展开
另外，你这个问题适合放在.net版，不适合本版。

【在 a0123456789q 的大作中提到: 】
: 你读文档没？怎么还有leptonica-1.80.0.dll这个啥？
: 你要添加对Tesseract.dll的引用。
: 然后，
: ...................
--
FROM 183.95.135.*
9楼|a0123456789q|2022-01-26 00:48:37|展开
本地执行。

是有点慢。

注意不要多次初始化引擎。而是要初始化一次，多次使用。

【在 KEILLY 的大作中提到: 】
: 请教： Tesseract识字的速度如何？
: —— 我尝试过，但速度很慢
: ——可能是我打开的方式不对
: ...................
--
FROM 183.95.135.*