- 主题:Re: 有人用百度ocr文字识别吗?
C# 可以用tesseract,准确率还行。
【 在 zhtoad 的大作中提到: 】
:
: 我用百度免费的。发现识别不准,数字和英文大小写混搭。百度ocr居然丢了数字。大小写也能错了。
: 感觉不是技术问题吧。
: ...................
--
FROM 183.95.135.*
你读文档没?
你要用nuget添加Tesseract。
然后,
你要把 chi_sim.traineddata 放在 tessdata目录下
然后,
using (var engine = new TesseractEngine(@"./tessdata",
"chi_sim"
, EngineMode.Default))
{
using (var img = Pix.LoadFromFile(testImagePath))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
return text;// text;
}
}
}
【 在 zhtoad 的大作中提到: 】
: 非常感谢你。
: 我试了一下,没有成功。
: 我在debug目录下放了dll:
: ...................
--
修改:a0123456789q FROM 183.95.135.*
FROM 183.95.135.*
另外,你这个问题适合放在.net版,不适合本版。
【 在 a0123456789q 的大作中提到: 】
: 你读文档没?怎么还有leptonica-1.80.0.dll这个啥?
: 你要添加对Tesseract.dll的引用。
: 然后,
: ...................
--
FROM 183.95.135.*
本地执行。
是有点慢。
注意 不要多次初始化引擎。而是要初始化一次,多次使用。
【 在 KEILLY 的大作中提到: 】
: 请教: Tesseract识字的速度如何?
: —— 我尝试过,但速度很慢
: ——可能是我打开的方式不对
: ...................
--
FROM 183.95.135.*