现在搞 OCR 有什么好方案？

水木社区手机版

主题:现在搞 OCR 有什么好方案？
15楼|PaoloMaldini|2024-08-11 21:30:33|展开
让AI看

【在 hgoldfish 的大作中提到: 】
: 有没有人对比搞 OCR 哪个方案的运行效率、识别率等等？
--
FROM 114.248.219.193
20楼|PaoloMaldini|2024-08-12 15:21:27|展开
能啊，都是基操
比如我体检完了把体检报告截屏扔给随便哪个大模型（kimi、GPT、claude）
让他们给我讲讲这里有啥异常指标，应该注意啥，都能搞定

【在 hgoldfish 的大作中提到: 】
: 关键是能离线么？
: 而且大语言模型是生成模式，做 OCR 也能做？
--
FROM 114.248.219.193
25楼|PaoloMaldini|2024-08-12 21:27:36|展开
也试过挺牛逼的，比如拍某个泰国买的调料外包装(凹凸不平、反光)让GPT翻译到底有啥成分
反正LLM比预想的牛逼得多

【在 foliver 的大作中提到: 】
: ocr核心是原始图像变换。你这正规打印字体加无干扰背景，当然很好处理。
: 你要是拿手机拍书的一页，书还是褶皱不平的，书也是老旧的。或者有其他干扰背景等
: --来自微水木3.5.10
: ...................
--
FROM 114.248.219.193

BYR-Team©2010. KBS Dev-Team©2011 登录完整版