- 主题:现在搞 OCR 有什么好方案?
让AI看
【 在 hgoldfish 的大作中提到: 】
: 有没有人对比搞 OCR 哪个方案的运行效率、识别率等等?
--
FROM 114.248.219.193
能啊,都是基操
比如我体检完了把体检报告截屏扔给随便哪个大模型(kimi、GPT、claude)
让他们给我讲讲这里有啥异常指标,应该注意啥,都能搞定
【 在 hgoldfish 的大作中提到: 】
: 关键是能离线么?
: 而且大语言模型是生成模式,做 OCR 也能做?
--
FROM 114.248.219.193
也试过挺牛逼的,比如拍某个泰国买的调料外包装(凹凸不平、反光)让GPT翻译到底有啥成分
反正LLM比预想的牛逼得多
【 在 foliver 的大作中提到: 】
: ocr核心是原始图像变换。你这正规打印字体加无干扰背景,当然很好处理。
: 你要是拿手机拍书的一页,书还是褶皱不平的,书也是老旧的。或者有其他干扰背景等
: --来自微水木3.5.10
: ...................
--
FROM 114.248.219.193