已经实现了识别后输出word的功能。
输出的word和原图片排版差不多。
而某软件输出的word只是纯文本,并没有排版。
这个功能做起来很简单,
连我多年前买的高拍仪都有这功能。
【 在 wuduan 的大作中提到: 】
: 标 题: 自编了一个文字识别软件,准确率高到没朋友
: 发信站: 水木社区 (Thu Feb 27 14:07:08 2025), 站内
:
: 实际上不是自编的
: 我只是写了几条语句调用了百度的文字识别api。
: 百度的文字识别api真的很厉害!
: 我用一篇文档图片进行测试,
: 共1980个字符,只有一处英文句号那个点没被识别出来。
: 其余全部正确。
: 而且,识别结果是带位置信息的。
: 所以,可以不费劲的存储成和源文档布局差不多的word或者pdf。
:
: 而某个软件也是调用了百度的api,识别结果却差强人意,不知道那软件是咋编的。
: 同样用上面的文档图片测试,
: 有24个文字字符未被识别,另加8个标点字符未被识别。
: 有时候一个短语里,在不确定的位置抠出几个字符不识别,其余的识别。
: 注:这可是一篇印刷体文档截屏的图片。
:
: --
: CTerm有个黑名单功能,有些素质很差的人的帖子会自动跳过
: 宇宙浩渺,时空无限,人类算什么,不过都是蚂蚁、尘埃罢了
: 死亡是唯一一座永远亮着的灯塔,不管你向哪里航行,最终都得转向它指引的方向。一切都会逝去,只有死神永生。
: 你的青春会过去,永不再回来
: 万事は夢
: 唯一不可阻挡的是时间,它像一把利刃,无声地切开了坚硬和柔软的一切,恒定地向前推进着,没有任何东西能够使它的行进出现丝毫颠簸,它却改变着一切。
:
:
: ※ 来源:·水木社区 mysmth.net·[FROM: 202.98.17.*]
--
FROM 202.98.17.*