水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
溯源
|
返回
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
主题:Re: [转载]为什么从 PDF 里面解出文本很难
Bernstein
|
2021-11-18 12:57:30
|
只有pdf的情况呢?
提取信息还得找上游的可编辑格式,epub实际上只是个html的封装
屏幕显示、打印、人眼阅读,pdf的效果好很多
【 在 sosei 的大作中提到: 】
: PDF是不是应该只限定为生成纸张打印输出的文件
: 内容交流用EPub。方便提取按语义提取信息
:
--
修改:Bernstein FROM 125.33.245.*
FROM 125.33.245.*
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版