pdf文字可以是分层的
比如生成一张pdf的发票:
开发人员的思路应该会是先填写红色文字、再填上黑色文字。而且即使是同一种颜色,先后次序也未必是看到的那个顺序。
那么从pdf复制出文字,也会是先红色文字、再黑色文字,与看到的内容顺序不同。
这种情况,其实与word文本框有点相似了
【 在 hgoldfish 的大作中提到: 】
:
https://filingdb.com/b/pdf-text-extraction※ 修改:·KEILLY 于 Jun 14 18:59:40 2021 修改本文·[FROM: 124.160.153.*]
※ 来源:·最水木 客户端·[FROM: 124.160.153.*]
修改:KEILLY FROM 124.160.153.*
FROM 124.160.153.*