- 主题:如何把word文档的脚注尾注提取插入正文之中?
需要把word文档转换为txt文本,脚注尾注不方便查看,是否有高人可以把注释都以[]的形式直接转换为政委中?
有没有这样的程序?非常感谢!
--
FROM 183.144.105.*
尾注就是插入正文中的[序号]位置就可以了
如果是word中的脚注也是一样
http://www.chibs.edu.tw/ch_html/bcc/an019_14.htm#n21
http://www.wuys.com/news/Article_Show.asp?ArticleID=6800
【 在 callmebbser 的大作中提到: 】
: 传几个WORD转出来的TXT文件上来,再传一个手工处理好的txt为参考最终样本,用Pyth
: on来处理,不难。
:
: ...................
--
修改:unchained FROM 183.144.105.*
FROM 183.144.105.*
非常感謝!很好用,試驗成功了。果然是技術高手!
如果是doc文件似乎就不行,會提示:
……\Local\Temp\_MEI154722\docx2python\bullets_and_numbering.py:49: UserWarning: chineseCounting numbering format not implemented, substituting '--'
Traceback (most recent call last):
File "docx2txt.py", line 41, in docx2txt
UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 9567: illegal multibyte sequence
不過這樣已經很好了,感謝!
【 在 callmebbser 的大作中提到: 】
: 将三个附件下载到同一个目录下,用压缩软件如7-zip打开第一个附件,解压缩之,就可
: 以得到
: 一个docx2txt.exe的可执行程序,运行之,选择要转换的docx文件,点击转换即可。
: ...................
--
FROM 60.183.22.*
您好,有一些文档转换时出错了:
Traceback (most recent call last):
File "docx2txt.py", line 28, in docx2txt
File "docx2txt.py", line 14, in getFootnotes
IndexError: list index out of range
Traceback (most recent call last):
File "docx2txt.py", line 41, in docx2txt
UnicodeEncodeError: 'gbk' codec can't encode character '\u0387' in position 29553: illegal multibyte sequence
Traceback (most recent call last):
File "docx2txt.py", line 28, in docx2txt
File "docx2txt.py", line 14, in getFootnotes
IndexError: list index out of range
Traceback (most recent call last):
File "docx2txt.py", line 41, in docx2txt
UnicodeEncodeError: 'gbk' codec can't encode character '\u0387' in position 29553: illegal multibyte sequence
Traceback (most recent call last):
File "docx2txt.py", line 28, in docx2txt
File "docx2txt.py", line 14, in getFootnotes
IndexError: list index out of range
感谢
【 在 callmebbser 的大作中提到: 】
: doc格式与docx格式完全不一样,本小工具不支持doc格式。
:
:
--
FROM 36.25.213.*
【 在 callmebbser 的大作中提到: 】
: 把出现转换错误的文档传上来,才好定位问题。
:
附件(1.1MB) 测试转换1.docx--
FROM 36.25.193.*
谢谢!现在可以正常换行了,最后提示:
Traceback (most recent call last):
File "docx2txt.py", line 28, in docx2txt
File "docx2txt.py", line 14, in getFootnotes
IndexError: list index out of range
但是转换成功了!
那么以后是否都要确保文本的编码utf格式才能转换?
【 在 callmebbser 的大作中提到: 】
: 接着上传。
:
--
FROM 36.25.193.*