水木社区手机版
首页
|版面-C++程序设计语言(CPlusPlus)|
新版wap站已上线
返回
1/1
|
转到
主题:XML解析性能的问题
8楼
|
DoorWay
|
2022-07-16 10:03:43
|
展开
http://www.firstobject.com/xml-reader-sax-vs-xml-pull-parser.htm
这个看看,说是和SAX相比,都是流式的。但你这是Word文档,找到超大节点,能不能一次设定读取大小,文档没说。
【 在 z16166 的大作中提到: 】
: 需要解析docx里的XML里的文本,也就是提取OOXML里的文本。
: 目前采用DOM方式,存在的问题:
: 1、内存占用问题:DOM需要load整个文件进内存,超大文件不能处理。
: ...................
--
FROM 61.185.194.*
10楼
|
DoorWay
|
2022-07-19 10:04:25
|
展开
解决了没,用了哪个,libxml2,还是cmarkup
--
FROM 124.114.151.*
12楼
|
DoorWay
|
2022-07-19 15:03:22
|
展开
程序跑的环境是啥,这么严格,20M还是事儿,直接内存映射吧,64位的系统,
划个512M,或者1G,全加载。
【 在 z16166 的大作中提到: 】
: 我这个需要极限的性能,怎么优化都不为过。类似杀软对office文档的检测。
: 我估计小文件用libhpxml这种需要全部加载到内存、不需要复制字符串而是尽量返回string_view的库。
: libhpxml这个自己搞了一个类似string_view的,毕竟这库写出来的那会儿std里还没string_view这个东西。
: ...................
--
FROM 124.114.151.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版