对。目前我先用libhpxml这个,基本上也是这个套路,试了一下20MB是100多毫秒的样子(回调是空函数时),只不过它是GPL授权的。
https://github.com/rahra/libhpxml
【 在 suchet 的大作中提到: 】
: file mapping加上手写sax,比较宽松的xml合法性检查,假设utf8编码,遍历单个700MB的文件,两秒左右完成。升级下硬件,代码再优化一下,应该还能更快。
: 工作需要自己写的,不能开源。仅供对比一下性能。
--
FROM 222.129.205.*