别把file parser想那么难,有规范文档的,对着文档弄就完事了
除非是那种什么巨老的连格式文档都找不到的
当然,要想少出点漏洞,得搞一堆的测试用例和fuzzy
【 在 DoorWay 的大作中提到: 】
: 上千人年,作者对office的工作量估计。
: 但博客本身,也是吐槽文档格式的BIFF,增加了解析的难度。核心结论就是,这种格式根本没有考虑interchangeable ,就是为了快。
: 解析的难度还来自复杂漫长的历史,比如1900和1904那个例子。
: ...................
--
修改:z16166 FROM 125.35.123.*
FROM 125.35.123.*