【 以下文字转载自 Programming 讨论区 】
发信人: ex2 (唐诗宋词,Fortran数值), 信区: Programming
标 题: 读取网页+执行其javascript以提取内容
发信站: 水木社区 (Sat Aug 28 09:02:03 2010), 站内
有大批量网页, 每个网页上有相当部分内容是通过ajax读取,
要运行了javascript之后才得到.
要弄一个程序来收集网页上的运行javascript以后的内容
请问有什么好做法?
不限于任何语言, 任何程序, 任何工具.
肯定采用多线程方式.
偏向于选用 有较快的速度, 较小的CPU占用, 较小的内存.
--
修改:ex2 FROM 91.104.77.*
FROM 91.104.77.*