- 主题:【请教】各位大牛,如何编程获得网页上的特定数据? (转载)
【 以下文字转载自 DotNET 讨论区 】
发信人: ChangQiang (智商不高,情商糟糕), 信区: DotNET
标 题: 【请教】各位大牛,如何编程获得网页上的特定数据?
发信站: 水木社区 (Fri Jan 11 17:30:33 2013), 站内
比如想获得搜狐财经页面上的上证指数
--
FROM 175.169.27.*
正则最方便,如果有特征独特,数据单一直接index也行。
【 在 ChangQiang 的大作中提到: 】
: 发信人: ChangQiang (智商不高,情商糟糕), 信区: DotNET
: 标 题: 【请教】各位大牛,如何编程获得网页上的特定数据?
: 发信站: 水木社区 (Fri Jan 11 17:30:33 2013), 站内
: ...................
--
FROM 110.232.55.*
通过httpclient下载页面源代码, 把html 源文件转换成xml(只要能转成SAXReader可解析的格式即可),通过xpath定位到包含 待查找 数据的 元素上,通过取 text值或者属性,取得字符串, 然后再用正则表达式 精确提取。
--
修改:smxiaosheng FROM 111.161.70.*
FROM 111.161.70.*
有点晕,好多东西不懂,
在请教一下,用C#有什么好的解决方案么?
【 在 smxiaosheng (xiaosheng) 的大作中提到: 】
: 通过httpclient下载页面源代码, 把html 源文件转换成xml(只要能转成SAXReader可解析的格式即可),通过xpath定位到包含 待查找 数据的 元素上,通过取 text值或者属性,取得字符串, 然后再用正则表达式 精确提取。
--
FROM 175.169.27.*