【请教】各位大牛，如何编程获得网页上的特定数据？ (转载)

水木社区手机版

主题:【请教】各位大牛，如何编程获得网页上的特定数据？ (转载)
楼主|ChangQiang|2013-01-11 18:52:44|只看此ID
【以下文字转载自 DotNET 讨论区】
发信人: ChangQiang (智商不高，情商糟糕), 信区: DotNET
标题: 【请教】各位大牛，如何编程获得网页上的特定数据？
发信站: 水木社区 (Fri Jan 11 17:30:33 2013), 站内

比如想获得搜狐财经页面上的上证指数
--
FROM 175.169.27.*
1楼|mjaas|2013-01-11 21:28:02|只看此ID
正则最方便，如果有特征独特，数据单一直接index也行。
【在 ChangQiang 的大作中提到: 】
: 发信人: ChangQiang (智商不高，情商糟糕), 信区: DotNET
: 标题: 【请教】各位大牛，如何编程获得网页上的特定数据？
: 发信站: 水木社区 (Fri Jan 11 17:30:33 2013), 站内
: ...................
--
FROM 110.232.55.*
2楼|smxiaosheng|2013-01-11 23:28:02|只看此ID
通过httpclient下载页面源代码，把html 源文件转换成xml（只要能转成SAXReader可解析的格式即可），通过xpath定位到包含待查找数据的元素上，通过取 text值或者属性，取得字符串，然后再用正则表达式精确提取。
--
修改:smxiaosheng FROM 111.161.70.*
FROM 111.161.70.*
3楼|ChangQiang|2013-01-12 08:24:48|只看此ID
有点晕，好多东西不懂，
在请教一下，用C#有什么好的解决方案么？

【在 smxiaosheng (xiaosheng) 的大作中提到: 】
: 通过httpclient下载页面源代码，把html 源文件转换成xml（只要能转成SAXReader可解析的格式即可），通过xpath定位到包含待查找数据的元素上，通过取 text值或者属性，取得字符串，然后再用正则表达式精确提取。
--
FROM 175.169.27.*