水木社区手机版
首页
|版面-Python的自由天空(Python)|
新版wap站已上线
返回
1/1
|
转到
主题:请问这个香港银行公会的数据怎么获取到 (转载)
楼主
|
t430
|
2022-07-13 16:05:38
|
只看此ID
【 以下文字转载自 ITExpress 讨论区 】
发信人: t430 (T430), 信区: ITExpress
标 题: 请问这个香港银行公会的数据怎么获取到
发信站: 水木社区 (Wed Jul 13 16:03:57 2022), 站内
http://www.hkab.org.hk/DisplayInterestSettlementRatesAction.do?Submit=Search&lang=en&year=2022&month=6&day=14
好象有啥反爬虫技术
我用java写了个简单的程序去取
获取不到数据
但浏览器打开是没问题的, 有数据
开发者模式打开也能看到里面的内容
这个要怎么破?
谢谢
--
FROM 223.104.148.*
1楼
|
xerox51
|
2022-07-14 19:32:41
|
只看此ID
这个网页里可以找到这个url
http://www.hkab.org.hk/hibor/listRates.do?lang=en&Submit=Search&year=2022&month=6&day=14
这个url的content本质上就是个html文件
你把这个url的content保存下来,再用xpath就能取到数据了
至于一年的数据,无非就是两层循环传入参数而已
--
修改:xerox51 FROM 111.182.30.*
FROM 111.182.30.*
2楼
|
xerox51
|
2022-07-14 19:59:08
|
只看此ID
【 在 t430 的大作中提到: 】
: 发信人: t430 (T430), 信区: ITExpress
: 标 题: 请问这个香港银行公会的数据怎么获取到
: 发信站: 水木社区 (Wed Jul 13 16:03:57 2022), 站内
: ...................
这是我抓取的数据,不知道是不是你要的。
--
FROM 111.182.30.*
3楼
|
t430
|
2022-07-16 18:09:57
|
只看此ID
是的, 一开始没注意到这个URL
还以为就是我打开的URL
谢谢
【 在 xerox51 的大作中提到: 】
: 这个网页里可以找到这个url
:
http://www.hkab.org.hk/hibor/listRates.do?lang=en&Submit=Search&year=2022&month=6&day=14
: 这个url的content本质上就是个html文件
: ...................
--
FROM 125.118.176.*
4楼
|
t430
|
2022-07-16 18:10:31
|
只看此ID
谢谢
【 在 xerox51 的大作中提到: 】
: [upload=1][/upload]
: 这是我抓取的数据,不知道是不是你要的。
--
FROM 125.118.176.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版