直接用浏览器抓啊,playwright、puppeteer 都有 py 的版本,不规范也不至于 chrome 都打不开吧?
【 在 fhd (疯了!) 的大作中提到: 】
: 标 题: Re: 如何写这个正则表达式
: 发信站: 水木社区 (Thu May 13 15:10:45 2021), 站内
:
: re,xml解析了半天发现网页超级不规范,一群class啥的一样的标签,还套了不知道多少层.....
:
: 【 在 wincss (wincss) 的大作中提到: 】
: : “那么多好用的工具”无非就是xml,jq那一套。。。。
: : 遇到垃圾标签不配对的网站没一个靠谱的
: : 我正则半分钟写出来了。。。用那些破玩意非得吭哧吭哧foreach,也不知道哪个受虐了
: : ...................
:
: --
:
: ※ 来源:·水木社区 newsmth.net·[FROM: 111.202.234.*]
--
FROM 122.59.183.*