- 主题:如何抓出网页的歌词
不需要用外部的bs4,只用re就足够了:
import re
html='''
<div class="sp">[ti:让你感觉我的心再说爱你]<br/>[ar:彭家丽]<br/>[al:新曲+精
选]
<br/>[offset:0]<br/>[00:01.51]让你感觉我的心再说爱你 - 彭家丽<br/>[00:23.90]
不愿
说别离 我紧紧拥着你<br/>[00:28.57]<br/>[00:29.57]让你听见我的心 在偷偷的叹息
<br/>[00:35.50]<br/>[00:36.19]过去所有的回忆 我会放在我心里<br/>[00:41.80]<b
r/>
[00:42.68]我会永远为你而美丽<br/>[00:48.35]<br/>[00:49.23]不愿道别离 我紧紧吻
着
你<br/>[00:54.59]<br/>[00:55.47]吻干你的忧郁 你的泪滴<br/>[01:01.52]在每个深
沉夜
里 每一个梦里<br/>[01:07.95]我会用我的真心好好爱你<br/>
'''
html = html.replace('<div class="sp">','').replace('\n', '')
html = re.sub(r'(\d\d\])\<br\/\>(\[\d\d)', r'\1\2',html)
html = html.replace('<br/>', '\n')
print(html)
【 在 javame (yimin) 的大作中提到: 】
: <div class="sp">[ti:让你感觉我的心再说爱你]<br/>[ar:彭家丽]<br/>[al:新曲+精选]<br/>[offset:0]<br/>[00:01.51]让你感觉我的心再说爱你 - 彭家丽<br/>[00:23.90]不愿说别离 我紧紧拥着你<br/>[00:28.57]<br/>[00:29.57]让你听见我的心 在偷偷的叹息<br/>[00:35.50]
: 用python的bs4还是用正则,谁能贴个例子,谢谢!
: ---分割线---
: ...................
--
FROM 58.23.244.*
用个Excel也行
【 在 javame 的大作中提到: 】
: &lt;div&nbsp;class="sp"&gt;[ti:让你感觉我的心再说爱你]&lt;br/&gt;[ar:彭家 ...
--
FROM 113.200.204.*
这个用javascript可以做吗?
【 在 chenghaibo 的大作中提到: 】
: 用个Excel也行
--
FROM 116.231.61.*
re还是少用吧,因为html是有容错能力的,用re写太难调了,要为对方的错误埋单
【 在 callmebbser 的大作中提到: 】
: 不需要用外部的bs4,只用re就足够了:
: import re
: html='''
: ...................
--
FROM 27.91.71.*
python有个jquery解析库
【 在 javame 的大作中提到: 】
: <div class="sp">[ti:让你感觉我的心再说爱你]<br/>[ar:彭家丽]<br/>[al:新曲+精选]<br/>[offset:0]<br/>[00:01.51]让你感觉我的心再说爱你 - 彭家丽<br/>[00:23.90]不愿说别离 我紧紧拥着你<br/>[00:28.57]<br/>[00:29.57]让你听见我的心 在偷偷的叹息<br/>[00:35.50]<br/>[00:36.19]过去所有的回忆 我会放在我心里<br/>[00:41.80]<br/>[00:42.68]我会永远为你而美丽<br/>[00:48.35]<br/>[00:49.23]不愿道别离 我紧紧吻着你<br/>[00:54.59]<br/>[00:55.47]吻干你的忧郁 你的泪滴<br/>[01:01.52]在每个深沉夜里 每一个梦里<br/>[01:07.95]我会用我的真心好好爱你<br/>
: 用python的bs4还是用正则,谁能贴个例子,谢谢!
--
FROM 211.97.31.*
这个和javascript的jquery一样用法吗?
【 在 jamwswallace 的大作中提到: 】
: python有个jquery解析库
:
--
FROM 58.37.36.*
基本一样。支持标签、id、CSS类、级联等各种选择器
【 在 javame 的大作中提到: 】
: 这个和javascript的jquery一样用法吗?
: :
--
FROM 58.62.112.*
@javame,你在哪个网站找的歌词?
【 在 javame (yimin) 的大作中提到: 】
: <div class="sp">[ti:让你感觉我的心再说爱你]<br/>[ar:彭家丽]<br/>[al:新曲+精选]<br/>[offset:0]<br/>[00:01.51]让你感觉我的心再说爱你 - 彭家丽<br/>[00:23.90]不愿说别离 我紧紧拥着你<br/>[00:28.57]<br/>[00:29.57]让你听见我的心 在偷偷的叹息<br/>[00:35.50]
: 用python的bs4还是用正则,谁能贴个例子,谢谢!
: ---分割线---
: ...................
--
FROM 60.216.179.84