设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 6489|回复: 1
打印 上一主题 下一主题

爬虫求助?哪里有问题啊

[复制链接]

1

主题

0

好友

5

积分

新手上路

Rank: 1

跳转到指定楼层
楼主
发表于 2018-6-11 00:12:37 |只看该作者 |倒序浏览
import requests
import json
import re
from bs4 import BeautifulSoup

def get_music_ids_by_musican_id(singer_id):
    singer_url = 'https://y.qq.com/n/yqq/singer/004WgCsE3KBddt.html#stat=y_new.singerlist.singername'
    r = requests.get(singer_url)
    soupObj = BeautifulSoup(r.text,'lxml')
    song_ids=soupObj.find('textarea').text
    jobj = json.loads(song_ids)
    for item in jobj:
       return(item['id'])

def get_lrc(music_id):
    url = 'https://y.qq.com/n/yqq/song/'+ str(music_id)
    r = requests.get(url)
    json_obj = r
    j = json.loads(json_obj)
    lrc = j['lrc']['lyric']
    pat = re.compile(r'\[.*\]')
    lrc = re.sub(pat,"",lrc)  
    lrc = lrc.strip()
    return lrc         

if __name__=="__main__":
     music_id=get_music_ids_by_musican_id(1)
     lrc=get_lrc(music_id)
     fp=open('歌词.txt',mode='w')
     fp.write(lrc)

回复

使用道具 举报

5

主题

0

好友

145

积分

注册会员

Rank: 2

沙发
发表于 2019-6-21 15:33:24 |只看该作者
看不懂哎
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-11-23 15:55 , Processed in 0.023232 second(s), 21 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部