Crossin的编程教室

标题: 我想爬去音乐网站上的音乐怎么弄? [打印本页]

作者: 人工智能    时间: 2018-4-19 22:43
标题: 我想爬去音乐网站上的音乐怎么弄?
音乐一般都是以什么形式的文件上传的? 我要从network里捕获链接吗?

作者: crossin先生    时间: 2018-4-20 00:21
流媒体不好抓
如果是有下载链接的还好
作者: 人工智能    时间: 2018-4-21 21:06
crossin先生 发表于 2018-4-20 00:21
流媒体不好抓
如果是有下载链接的还好

嗯  我今天打开之前能打开的一个图片网页  显示  Server Connection Closed    这是我的ip被封了吗
作者: crossin先生    时间: 2018-4-22 18:11
人工智能 发表于 2018-4-21 21:06
嗯  我今天打开之前能打开的一个图片网页  显示  Server Connection Closed    这是我的ip被封了吗 ...

有可能,也可能是临时的请求失败
作者: 人工智能    时间: 2018-4-23 00:09
crossin先生 发表于 2018-4-22 18:11
有可能,也可能是临时的请求失败

嗯 可能就是被封了 换了ip就能打开了
作者: 人工智能    时间: 2018-4-23 00:12
crossin先生 发表于 2018-4-22 18:11
有可能,也可能是临时的请求失败

HTTPError: 403 Client Error:   爬取百度图片 出现这个错误怎么解决 user-agent 我也加了

链接是从xml里的json数据中提取出来的  直接用浏览器的话可以打开 爬取的话就报错
作者: crossin先生    时间: 2018-4-23 11:37
人工智能 发表于 2018-4-23 00:12
HTTPError: 403 Client Error:   爬取百度图片 出现这个错误怎么解决 user-agent 我也加了

链接是从xml ...

不仅仅要user-agent ,header里其他的 referer之类 也加上试一试
作者: 人工智能    时间: 2018-4-23 22:43
crossin先生 发表于 2018-4-23 11:37
不仅仅要user-agent ,header里其他的 referer之类 也加上试一试

很强 先生   成功了 哈哈




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5