Crossin的编程教室

标题: 得到图片url,但是下载不下来 [打印本页]

作者: mayixb    时间: 2018-2-16 22:20
标题: 得到图片url,但是下载不下来
就是这个页面的图片 https://www.meitulu.com/item/5760.html

第一第图片的地址是 https://mtl.ttsqgs.com/images/img/5760/1.jpg

我用

with open('1.jpg','wb') as f:
    f.write(requests.get(url).content)

图片下载下来不对


作者: crossin先生    时间: 2018-2-17 20:41
你把content打出来看看就知道了
作者: mayixb    时间: 2018-2-19 21:41
crossin先生 发表于 2018-2-17 20:41
你把content打出来看看就知道了

打印出来不是二进制,那这个页面怎么提取图片连接阈下载呢  https://www.meitulu.com/item/5760.html
作者: crossin先生    时间: 2018-2-20 15:34
mayixb 发表于 2018-2-19 21:41
打印出来不是二进制,那这个页面怎么提取图片连接阈下载呢  https://www.meitulu.com/item/5760.html ...

你有看过content是什么吗?

我这边试下来是提示 403 forbidden,你的headers信息不够
这个不是直接可以请求的,要加headers。具体的我们爬虫课程里有说。或者你去网上搜索下如何请求时增加headers




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5