请选择 进入手机版 | 继续访问电脑版
设为首页收藏本站

Crossin的编程教室

微信公众号:
crossincode
 找回密码
 现在加入
查看: 408|回复: 5

requests库是怎么实现爬取图片的啊

[复制链接]

15

主题

0

好友

187

积分

注册会员

Rank: 2

发表于 2018-4-16 20:37:42 |显示全部楼层
requests库是怎么实现爬取图片的呢 我看https://img.qq1234.org/uploads/allimg/141208/3_141208170523_3.jpg 这个页面就是图片页面 然后检查一下元素 看到这个图片 实在src中的一个链接里 是个路径 为什么直接爬取这个页面 然后二进制保存一下 就会变成图片了呢  requests库是自动从路径连接中把原图片的二进制代码爬下来了吗 还是怎么回事
回复

使用道具 举报

15

主题

0

好友

187

积分

注册会员

Rank: 2

发表于 2018-4-16 21:15:19 |显示全部楼层
还有 ajax 的动态页面 F12的时候为什么 network下  怎么看不到 from data  这项了
回复

使用道具 举报

153

主题

34

好友

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

发表于 2018-4-16 23:08:04 |显示全部楼层
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

后一个问题我没听懂,你是指 form data?不是所有请求都有 form data
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

15

主题

0

好友

187

积分

注册会员

Rank: 2

发表于 2018-4-17 13:54:46 |显示全部楼层
crossin先生 发表于 2018-4-16 23:08
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

post的请求应该会有form data吧
回复

使用道具 举报

15

主题

0

好友

187

积分

注册会员

Rank: 2

发表于 2018-4-27 00:06:06 |显示全部楼层
crossin先生 发表于 2018-4-16 23:08
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

您所查找的页面无法通过您的浏览器打开,因为浏览器不接受其文件扩展名   是怎么回事啊 爬取一个网站的图片
返回的文件txt 说的这个
回复

使用道具 举报

153

主题

34

好友

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

发表于 2018-4-27 12:25:09 |显示全部楼层
人工智能 发表于 2018-4-27 00:06
您所查找的页面无法通过您的浏览器打开,因为浏览器不接受其文件扩展名   是怎么回事啊 爬取一个网站的图 ...

抓图片返回txt,那可能做了发爬或防盗链吧,还是加header
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 现在加入

QQ|Archiver|手机版|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2018-12-13 17:05 , Processed in 0.078416 second(s), 24 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部