Crossin的编程教室

标题: requests库是怎么实现爬取图片的啊 [打印本页]

作者: 人工智能 时间: 2018-4-16 20:37
标题: requests库是怎么实现爬取图片的啊
requests库是怎么实现爬取图片的呢我看https://img.qq1234.org/uploads/allimg/141208/3_141208170523_3.jpg 这个页面就是图片页面然后检查一下元素看到这个图片实在src中的一个链接里是个路径为什么直接爬取这个页面然后二进制保存一下就会变成图片了呢 requests库是自动从路径连接中把原图片的二进制代码爬下来了吗还是怎么回事

作者: 人工智能 时间: 2018-4-16 21:15
还有 ajax 的动态页面 F12的时候为什么 network下怎么看不到 from data 这项了

作者: crossin先生 时间: 2018-4-16 23:08
你想多了，你的那个链接就是个图片，别管elements里看到的
elements是浏览器处理后的结果，和原请求无关

后一个问题我没听懂，你是指 form data？不是所有请求都有 form data

作者: 人工智能 时间: 2018-4-17 13:54

crossin先生发表于 2018-4-16 23:08
你想多了，你的那个链接就是个图片，别管elements里看到的
elements是浏览器处理后的结果，和原请求无关

post的请求应该会有form data吧

作者: 人工智能 时间: 2018-4-27 00:06

crossin先生发表于 2018-4-16 23:08
你想多了，你的那个链接就是个图片，别管elements里看到的
elements是浏览器处理后的结果，和原请求无关

您所查找的页面无法通过您的浏览器打开，因为浏览器不接受其文件扩展名是怎么回事啊爬取一个网站的图片
返回的文件txt 说的这个

作者: crossin先生 时间: 2018-4-27 12:25

人工智能发表于 2018-4-27 00:06
您所查找的页面无法通过您的浏览器打开，因为浏览器不接受其文件扩展名是怎么回事啊爬取一个网站的图 ...

抓图片返回txt，那可能做了发爬或防盗链吧，还是加header

欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/)