Crossin的编程教室

标题: requests库是怎么实现爬取图片的啊 [打印本页]

作者: 人工智能    时间: 2018-4-16 20:37
标题: requests库是怎么实现爬取图片的啊
requests库是怎么实现爬取图片的呢 我看https://img.qq1234.org/uploads/allimg/141208/3_141208170523_3.jpg 这个页面就是图片页面 然后检查一下元素 看到这个图片 实在src中的一个链接里 是个路径 为什么直接爬取这个页面 然后二进制保存一下 就会变成图片了呢  requests库是自动从路径连接中把原图片的二进制代码爬下来了吗 还是怎么回事

作者: 人工智能    时间: 2018-4-16 21:15
还有 ajax 的动态页面 F12的时候为什么 network下  怎么看不到 from data  这项了
作者: crossin先生    时间: 2018-4-16 23:08
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

后一个问题我没听懂,你是指 form data?不是所有请求都有 form data
作者: 人工智能    时间: 2018-4-17 13:54
crossin先生 发表于 2018-4-16 23:08
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

post的请求应该会有form data吧
作者: 人工智能    时间: 2018-4-27 00:06
crossin先生 发表于 2018-4-16 23:08
你想多了,你的那个链接就是个图片,别管elements里看到的
elements是浏览器处理后的结果,和原请求无关

您所查找的页面无法通过您的浏览器打开,因为浏览器不接受其文件扩展名   是怎么回事啊 爬取一个网站的图片
返回的文件txt 说的这个
作者: crossin先生    时间: 2018-4-27 12:25
人工智能 发表于 2018-4-27 00:06
您所查找的页面无法通过您的浏览器打开,因为浏览器不接受其文件扩展名   是怎么回事啊 爬取一个网站的图 ...

抓图片返回txt,那可能做了发爬或防盗链吧,还是加header




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5