Crossin的编程教室
标题:
请教一个简单爬虫问题
[打印本页]
作者:
baibaoxuebao
时间:
2020-4-14 22:47
标题:
请教一个简单爬虫问题
为啥我这个爬虫输出的网络不给力,请稍后重试
import urllib.request
import urllib.parse
# 拼接URL
basedurl = "http://baidu.com/s?"
key = input("请输入要搜索的内容:")
# 进行urlencode()编码
wd = {"wd": key}
key = urllib.parse.urlencode(wd)
url = basedurl + key
headers = {"User-Agent": "Mozilla/5.0"}
# 创建请求对象
req = urllib.request.Request(url, headers=headers)
# 获取响应对象
res = urllib.request.urlopen(req)
html = res.read().decode("utf-8")
# 写入本地文件
with open("搜索.html", "w", encoding="utf-8") as f:
f.write(html)
复制代码
打开 搜索.html 以后,这样的结果
2020-4-14 22:45 上传
下载附件
(445.44 KB)
作者:
crossin先生
时间:
2020-4-15 11:54
你看是“百度安全验证”,应该是被识别出来屏蔽了请求
你可以换用 requests 库来做,并且加上 headers 信息
作者:
crossin先生
时间:
2020-4-15 11:55
也可以换几个网站试试
作者:
baibaoxuebao
时间:
2020-4-15 13:28
crossin先生 发表于 2020-4-15 11:54
你看是“百度安全验证”,应该是被识别出来屏蔽了请求
你可以换用 requests 库来做,并且加上 headers 信息 ...
谢谢,我换成知乎了,可以了。
欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/)
Powered by Discuz! X2.5