Crossin的编程教室

标题: 请教一个简单爬虫问题 [打印本页]

作者: baibaoxuebao    时间: 2020-4-14 22:47
标题: 请教一个简单爬虫问题
为啥我这个爬虫输出的网络不给力,请稍后重试
  1. import urllib.request
  2. import urllib.parse

  3. # 拼接URL
  4. basedurl = "http://baidu.com/s?"
  5. key = input("请输入要搜索的内容:")

  6. # 进行urlencode()编码
  7. wd = {"wd": key}
  8. key = urllib.parse.urlencode(wd)

  9. url = basedurl + key
  10. headers = {"User-Agent": "Mozilla/5.0"}

  11. # 创建请求对象
  12. req = urllib.request.Request(url, headers=headers)

  13. # 获取响应对象
  14. res = urllib.request.urlopen(req)
  15. html = res.read().decode("utf-8")


  16. # 写入本地文件
  17. with open("搜索.html", "w", encoding="utf-8") as f:
  18.       f.write(html)

复制代码
打开 搜索.html 以后,这样的结果
截屏2020-04-1422.45.08.png



作者: crossin先生    时间: 2020-4-15 11:54
你看是“百度安全验证”,应该是被识别出来屏蔽了请求
你可以换用 requests 库来做,并且加上 headers 信息
作者: crossin先生    时间: 2020-4-15 11:55
也可以换几个网站试试
作者: baibaoxuebao    时间: 2020-4-15 13:28
crossin先生 发表于 2020-4-15 11:54
你看是“百度安全验证”,应该是被识别出来屏蔽了请求
你可以换用 requests 库来做,并且加上 headers 信息 ...

谢谢,我换成知乎了,可以了。




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5