Crossin的编程教室

标题: 获取网页所有请求,遍历URL [打印本页]

作者: xielong0120    时间: 2021-4-7 16:00
标题: 获取网页所有请求,遍历URL
用F5直接运行,无论怎么样都获取不到链接:
Snipaste_2021-04-07_15-55-36.png

但是用类似debug一样一步一步去运行,就完全正常:
Snipaste_2021-04-07_15-55-49.png

请教一下,这是代码的问题还是IDE的问题?我用python自带的IDLE和pycharm也获取不到这个链接。头都大了,不知道是哪里的问题。

作者: xielong0120    时间: 2021-4-7 17:17
本帖最后由 xielong0120 于 2021-4-7 17:21 编辑

这段代码一直提示re_link返回的是空值,就是正则在list里面没有匹配到链接。但是我把list和正则单独拿出来,是每次都可以匹配到的。
Snipaste_2021-04-07_17-21-21.png
作者: crossin先生    时间: 2021-4-7 22:42
代码多加print,缩小问题范围,逐步定位问题
比如你可以对比一下成功和不成功的代码,是在哪一步出现不同的。是没抓取到,还是解析出来不对,然后再分析问题可能的原因

光看一个结果,我也没法看出问题


而且,代码还在开发过程中不要急着加 try,加上了出现报错都没法显示,给自己debug增加难度
作者: xielong0120    时间: 2021-4-8 08:50
本帖最后由 xielong0120 于 2021-4-8 10:26 编辑

根据老师的建议,我修改一下代码,果然发现是下面的判断处理那里的一个判断出现了问题。

我把那一片代码都注释了,重新写了下逻辑,现在基本可以百分之百获取到链接了。

Snipaste_2021-04-08_10-25-01.png

还是要多打印才能发现问题的根本原因是哪里,并不是正则没有匹配到,而是我判断取得值不对。




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5