Crossin的编程教室
标题:
获取网页所有请求,遍历URL
[打印本页]
作者:
xielong0120
时间:
2021-4-7 16:00
标题:
获取网页所有请求,遍历URL
用F5直接运行,无论怎么样都获取不到链接:
2021-4-7 15:56 上传
下载附件
(108.33 KB)
但是用类似debug一样一步一步去运行,就完全正常:
2021-4-7 15:57 上传
下载附件
(113.93 KB)
请教一下,这是代码的问题还是IDE的问题?我用python自带的IDLE和pycharm也获取不到这个链接。头都大了,不知道是哪里的问题。
作者:
xielong0120
时间:
2021-4-7 17:17
本帖最后由 xielong0120 于 2021-4-7 17:21 编辑
这段代码一直提示re_link返回的是空值,就是正则在list里面没有匹配到链接。但是我把list和正则单独拿出来,是每次都可以匹配到的。
2021-4-7 17:21 上传
下载附件
(137.8 KB)
作者:
crossin先生
时间:
2021-4-7 22:42
代码多加print,缩小问题范围,逐步定位问题
比如你可以对比一下成功和不成功的代码,是在哪一步出现不同的。是没抓取到,还是解析出来不对,然后再分析问题可能的原因
光看一个结果,我也没法看出问题
而且,代码还在开发过程中不要急着加 try,加上了出现报错都没法显示,给自己debug增加难度
作者:
xielong0120
时间:
2021-4-8 08:50
本帖最后由 xielong0120 于 2021-4-8 10:26 编辑
根据老师的建议,我修改一下代码,果然发现是下面的判断处理那里的一个判断出现了问题。
我把那一片代码都注释了,重新写了下逻辑,现在基本可以百分之百获取到链接了。
2021-4-8 10:24 上传
下载附件
(70.46 KB)
还是要多打印才能发现问题的根本原因是哪里,并不是正则没有匹配到,而是我判断取得值不对。
欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/)
Powered by Discuz! X2.5