Crossin的编程教室

标题: 如何从下面一段内容中,找出规律,并仅仅提取网页链接 [打印本页]

作者: baibaoxuebao    时间: 2023-7-12 08:00
标题: 如何从下面一段内容中,找出规律,并仅仅提取网页链接
本帖最后由 baibaoxuebao 于 2023-7-12 08:04 编辑

首行不一定的是网页链接,已经上传图片和附件,我希望是提取txt里面的所有链接,然后放到一个新的txt里面,但是就是不知道怎么提取网页链接,但是我知道通过竖线分割


https://www.yuque.com/zglt68/ccr7m1/nhz5us | 正则表达式

https://www.bilibili.com/video/B ... 92ea7578c890d6ea8cc | Figma 新功能教学:Auto Layout 自动换行、最大最小值、最大行数、属性继承 | Wrap、Min/Max、Max Line_哔哩哔哩_bilibili

https://mp.weixin.qq.com/s/3XXur-qFjY3leIh1qWCbHQ | 长线投资社群:一周交流精选 (第二十七期2023.07.09)
https://mp.weixin.qq.com/s/nUgwqSOvvKMZFM2-y6c8aA | Midjourney 5.2版本详解02
https://mp.weixin.qq.com/s/pDBd7FXUpEHL4jxiT3iQLQ | 初认Controlnet插件(插件篇)
https://mp.weixin.qq.com/s/hy5JdJ96K8MHGso6gXE8-Q | SDicon V2.0发布,B端暗橙色科技风大模型
https://mp.weixin.qq.com/s/bI3qNdmwpcknLrsAYGEhdw | 这B端页面功能堆叠,我还是想尽办法搞出了极简设计
https://mp.weixin.qq.com/s/zWMiebWBYh0SfkXqwy4-9A | 更高级!蔚来Banyan 2.0焕新升级UI及交互设计揭秘
https://mp.weixin.qq.com/s/sh-vvcBBluGyAtlBclj0HA | 干货!!Stable Diffusion基础入门
https://mp.weixin.qq.com/s/6urs7JKnOd-CgWHuOzQWmg | 2022 部分 B 端项目作品集

https://mp.weixin.qq.com/s/QzswJNjTcq7tTYAtbDOA4g | 如何帮助用户度过新人期
https://mp.weixin.qq.com/s/d0fFDVVUtHTrGymh9luBMg | 实战案例!看设计师如何玩转视觉升级
https://mp.weixin.qq.com/s/hO-3q7LR_pF8MTBOxlR5jQ | AIGC应用实践丨30秒生成可视化用户旅程地图&精益画布
https://mp.weixin.qq.com/s/qAEBTq1VW2N9DSqQM_3unw | 如何进行设计思考,参考这个模型
https://mp.weixin.qq.com/s/6YNl9lFgdcfbbh7uTyaP5g | 看苹果新发布的设计规范,洞察未来交互方式,变化太大了
https://mp.weixin.qq.com/s/hLsfIz3tw4bkIIeJ1PhRLg | 京东大神做的PC交互设计规范,专业又细节

https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | 银行金融APP的适老化设计指南(上篇)
https://mp.weixin.qq.com/s/bfI9zEq_IK4P6apWQbBZeQ | 设计系统避坑指南
https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | 银行金融APP的适老化设计指南(下篇)
https://mp.weixin.qq.com/s/g-ecbOr-PIVfG6HkQusXSA | 嘿,要不要做一款由你定义的产品?|Develop Monthly 08
https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | AI技术助力B端创作:运营类3D Banner设计新思路
https://mp.weixin.qq.com/s/3B5FMsly9tvnmmUMG0PHFg | 为什么跟ChatGPT说“你是某个领域专家”,效果就会好很多

Xnip2023-07-12_08-01-27.png (593.33 KB, 下载次数: 267)

Xnip2023-07-12_08-01-27.png

网页.txt.zip

2.83 KB, 下载次数: 8


作者: crossin先生    时间: 2023-7-12 23:35
粗糙的办法:读进来每一行判断有没有 |,有的话就 split('|')[0].strip() ,即按|分割取前一半,并把前后多余的空格去掉

精细的办法:正则表达式。网上搜下 正则表达式匹配网址 就有答案。前提是你了解什么是正则表达式
作者: baibaoxuebao    时间: 2023-7-14 10:34
crossin先生 发表于 2023-7-12 23:35
粗糙的办法:读进来每一行判断有没有 |,有的话就 split('|')[0].strip() ,即按|分割取前一半,并把前后多 ...

有没有完整的代码啊,我还是不会,粗糙的办法
作者: crossin先生    时间: 2023-7-15 00:01
for line in open('xxx.txt'):
    print(line.split('|')[0].strip())




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5