设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 5111|回复: 3
打印 上一主题 下一主题

如何从下面一段内容中,找出规律,并仅仅提取网页链接

[复制链接]

7

主题

2

好友

56

积分

注册会员

Rank: 2

跳转到指定楼层
楼主
发表于 2023-7-12 08:00:42 |只看该作者 |倒序浏览
本帖最后由 baibaoxuebao 于 2023-7-12 08:04 编辑

首行不一定的是网页链接,已经上传图片和附件,我希望是提取txt里面的所有链接,然后放到一个新的txt里面,但是就是不知道怎么提取网页链接,但是我知道通过竖线分割


https://www.yuque.com/zglt68/ccr7m1/nhz5us | 正则表达式

https://www.bilibili.com/video/B ... 92ea7578c890d6ea8cc | Figma 新功能教学:Auto Layout 自动换行、最大最小值、最大行数、属性继承 | Wrap、Min/Max、Max Line_哔哩哔哩_bilibili

https://mp.weixin.qq.com/s/3XXur-qFjY3leIh1qWCbHQ | 长线投资社群:一周交流精选 (第二十七期2023.07.09)
https://mp.weixin.qq.com/s/nUgwqSOvvKMZFM2-y6c8aA | Midjourney 5.2版本详解02
https://mp.weixin.qq.com/s/pDBd7FXUpEHL4jxiT3iQLQ | 初认Controlnet插件(插件篇)
https://mp.weixin.qq.com/s/hy5JdJ96K8MHGso6gXE8-Q | SDicon V2.0发布,B端暗橙色科技风大模型
https://mp.weixin.qq.com/s/bI3qNdmwpcknLrsAYGEhdw | 这B端页面功能堆叠,我还是想尽办法搞出了极简设计
https://mp.weixin.qq.com/s/zWMiebWBYh0SfkXqwy4-9A | 更高级!蔚来Banyan 2.0焕新升级UI及交互设计揭秘
https://mp.weixin.qq.com/s/sh-vvcBBluGyAtlBclj0HA | 干货!!Stable Diffusion基础入门
https://mp.weixin.qq.com/s/6urs7JKnOd-CgWHuOzQWmg | 2022 部分 B 端项目作品集

https://mp.weixin.qq.com/s/QzswJNjTcq7tTYAtbDOA4g | 如何帮助用户度过新人期
https://mp.weixin.qq.com/s/d0fFDVVUtHTrGymh9luBMg | 实战案例!看设计师如何玩转视觉升级
https://mp.weixin.qq.com/s/hO-3q7LR_pF8MTBOxlR5jQ | AIGC应用实践丨30秒生成可视化用户旅程地图&精益画布
https://mp.weixin.qq.com/s/qAEBTq1VW2N9DSqQM_3unw | 如何进行设计思考,参考这个模型
https://mp.weixin.qq.com/s/6YNl9lFgdcfbbh7uTyaP5g | 看苹果新发布的设计规范,洞察未来交互方式,变化太大了
https://mp.weixin.qq.com/s/hLsfIz3tw4bkIIeJ1PhRLg | 京东大神做的PC交互设计规范,专业又细节

https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | 银行金融APP的适老化设计指南(上篇)
https://mp.weixin.qq.com/s/bfI9zEq_IK4P6apWQbBZeQ | 设计系统避坑指南
https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | 银行金融APP的适老化设计指南(下篇)
https://mp.weixin.qq.com/s/g-ecbOr-PIVfG6HkQusXSA | 嘿,要不要做一款由你定义的产品?|Develop Monthly 08
https://mp.weixin.qq.com/s?__biz ... =21#wechat_redirect | AI技术助力B端创作:运营类3D Banner设计新思路
https://mp.weixin.qq.com/s/3B5FMsly9tvnmmUMG0PHFg | 为什么跟ChatGPT说“你是某个领域专家”,效果就会好很多

Xnip2023-07-12_08-01-27.png (593.33 KB, 下载次数: 777)

Xnip2023-07-12_08-01-27.png

网页.txt.zip

2.83 KB, 下载次数: 8

回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2023-7-12 23:35:59 |只看该作者
粗糙的办法:读进来每一行判断有没有 |,有的话就 split('|')[0].strip() ,即按|分割取前一半,并把前后多余的空格去掉

精细的办法:正则表达式。网上搜下 正则表达式匹配网址 就有答案。前提是你了解什么是正则表达式
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

7

主题

2

好友

56

积分

注册会员

Rank: 2

板凳
发表于 2023-7-14 10:34:40 |只看该作者
crossin先生 发表于 2023-7-12 23:35
粗糙的办法:读进来每一行判断有没有 |,有的话就 split('|')[0].strip() ,即按|分割取前一半,并把前后多 ...

有没有完整的代码啊,我还是不会,粗糙的办法
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

地板
发表于 2023-7-15 00:01:32 |只看该作者
for line in open('xxx.txt'):
    print(line.split('|')[0].strip())
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-11-23 18:16 , Processed in 0.024745 second(s), 24 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部