请选择 进入手机版 | 继续访问电脑版
设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 3278|回复: 2

提取英语单词

[复制链接]

1

主题

0

好友

17

积分

新手上路

Rank: 1

发表于 2020-7-17 16:06:10 |显示全部楼层
求各位大神们指导一下!!!
import re   #载入正则表达式模块

f1 = open('form.txt',encoding='utf-8')  #这里因为无法读文字就加上encoding

data = f1.read()

f1.close()

#打开文件,读入文本

result = re.findall('[A-Za-z]', data)    #用正则表达式中的findall方法

#找出data中所有从A-Za-z的连续字符

result.sort()

#把得到的结果字符串list排序,默认为字典序

data = ' '.join(result)

#把排序后的结果用换行符连接成一段文本

f2 = open('to.txt', 'w')

f2.write(data)

f2.close()

#输出到文件中
输出的怎么是一个个字母而不是单词
回复

使用道具 举报

174

主题

45

好友

10万

积分

管理员

Rank: 9Rank: 9Rank: 9

发表于 2020-7-17 16:15:42 |显示全部楼层
正则没写对,把一开始拿到的result输出出来看看
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

1

主题

0

好友

17

积分

新手上路

Rank: 1

发表于 2020-7-18 21:09:37 来自手机 |显示全部楼层
本帖最后由 爱了101 于 2020-7-18 21:27 编辑

我直接将源码复制过去了,然后就这样了,不过加上encoding='utf-8'好像就好了,网上说好像是gbk编码器无法编码txt中的文字。
不过还是谢谢CRossin先生了
QQ图片20200718211535.jpg
QQ图片20200718211546.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-3-29 00:44 , Processed in 0.016568 second(s), 25 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部