设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 5497|回复: 2
打印 上一主题 下一主题

提取英语单词

[复制链接]

1

主题

0

好友

17

积分

新手上路

Rank: 1

跳转到指定楼层
楼主
发表于 2020-7-17 16:06:10 |只看该作者 |倒序浏览
求各位大神们指导一下!!!
import re   #载入正则表达式模块

f1 = open('form.txt',encoding='utf-8')  #这里因为无法读文字就加上encoding

data = f1.read()

f1.close()

#打开文件,读入文本

result = re.findall('[A-Za-z]', data)    #用正则表达式中的findall方法

#找出data中所有从A-Za-z的连续字符

result.sort()

#把得到的结果字符串list排序,默认为字典序

data = ' '.join(result)

#把排序后的结果用换行符连接成一段文本

f2 = open('to.txt', 'w')

f2.write(data)

f2.close()

#输出到文件中
输出的怎么是一个个字母而不是单词
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2020-7-17 16:15:42 |只看该作者
正则没写对,把一开始拿到的result输出出来看看
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

1

主题

0

好友

17

积分

新手上路

Rank: 1

板凳
发表于 2020-7-18 21:09:37 来自手机 |只看该作者
本帖最后由 爱了101 于 2020-7-18 21:27 编辑

我直接将源码复制过去了,然后就这样了,不过加上encoding='utf-8'好像就好了,网上说好像是gbk编码器无法编码txt中的文字。
不过还是谢谢CRossin先生了

QQ图片20200718211535.jpg (295.87 KB, 下载次数: 469)

QQ图片20200718211535.jpg

QQ图片20200718211546.jpg (424.87 KB, 下载次数: 471)

QQ图片20200718211546.jpg

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-12-4 01:56 , Processed in 0.015998 second(s), 23 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部