Crossin的编程教室

标题: 提取英语单词 [打印本页]

作者: 爱了101    时间: 2020-7-17 16:06
标题: 提取英语单词
求各位大神们指导一下!!!
import re   #载入正则表达式模块

f1 = open('form.txt',encoding='utf-8')  #这里因为无法读文字就加上encoding

data = f1.read()

f1.close()

#打开文件,读入文本

result = re.findall('[A-Za-z]', data)    #用正则表达式中的findall方法

#找出data中所有从A-Za-z的连续字符

result.sort()

#把得到的结果字符串list排序,默认为字典序

data = ' '.join(result)

#把排序后的结果用换行符连接成一段文本

f2 = open('to.txt', 'w')

f2.write(data)

f2.close()

#输出到文件中
输出的怎么是一个个字母而不是单词

作者: crossin先生    时间: 2020-7-17 16:15
正则没写对,把一开始拿到的result输出出来看看
作者: 爱了101    时间: 2020-7-18 21:09
本帖最后由 爱了101 于 2020-7-18 21:27 编辑

我直接将源码复制过去了,然后就这样了,不过加上encoding='utf-8'好像就好了,网上说好像是gbk编码器无法编码txt中的文字。
不过还是谢谢CRossin先生了

QQ图片20200718211535.jpg (295.87 KB, 下载次数: 435)

QQ图片20200718211535.jpg

QQ图片20200718211546.jpg (424.87 KB, 下载次数: 439)

QQ图片20200718211546.jpg






欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5