设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 6670|回复: 0
打印 上一主题 下一主题

如何读取机器码和文本混合的文档,从中提取文本部分的内容?

[复制链接]

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

楼主
发表于 2020-9-20 15:47:54 |显示全部楼层
这种文件都是某种软件自己定义的格式,如果你不知道它的规则,或者用专门的库,是没有办法完美读取的,读取了也没法用。

如果你只是需要取出其中的可读文本部分,可以在open里加上参数 errors='ignore' 或者 'replace',会自动替换无法解码的字符

----
你保存成的txt文件就是相当于软件帮你做了这个过程,所以你发上来的txt即使直接打开也不会报错
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-5-7 04:46 , Processed in 0.015508 second(s), 22 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部