设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
12
返回列表 发新帖
楼主: 人工智能
打印 上一主题 下一主题

怎么从一些数据里去重呢

[复制链接]

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

6#
发表于 2018-4-9 19:00:59 |只看该作者
zhaolehua 发表于 2018-4-9 13:48
有一个方法就是在存入文件后去重,用正则表达式作为去重条件,满足条件删除重复中的一个。 ...

这些歌名。。我想不出正则怎么写啊
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

5#
发表于 2018-4-9 14:50:22 |只看该作者
人工智能 发表于 2018-4-9 10:35
我需要的是不完全相同的匹配,程序是这个样子  这些歌名是我爬下来的列表 然后我想每往txt存入一个歌名都 ...

你可正反两个方向都用 in 判断一下啊
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

0

主题

0

好友

137

积分

注册会员

Rank: 2

地板
发表于 2018-4-9 13:48:04 |只看该作者
人工智能 发表于 2018-4-9 10:35
我需要的是不完全相同的匹配,程序是这个样子  这些歌名是我爬下来的列表 然后我想每往txt存入一个歌名都 ...

有一个方法就是在存入文件后去重,用正则表达式作为去重条件,满足条件删除重复中的一个。
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

板凳
发表于 2018-4-9 10:35:43 |只看该作者
crossin先生 发表于 2018-4-8 23:01
不是完全相同的不太方便,除非你每个歌名都去匹配一下后面所有的歌,做个对比
如果完全相同的去重,直接用  ...

我需要的是不完全相同的匹配,程序是这个样子  这些歌名是我爬下来的列表 然后我想每往txt存入一个歌名都要和txt之前存入的歌名做判断看看如果存在这个歌就不存,如果没有就把歌名存进去,而且现在的问题是
拿 ‘’告白气球‘’  举例    我先存入了歌名 ‘’告白气球‘’  然后下次一列表获取的值是 ‘’告白气球(魔术与歌曲)‘’
这个我和之前的匹配的话 我怎么能匹配到 ‘’告白气球‘’ 这个字符串呢,  用in没法实现  因为 in 匹配的 后面匹配的字符串 肯定比之前的字符串短或者相等  才能匹配到。
有没有什么办法呢
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2018-4-8 23:01:45 |只看该作者
不是完全相同的不太方便,除非你每个歌名都去匹配一下后面所有的歌,做个对比
如果完全相同的去重,直接用 set 就可以实现
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-5-20 02:51 , Processed in 0.028206 second(s), 21 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部