设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 24297|回复: 14
打印 上一主题 下一主题

怎么从一些数据里去重呢

[复制链接]

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

跳转到指定楼层
楼主
发表于 2018-4-8 21:07:32 |只看该作者 |正序浏览
quchong.png
我想爬取这个列表里的歌但是这个列表里有重复的歌,我该如何把再次出现的歌名去重去掉呢
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

15#
发表于 2018-4-12 21:41:08 |只看该作者
crossin先生 发表于 2018-4-12 11:37
我已经写出来给你了

你还是对字符串、list之类的基本操作不熟悉啊。请去看看之前的基础课程 ...

嗯嗯
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

14#
发表于 2018-4-12 11:37:06 |只看该作者
人工智能 发表于 2018-4-11 23:08
打错了。。。    if (a in list)or (list in a):

我的意思是 list是个列表类型 然后 上面的语句能 ...

我已经写出来给你了

你还是对字符串、list之类的基本操作不熟悉啊。请去看看之前的基础课程
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

13#
发表于 2018-4-11 23:08:11 |只看该作者
crossin先生 发表于 2018-4-11 21:46
for i in list_name:
   if a in i or i in a:
      xxx

打错了。。。    if (a in list)or (list in a):

我的意思是 list是个列表类型 然后 上面的语句能用吗  
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

12#
发表于 2018-4-11 21:46:54 |只看该作者
人工智能 发表于 2018-4-11 14:54
这个方法适用于列表吗 比如 list[---]  然后 for (a in list)or (list in a):  这样不能用吧 ...

for i in list_name:
   if a in i or i in a:
      xxx

如果你连 if 和 for 循环还没搞清楚,那应该先补一补前面基础的课程,而不是急于实现过于复杂的功能
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

11#
发表于 2018-4-11 14:54:16 |只看该作者
crossin先生 发表于 2018-4-11 12:02
把已有数据放in前面判断一次,再把已有数据放in后面判断一次

a = "告白气球"

这个方法适用于列表吗 比如 list[---]  然后 for (a in list)or (list in a):  这样不能用吧
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

10#
发表于 2018-4-11 12:02:41 |只看该作者
把已有数据放in前面判断一次,再把已有数据放in后面判断一次

a = "告白气球"
b = "告白气球(魔术与歌曲)"
if (a in b) or (b in a):
    略过

不符合你的要求?

首先你规则想清楚了没有。不然我们讨论了半天,你说这不是你要的效果

再复杂的情况你也没法用简单的字符串方法。去搜索下“文本相似度匹配”来实现吧
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

9#
发表于 2018-4-10 17:31:38 |只看该作者
crossin先生 发表于 2018-4-9 23:19
前面的 in 后面的 and 后面的 in 前面的

好像我的数据没法用这种办法去重
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

8#
发表于 2018-4-9 23:19:54 |只看该作者
人工智能 发表于 2018-4-9 19:02
什么意思啊 没明白

前面的 in 后面的 and 后面的 in 前面的
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

22

主题

6

好友

242

积分

中级会员

Rank: 3Rank: 3

7#
发表于 2018-4-9 19:02:05 |只看该作者
crossin先生 发表于 2018-4-9 14:50
你可正反两个方向都用 in 判断一下啊

什么意思啊 没明白
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-11-23 13:27 , Processed in 0.016883 second(s), 24 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部