设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 4366|回复: 1
打印 上一主题 下一主题

相似文本合并

[复制链接]

9

主题

1

好友

67

积分

注册会员

Rank: 2

跳转到指定楼层
楼主
发表于 2018-4-28 18:59:51 |只看该作者 |正序浏览
我现在用tf-IDF求出了各短文本之间的相似度,之后我想将相似度高于某一阈值的短文本进行合并(就是整理成一个短文本),接下来应该怎么做呢,求各位大佬指教~
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2018-4-29 13:14:05 |只看该作者
你这问的也太抽象了
那也只能抽象地给你个回答:
遍历所有文本,删掉与之相似度超过阈值的后续文本
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-11-22 04:05 , Processed in 0.013705 second(s), 21 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部