Crossin的编程教室

标题: 相似文本合并 [打印本页]

作者: sdlx550    时间: 2018-4-28 18:59
标题: 相似文本合并
我现在用tf-IDF求出了各短文本之间的相似度,之后我想将相似度高于某一阈值的短文本进行合并(就是整理成一个短文本),接下来应该怎么做呢,求各位大佬指教~

作者: crossin先生    时间: 2018-4-29 13:14
你这问的也太抽象了
那也只能抽象地给你个回答:
遍历所有文本,删掉与之相似度超过阈值的后续文本




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5