Crossin的编程教室

标题: NLP进行文本挖掘,求大神指导 [打印本页]

作者: sdlx550    时间: 2018-4-22 11:32
标题: NLP进行文本挖掘,求大神指导
现在有些杂乱的数据(评价报告),我需要从中找出后果、原因、措施等项目,并对其进行可信度评判,但是现在没有头绪,希望大神们能给予指导~

作者: crossin先生    时间: 2018-4-22 18:14
你这个难度有点大啊,这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议
作者: sdlx550    时间: 2018-4-22 18:50
crossin先生 发表于 2018-4-22 18:14
你这个难度有点大啊,这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议 ...

请问这个属于什么层面的问题呢,我应该如何去找突破口呢
作者: crossin先生    时间: 2018-4-23 11:40
sdlx550 发表于 2018-4-22 18:50
请问这个属于什么层面的问题呢,我应该如何去找突破口呢

说实话,听你这个描述我也没有头绪,我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了,你这个要分析后果、原因、措施……
那你首先如何定义这些呢?定义之后又如何建模,让程序能够理解。

如果我没有理解错的话,我感觉这是一个可以发论文级别的问题……

除非,你这个报告有严格的格式,或者特殊的规律,那么就只是文字处理的工作了,就简单多了。但这就不是NLP了
作者: sdlx550    时间: 2018-4-24 14:03
crossin先生 发表于 2018-4-23 11:40
说实话,听你这个描述我也没有头绪,我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了, ...

我现在人工找出了这些后果、原因等,之后我想用Python进行相似语句的合并,这个可以实现吗,运用什么方法实现比较简捷呢
作者: crossin先生    时间: 2018-4-25 15:11
sdlx550 发表于 2018-4-24 14:03
我现在人工找出了这些后果、原因等,之后我想用Python进行相似语句的合并,这个可以实现吗,运用什么方法 ...

了解下文本相似度匹配
Levenshtein,gensim 之类
作者: sdlx550    时间: 2018-4-25 16:15
我看这些基本上都是针对英文的,中文的实现效果如何呢?有针对中文的吗
作者: crossin先生    时间: 2018-4-25 23:13
具体我没有深入过




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5