Crossin的编程教室

标题: NLP进行文本挖掘，求大神指导 [打印本页]

作者: sdlx550 时间: 2018-4-22 11:32
标题: NLP进行文本挖掘，求大神指导
现在有些杂乱的数据（评价报告），我需要从中找出后果、原因、措施等项目，并对其进行可信度评判，但是现在没有头绪，希望大神们能给予指导~

作者: crossin先生 时间: 2018-4-22 18:14
你这个难度有点大啊，这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议

作者: sdlx550 时间: 2018-4-22 18:50

crossin先生发表于 2018-4-22 18:14
你这个难度有点大啊，这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议 ...

请问这个属于什么层面的问题呢，我应该如何去找突破口呢

作者: crossin先生 时间: 2018-4-23 11:40

sdlx550 发表于 2018-4-22 18:50
请问这个属于什么层面的问题呢，我应该如何去找突破口呢

说实话，听你这个描述我也没有头绪，我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了，你这个要分析后果、原因、措施……
那你首先如何定义这些呢？定义之后又如何建模，让程序能够理解。

如果我没有理解错的话，我感觉这是一个可以发论文级别的问题……

除非，你这个报告有严格的格式，或者特殊的规律，那么就只是文字处理的工作了，就简单多了。但这就不是NLP了

作者: sdlx550 时间: 2018-4-24 14:03

crossin先生发表于 2018-4-23 11:40
说实话，听你这个描述我也没有头绪，我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了， ...

我现在人工找出了这些后果、原因等，之后我想用Python进行相似语句的合并，这个可以实现吗，运用什么方法实现比较简捷呢

作者: crossin先生 时间: 2018-4-25 15:11

sdlx550 发表于 2018-4-24 14:03
我现在人工找出了这些后果、原因等，之后我想用Python进行相似语句的合并，这个可以实现吗，运用什么方法 ...

了解下文本相似度匹配
Levenshtein，gensim 之类

作者: sdlx550 时间: 2018-4-25 16:15
我看这些基本上都是针对英文的，中文的实现效果如何呢？有针对中文的吗

作者: crossin先生 时间: 2018-4-25 23:13
具体我没有深入过

欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/)