设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 6185|回复: 7
打印 上一主题 下一主题

NLP进行文本挖掘,求大神指导

[复制链接]

9

主题

1

好友

67

积分

注册会员

Rank: 2

跳转到指定楼层
楼主
发表于 2018-4-22 11:32:03 |只看该作者 |倒序浏览
现在有些杂乱的数据(评价报告),我需要从中找出后果、原因、措施等项目,并对其进行可信度评判,但是现在没有头绪,希望大神们能给予指导~
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2018-4-22 18:14:29 |只看该作者
你这个难度有点大啊,这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

9

主题

1

好友

67

积分

注册会员

Rank: 2

板凳
发表于 2018-4-22 18:50:06 |只看该作者
crossin先生 发表于 2018-4-22 18:14
你这个难度有点大啊,这不是简单编程层面的问题了。
我觉得我们这儿很难能有人给你建议 ...

请问这个属于什么层面的问题呢,我应该如何去找突破口呢
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

地板
发表于 2018-4-23 11:40:43 |只看该作者
sdlx550 发表于 2018-4-22 18:50
请问这个属于什么层面的问题呢,我应该如何去找突破口呢

说实话,听你这个描述我也没有头绪,我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了,你这个要分析后果、原因、措施……
那你首先如何定义这些呢?定义之后又如何建模,让程序能够理解。

如果我没有理解错的话,我感觉这是一个可以发论文级别的问题……

除非,你这个报告有严格的格式,或者特殊的规律,那么就只是文字处理的工作了,就简单多了。但这就不是NLP了
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

9

主题

1

好友

67

积分

注册会员

Rank: 2

5#
发表于 2018-4-24 14:03:17 |只看该作者
crossin先生 发表于 2018-4-23 11:40
说实话,听你这个描述我也没有头绪,我觉得这很难实现
现在一般的NLP库能把情绪识别做好就已经很不错了, ...

我现在人工找出了这些后果、原因等,之后我想用Python进行相似语句的合并,这个可以实现吗,运用什么方法实现比较简捷呢
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

6#
发表于 2018-4-25 15:11:43 |只看该作者
sdlx550 发表于 2018-4-24 14:03
我现在人工找出了这些后果、原因等,之后我想用Python进行相似语句的合并,这个可以实现吗,运用什么方法 ...

了解下文本相似度匹配
Levenshtein,gensim 之类
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

9

主题

1

好友

67

积分

注册会员

Rank: 2

7#
发表于 2018-4-25 16:15:38 |只看该作者
我看这些基本上都是针对英文的,中文的实现效果如何呢?有针对中文的吗
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

8#
发表于 2018-4-25 23:13:04 |只看该作者
具体我没有深入过
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-12-4 01:49 , Processed in 0.015190 second(s), 20 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部