设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 6140|回复: 2
打印 上一主题 下一主题

一团乱麻,批量分析提取,求指点迷津

[复制链接]

1

主题

0

好友

15

积分

新手上路

Rank: 1

跳转到指定楼层
楼主
发表于 2018-4-8 15:39:03 |只看该作者 |倒序浏览

苦逼的数据工作,在里面沉陷,

试着做了一个小小的雏形工具:

1、导入杂乱信息的文档

2、把线头理出来

3、批量提取:

企业机关事业单位

地址

联系方式

。。。。。。

以后我们还可以延伸到提取标准,规范的名称,编号等。

但是,做着做着,就不知道怎么往下走了,



各位都是圈子的高手,所以希望能高手提点一下:

1.我们这类识别器还可以朝哪些方向发展

2.哪些地方可以用的到

3.如果我们想朝大数据靠拢,还应该增加哪些功能?



我们自己公司本身不是专业做这方面的,

大家都是圈子的里的人,所以希望各大高人能给与一些提点



回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2018-4-8 23:03:04 |只看该作者
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

1

主题

0

好友

15

积分

新手上路

Rank: 1

板凳
发表于 2018-4-9 22:05:19 |只看该作者
crossin先生 发表于 2018-4-8 23:03
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的 ...

感谢老师的关注和回复,目前就是卡在规律上,因为数据源多种,老是会遇到规则与规律有冲突的问题。继续寻求帮助。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-11-21 21:13 , Processed in 0.023237 second(s), 25 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部