Crossin的编程教室

标题: 一团乱麻,批量分析提取,求指点迷津 [打印本页]

作者: q2488433945    时间: 2018-4-8 15:39
标题: 一团乱麻,批量分析提取,求指点迷津

苦逼的数据工作,在里面沉陷,

试着做了一个小小的雏形工具:

1、导入杂乱信息的文档

2、把线头理出来

3、批量提取:

企业机关事业单位

地址

联系方式

。。。。。。

以后我们还可以延伸到提取标准,规范的名称,编号等。

但是,做着做着,就不知道怎么往下走了,



各位都是圈子的高手,所以希望能高手提点一下:

1.我们这类识别器还可以朝哪些方向发展

2.哪些地方可以用的到

3.如果我们想朝大数据靠拢,还应该增加哪些功能?



我们自己公司本身不是专业做这方面的,

大家都是圈子的里的人,所以希望各大高人能给与一些提点




作者: crossin先生    时间: 2018-4-8 23:03
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的
作者: q2488433945    时间: 2018-4-9 22:05
crossin先生 发表于 2018-4-8 23:03
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的 ...

感谢老师的关注和回复,目前就是卡在规律上,因为数据源多种,老是会遇到规则与规律有冲突的问题。继续寻求帮助。




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5