Crossin的编程教室
标题: 一团乱麻,批量分析提取,求指点迷津 [打印本页]
作者: q2488433945 时间: 2018-4-8 15:39
标题: 一团乱麻,批量分析提取,求指点迷津
苦逼的数据工作,在里面沉陷,
试着做了一个小小的雏形工具:
1、导入杂乱信息的文档
2、把线头理出来
3、批量提取:
企业机关事业单位
地址
联系方式
。。。。。。
以后我们还可以延伸到提取标准,规范的名称,编号等。
但是,做着做着,就不知道怎么往下走了,
各位都是圈子的高手,所以希望能高手提点一下:
1.我们这类识别器还可以朝哪些方向发展
2.哪些地方可以用的到
3.如果我们想朝大数据靠拢,还应该增加哪些功能?
我们自己公司本身不是专业做这方面的,
大家都是圈子的里的人,所以希望各大高人能给与一些提点
作者: crossin先生 时间: 2018-4-8 23:03
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的
作者: q2488433945 时间: 2018-4-9 22:05
crossin先生 发表于 2018-4-8 23:03
爬数据只是手段,后面你要看统计学的东西,从数据里分析出规律得出结论才是目的 ...
感谢老师的关注和回复,目前就是卡在规律上,因为数据源多种,老是会遇到规则与规律有冲突的问题。继续寻求帮助。
欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) |
Powered by Discuz! X2.5 |