Crossin的编程教室

标题: 大数据-抓取豆瓣电影的题 如何分离出电影标签? [打印本页]

作者: 今天手气不错啊    时间: 2014-6-8 17:27
标题: 大数据-抓取豆瓣电影的题 如何分离出电影标签?
RT,用urllib2模块获取到了豆瓣电影标签的页面,但不知如何从那么多的HTML中分离出所需要的,貌似要用到正则表达式,但不知如何构建?
作者: crossin先生    时间: 2014-6-9 11:54
用正则
或者beautifulsoup似乎有直接提取的方法,要去查一下用法
作者: 今天手气不错啊    时间: 2014-6-10 09:23
crossin先生 发表于 2014-6-9 11:54
用正则
或者beautifulsoup似乎有直接提取的方法,要去查一下用法

我用的就是beautifulsoup,但是不会啊,求先生赐教!
作者: crossin先生    时间: 2014-6-10 18:21
今天手气不错啊 发表于 2014-6-10 09:23
我用的就是beautifulsoup,但是不会啊,求先生赐教!

好像是.string属性吧
这个网上有很多介绍的吧,搜一下
作者: 今天手气不错啊    时间: 2014-6-12 10:43
crossin先生 发表于 2014-6-10 18:21
好像是.string属性吧
这个网上有很多介绍的吧,搜一下

哦,好吧。多谢先生




欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5