- 帖子
- 5
- 精华
- 0
- 积分
- 48
- 阅读权限
- 10
- 注册时间
- 2015-6-27
- 最后登录
- 2015-8-6
|
打印出结果,发现只有 20 条。又查了下文档,原来 Top250 接口还有两个可选参数:start 和 count,表示从第几位开始取,取多少条。
那么把代码调整下,外面增加一层循环。为了避免连续请求太快,在每次循环中,通过 time.sleep 方法停顿 3 秒钟。另外,把取到的电影 id 都存入一个变量中:
import urllib
import json
import time
movie_ids = []
for index in range(0, 250 ,50):
print index
response = urllib.urlopen('http://api.douban.com/v2/movie/top250?start=%d&count=50' % index)
data = response.read()
# print data
data_json = json.loads(data)
movie250 = data_json['subjects']
for movie in movie250:
movie_ids.append(movie['id'])
print movie['id'], movie['title']
time.sleep(3)
print movie_ids
老师,这里不太理解外面增加一层循环是什么意思。
代码运行后只是前20条在不停重复,怎么办? |
|