设为首页收藏本站

Crossin的编程教室

 找回密码
 立即加入
查看: 5508|回复: 1
打印 上一主题 下一主题

用scrapy爬虫抓翻页标签出现问题

[复制链接]

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

楼主
发表于 2017-3-8 17:28:29 |显示全部楼层
[]表示满足某个条件,具体元素应该是 /href 吧

http://www.w3school.com.cn/xpath/xpath_syntax.asp
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

174

主题

45

好友

11万

积分

管理员

Rank: 9Rank: 9Rank: 9

沙发
发表于 2017-3-9 15:15:09 |显示全部楼层
电子菜鸟008 发表于 2017-3-8 19:51
new_url = sel.xpath('//span[@class="nomp"]/a[2]/href').extract_first() 改了之后,抓出来打印的是Non ...

/@href

你先对着文档写点简单的例子,把每个语法试一试。
不然你这一行代码里面牵涉各种语法,都没法调试。
即使调试,也是要一步步去找哪一步出问题,不是没方向的改
#==== Crossin的编程教室 ====#
微信ID:crossincode
网站:http://crossincode.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即加入

QQ|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号  

GMT+8, 2024-5-19 18:37 , Processed in 0.018501 second(s), 22 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部