设为首页收藏本站

开启辅助访问切换到窄版

论坛BBS

Crossin的编程教室»论坛 › Python › 爬虫 › 爬虫自动爬到其他网页上是怎么回事

发新帖

查看: 6553|回复: 5

上一主题

下一主题

爬虫自动爬到其他网页上是怎么回事

22 主题	6 好友	242 积分

Rank: 3 Rank: 3

发消息

电梯直达

跳转到指定楼层

楼主

发表于 2018-4-25 22:28:38 |只看该作者 |倒序浏览

刚开始在看爬虫介绍的时候，说爬虫自己从页面中找到其他页面的入口（url）然后再进到这个页面里爬这个页面的东西，像这样的从一个网页爬到另一个网页这是自动爬取的？
还是说是人工在程序里编程的时候先获取到这个页面的所有url，再写段代码爬取这些url页面然后再手动获取这个页面里的url 再写段代码爬这些新得到的url，然后如此反复。
不管是requests 还是scrapy 哪个都好，关于这个从一个页面再爬到其他页面这个操作是程序自动完成的还是我们自己手动编写代码实现的啊

回复

使用道具举报

174 主题	45 好友	11万积分

Rank: 9 Rank: 9 Rank: 9

发消息

沙发

发表于 2018-4-25 23:15:34 |只看该作者

看你自己的目的啊，如果你就要随意去抓所有页面，那当然自动去抓
如果你有目的就是要抓某类链接，那就按需求去开发

#==== Crossin的编程教室 ====#
微信ID：crossincode
网站：http://crossincode.com

回复

使用道具举报

22 主题	6 好友	242 积分

Rank: 3 Rank: 3

发消息

板凳

发表于 2018-4-26 00:20:48 |只看该作者

crossin先生发表于 2018-4-25 23:15
看你自己的目的啊，如果你就要随意去抓所有页面，那当然自动去抓
如果你有目的就是要抓某类链接，那就按需 ...

随意抓所有页面，自动抓这个是怎么实现的什么原理是scrapy框架里自带的功能吗

回复

使用道具举报

174 主题	45 好友	11万积分

Rank: 9 Rank: 9 Rank: 9

发消息

地板

发表于 2018-4-26 13:59:45 |只看该作者

人工智能发表于 2018-4-26 00:20
随意抓所有页面，自动抓这个是怎么实现的什么原理是scrapy框架里自带的功能吗 ...

把页面上的链接提取出来

#==== Crossin的编程教室 ====#
微信ID：crossincode
网站：http://crossincode.com

回复

使用道具举报

22 主题	6 好友	242 积分

Rank: 3 Rank: 3

发消息

5^#

发表于 2018-4-26 19:05:14 |只看该作者

crossin先生发表于 2018-4-26 13:59
把页面上的链接提取出来

嗯，说到底还是人工操作的啊

回复

使用道具举报

174 主题	45 好友	11万积分

Rank: 9 Rank: 9 Rank: 9

发消息

6^#

发表于 2018-4-27 12:26:03 |只看该作者

人工智能发表于 2018-4-26 19:05
嗯，说到底还是人工操作的啊

这个，就一行代码吧

#==== Crossin的编程教室 ====#
微信ID：crossincode
网站：http://crossincode.com

回复

使用道具举报

发新帖

|手机版|Archiver|Crossin的编程教室 ( 苏ICP备15063769号 )

GMT+8, 2024-11-22 07:03 , Processed in 0.023538 second(s), 23 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部