scrapy之Spider

时间:2020-04-01 19:56:12   收藏:0   阅读:59

Scrapy爬虫项目运行时,最重要的就是Spider类(spiders文件夹下的爬虫文件)了。

scrapy.spiders.Spider这个类是最简单最基本的Spider类,其他Spider必须继承这个类。

scrapy.spiders.Spider这个类提供了start_requests()方法的默认实现,读取并请求start_urls属性,并根据返回的结果调用parse()方法解析结果。

它还有如下一些基础属性:

除了基础属性,Spider还有一些常用的方法:

原文:https://www.cnblogs.com/codexlx/p/12614939.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!