Scrapy框架学习第二天

时间：2017-11-04 22:09:55 收藏：0 阅读：224

编写scrapy爬虫的具体流程
最初：分析网站页面需要爬取的结构
第一步：创建scrapy项目：scrapy startproject +文件名
第二步：打开项目
第三步：编写items.py
第四步：创建爬虫文件（基础爬虫文件创建指令：scrapy genspider + 爬虫名 +"网站名"）
第五步：编写文件
第六步：编写管道文件（piplines.py）
第七步：修改setting.py文件（设置爬虫文件必须的功能）

小知识点：linux中 tree是树形结构显示文件结构

原文：http://www.cnblogs.com/mly666/p/7784698.html