Scrapy爬虫数据抓取流程介绍 · Python工具Scrapy爬虫学习

流程：第一步：创建xxx项目 ~~~ scrapy startproject xxx ~~~ 第二步：创建要抓取的名称及抓取网址 ~~~ scrapy genspider xxx 'http://www.xxx.com' ~~~ 第三步：编写items.py，明确需要提取的数据第四步：编写spiders/xxx.py 编写爬虫文件，处理请求和响应，以及提取数据（yeild item）第五步：编写pipelines.py管道文件，处理spider返回item数据第六步：编写settings.py，启动管理文件，以及其他相关设置第七步：执行爬虫