多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
流程: 第一步:创建xxx项目 ~~~ scrapy startproject xxx ~~~ 第二步:创建要抓取的名称及抓取网址 ~~~ scrapy genspider xxx 'http://www.xxx.com' ~~~ 第三步:编写items.py,明确需要提取的数据 第四步:编写spiders/xxx.py 编写爬虫文件,处理请求和响应,以及提取数据(yeild item) 第五步:编写pipelines.py管道文件,处理spider返回item数据 第六步:编写settings.py,启动管理文件,以及其他相关设置 第七步:执行爬虫