scrapy保存、中断、继续执行爬虫程序

2024-06-28 06:18:15 阅读次数：140

在scrapy文件中的custom_settings写入JOBDIR即可，比如：

'JOBDIR': '../jobs/baidu_news',

baidu_news这个位置就是当程序停止爬虫的时候当前的运行状态就会记录在这个文件中，当再次爬取时会接着保存的状态进行爬取

案例

class BaiduSpiderSpider(CrawlSpider):
    """Get news from 
    """
    name = "baidu_spider"
    allowed_domains = [""]
    stopwords = []
    custom_settings = {
        'HTTPERROR_ALLOWED_CODES': [302, 301],
        'JOBDIR': '../jobs/baidu_news',
    }

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

scrapy保存、中断、继续执行爬虫程序

scrapy保存、中断、继续执行爬虫程序

案例

相关文章

Python学习前简介

python实战三：使用循环while模拟用户登录

python递归遍历路径下的所有文件和文件夹

【python】python进程、线程、协程和什么时候使用

Python 代码混淆和加密技术

python socket编程实例代码（含服务端和客户端）

python mysql模糊查询

基于Tkinter图形化界面实现的学生课堂随机点名系统

Python关于strftime函数详细解析 附实战代码

Python关于isinstance函数的解析 | 附Demo（全）

作者介绍

最新文章

Python学习前简介

【python】python进程、线程、协程和什么时候使用

Python 代码混淆和加密技术

python mysql模糊查询

基于Tkinter图形化界面实现的学生课堂随机点名系统

Python关于strftime函数详细解析 附实战代码

热门文章

Linux实用命令authconfig和authconfig-tui（备忘）

Python高级变量类型

python学习——面向对象编程

一个简单的http server，处理get和post请求，Python实现

Python数据库测试实战教程

Python编程：生成器yield与yield from区别简单理解

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

【Python Practice】Day 6- Question 18-19

数据结构与算法(Python语言)----插入排序算法

SpringBoot集成Swagger2

设计模式(Python语言)----观察者模式

为什么校招面试中“线程与进程的区别”老是被问到?我该如何回答？

Python|GUI编程中组件的布局

Python关于strftime函数详细解析附实战代码

Python关于strftime函数详细解析附实战代码