Python之scrapy的post请求、日志和代理-天翼云

Python之scrapy的post请求、日志和代理

2024-08-08 09:40:21 阅读次数：33

1. post请求

1、重写start_requests方法：

def start_requests(self)

2、start_requests的返回值：

scrapy.FormRequest(url=url, headers=headers, callback=self.parse_item, formdata=data) 		
	url: 要发送的post地址 
	headers：可以定制头信息 
	callback: 回调函数 
	formdata: post所携带的数据，这是一个字典

使用

# 创建项目
scrapy startproject scrapy_post
cd scrapy_post/scrapy_post/spiders
scrapy genspider testpost

testpost.py

import scrapy

import json

class TestpostSpider(scrapy.Spider):
    name = 'testpost'
    allowed_domains = ['']

    # post请求 如果没有参数 那么这个请求将没有任何意义
    # 所以start_urls 也没有用了
    # parse方法也没有用了
    # start_urls 
    #
    # def parse(self, response):
    #     pass

    # def parse(self, response):
    #     pass
    def start_requests(self):
        url 

        data = {
            'kw': 'final'
        }

        yield scrapy.FormRequest(url=url, formdata=data, callback=self.parse_second)

    def parse_second(self, response):
        content = response.text
        obj = json.loads(content, encoding='utf-8')

        print(obj)

Python之scrapy的post请求、日志和代理

2. 日志信息和日志等级

日志级别：

CRITICAL：严重错误
ERROR：一般错误
WARNING：警告
INFO: 一般信息
DEBUG：调试信息

默认的日志等级是DEBUG ，只要出现了DEBUG或者DEBUG以上等级的日志，那么这些日志将会打印

settings.py文件设置：

默认的级别为DEBUG，会显示上面所有的信息。在配置文件中 settings.py

LOG_FILE : 将屏幕显示的信息全部记录到文件中，屏幕不再显示，注意文件后缀一定是.log
LOG_LEVEL: 设置日志显示的等级，就是显示哪些，不显示哪些

3. 代理

1、settings.py中，打开选项

DOWNLOADER_MIDDLEWARES = { 
    'postproject.middlewares.Proxy': 543, 
}

2、middlewares.py中使用代理

def process_request(self, request, spider): 
    request.meta['proxy'] 
    return None

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

Python之scrapy的post请求、日志和代理

Python之scrapy的post请求、日志和代理

1. post请求

使用

2. 日志信息和日志等级

3. 代理

相关文章

python打印宝塔代码

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

python简单介绍及基础知识（一）

视频 | Python测试开发之调试print代码实例

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

python性能测试之pyperformance

IronPython 与 c# 交互之导入Python模块的两种方法

Python网络爬虫真实的URL看来真不能光凭着XHR找

如何在交互式环境中执行Python程序

作者介绍

最新文章

python打印宝塔代码

python四种抽样方法的使用：随机抽样、聚类抽样、系统抽样、分层抽样

视频 | Python测试开发之调试print代码实例

python简单介绍及基础知识（一）

使用Python扩展PAM（part 2）

1行Python代码，把Excel转成PDF，python-office功能更新~

热门文章

Java学习之算术运算符两只老虎

Linux实用命令authconfig和authconfig-tui（备忘）

Python高级变量类型

python学习——面向对象编程

一个简单的http server，处理get和post请求，Python实现

Python数据库测试实战教程

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

二十四种场景全方位解读Python装饰器的用法

Python之求阶乘

python的发展史

解压特定zip压缩文件中特定文件，Java

Redis系列（6）- 通用使用场景

114Echarts - 盒须图（Multiple Categories）