python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）-天翼云

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）

2025-02-21 08:57:46 阅读次数：9

区分网页请求GET or POST

GET，请求指定的页面信息，并返回实体主体。

POST，向指定资源提交数据进行处理请求（例如提交表单或者上传文件）。数据是全部被包含在请求体当中了。

get方法的特点

get是主动缓存的，它具有安全性、幂等性

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）

post方法的特点

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等） 当然啦，对于我们爬虫来说，这些概念并不重要，重要的是：

请求不同，信息的传递方式也不同，尤其是cookies。

网页返回状态码

200

正常的网页当然是返回200啦：

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）

非200

也有可能返回一些不是200的状态码，注意！非200的状态也有可能可以访问，只是大部分非200的状态代表了异常，拒绝了你的访问请求。

常见网页状态码
状态码Status Code	是否能访问	含义
200	可以访问	（成功）服务器已成功处理了请求。通常，这表示服务器提供了请求的网页。
202	可以访问	（已接受）服务器已接受请求，但尚未处理。
203	可以访问	（非授权信息）服务器已成功处理了请求，但返回的信息可能来自另一来源。
300	无法访问	（多种选择）针对请求，服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作，或提供操作列表供请求者选择。
301	无法访问	（永久移动）请求的网页已永久移动到新位置。服务器返回此响应（对 GET 或 HEAD 请求的响应）时，会自动将请求者转到新位置。
302	无法访问	（临时移动）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。
400	无法访问	（错误请求）服务器不理解请求的语法。
401	无法访问	（未授权）请求要求身份验证。对于需要登录的网页，服务器可能返回此响应。
403	无法访问	（禁止）服务器拒绝请求。
404	无法访问	（未找到）服务器找不到请求的网页。
406	无法访问	（不接受）无法使用请求的内容特性响应请求的网页。
500	无法访问	（服务器内部错误）服务器遇到错误，无法完成请求。
502	无法访问	（错误网关）服务器作为网关或代理，从上游服务器收到无效响应。
503	无法访问	（服务不可用）服务器目前无法使用（由于超载或停机维护）。一般只是暂时状态。

当出现401、403这些状态的时候，就去检查你的headers或者cookies吧。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）

python爬虫 - GET和POST分别对爬取的网页状态的影响以及常见网页状态码（200、401、402、404等等）

get方法的特点

post方法的特点

网页返回状态码

200

非200

相关文章

Python爬虫应用指南之基础知识

TF-IDF：概念与python实现

突发性异步队列堵塞的解决方案（队列按照优先级分配资源）

JumpServer各种用户的关联与管理

小课2：筛选信息命令

fileDownload 插件send payload形式的post请求

curl get,post, patch,delete请求封装

对称加密、非对称加密在https中的应用

使用 Axios 拦截器优化 HTTP 请求与响应的实践

动态圣诞树html网页完整代码

作者介绍

最新文章

JumpServer各种用户的关联与管理

小课2：筛选信息命令

数据库小白变大咖：社招面试MySQL高可用问题解决攻略！

XSS攻击和CSRF攻击解析

SQL Server 服务器配置

【有序集合 堆 优先队列】1606. 找到处理最多请求的服务器|2275

热门文章

用ftp服务器进行yum源的设置

Confluence 6 配置服务器基础地址

linux环境日志排查，cat命令关键字查找、最近1000条、定位到指定位置

linux中常见工具安装问题集锦

Mac 终端连接linux程服务器并相互传输文件

Ubuntu18.04搭建Web服务器

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

SVN添加忽略

Ubuntu安装SSH服务

Packet Tracer －配置 SSH

Nginx学习笔记4

Linux：jumpserver介绍（1）

高防服务器的工作原理

【有序集合堆优先队列】1606. 找到处理最多请求的服务器|2275