JavaEE: 深入解析HTTP协议的奥秘(2)-天翼云

JavaEE: 深入解析HTTP协议的奥秘(2)

2024-11-07 07:57:16 阅读次数：31

HTTP

认识 URL

平时我们俗称的"网址"其实就是说的 URL .(唯一资源定位符)

URL 不是 HTTP 专属的,很多协议都会用到.

其实除了 URL,还有一个叫 URI(大写的 i )的.(唯一资源标识符).

我们可以简单的理解成, URL 是
URI 的一种实现,实际上,在日常开发中,一般也不会刻意区分 URL 和 URI 这俩概念~
JavaEE: 深入解析HTTP协议的奥秘(2)

一个具体的 URL:

https:///personInf/student?userId=10000&classId=100

https : 协议方案名.常见的有 http 和 https,也有其他的类型.(例如访问 mysql 时用的 jdbc:mysql)
user:pass : 登录信息.现在的网站进行身份认证一般不会再通过 URL 进行了.一般都会省略.
: 服务器地址,此处是一个"域名",域名会通过 DNS 系统解析成一个具体的 IP 地址.
端口号 : 上面的 URL 中端口号被忽略了.当端口号省略的时候,浏览器会根据协议类型自动决定使用哪个端口.

http 协议默认使用 80 端口.
https 协议默认使用 443 端口.
/personInf/student : 带层次的文件路径.
userId=10000&classId=100 : 查询字符串(query string).本质是一个键值对结构.键值对之间使用 & 分隔.键和值之间使用 = 分隔.

query string 中的 key 和 value 的取值和个数,完全都是程序员自己约定的.我们可以通过这样的方式来自定制传输我们需要的信息给服务器.
片段标识 : 次 URL 中省略了片段标识.片段标识主要用于页面跳转.

URL encode 介绍

像 / ? : 等这样的字符,已经被 url 当做特殊意义理解了.因此这些字符不能随意出现.

如果某个参数中需要带有这些特殊字符,就必须先对特殊字符进行转义.

一个中文字符由 UTF-8 或者 GBK 这样的编码方式构成,虽然在 URL 中没有特殊含义,但是仍然需要进行转义.否则浏览器可能吧 UTF-8/GBK 编码中的某个字节当做 URL 中的特殊符号.

转义的规则如下: 把要转的符号/汉字,每个字节以十六进制的方式表示出来,然后从右到左,取4位(不足4位直接处理),每2位做1位,前面加上 %,编码成 %XY 格式.

举个栗子:
JavaEE: 深入解析HTTP协议的奥秘(2)
日常开发的时候,大多数情况下不需要我们手动处理转码.
日常使用的一些库(无论是前端的还是后端的)一般都是自带了 url encode / decode 的功能的.

认识 “方法”(method)

HTTP 的方法~
方法就是描述了这个 HTTP 请求的"动作"要干啥.

GET 从服务器拿到一个 XXX 数据.
POST 向服务器发送一个 XXX 数据.
JavaEE: 深入解析HTTP协议的奥秘(2)

GET

GET 是最常用的 HTTP 方法.常用于获取服务器上的某个资源.

直接在浏览器中输入一个 URL,此时就会触发 GET 请求.
HTML 页面中的很多元素会进一步触发 GET 请求.

举个例子: 在搜狗主页按 Ctrl + F5

直接按 F5 与按 Ctrl + F5 相比,少了很多东西,这是为啥?
答: 按 Ctrl + F5 会忽略缓存,强制从服务器重新获取数据.
浏览器都缓存了啥?
答: 主要是一些 CSS 文件,JavaScript 文件,图片文件,字体文件等等(这些内容一般是固定的,改变频率非常低,所以只需要在第一次访问搜狗主页的时候,把上述固定的资源都保存到硬盘上,后续再访问搜狗,就没必要重复获取上述的内容了)
浏览器缓存,节省了服务器的带宽,并且加快了页面的展示速度~
JS代码中也能触发 GET 请求.

POST

POST 请求的场景.

登录/注册
上传文件
比如说在 Gitee 上,上传一个头像图片.

这里的 Body 中的内容,就是头像图片的二进制内容(base64 转码后的内容)
图片本身是二进制的, HTTP 协议虽然也能传输二进制,但是很多时候,也会把二进制数据进行转码(不一定用 urlencode(转码后的体积太大了),还有一种转码方式,base64 编码(另一种把二进制转成文本的方式))

除此之外, POST 也有很多其他的场景.

其实,HTTP 中的 GET 和 POST 很多时候都是可以通用的.

一个经典面试题: GET 和 POST 的区别.

首先,明确抛出结论,这两个方法,其实没有本质区别(GET 能用的场景,换成 POST 也成; POST 能用的场景,换 GET,也不是不行)

但是,没有本质区别,不代表没有区别,在使用习惯上还是有区别的~

语义不同.
GET 表示从服务器获取数据.
POST 表示往服务器提交数据.
传递数据的方式不同.
GET 传递数据,通常是通过 query string 把自定义数据交给服务器.
POST 传递数据,通常是通过 Body 把自定义的数据交给服务器.
GET 方法对应的请求,通常设计成"幂等"的.
POST 方法对应的请求,对应"幂等性"则无要求.
以上是HTTP标准文档建议的做法,但是这个区别放在今天不是特别合适了.实际上,幂等不幂等更多的是看业务要求,和方法其实关系不大.

幂等是啥?
举个例子:
承接幂等性
GET 如果设计成幂等的,此时 GET 的结果是可以被缓存的.
POST 不设计成幂等性,POST就不应该被缓存.

关于 GET 和 POST 的差别,网上还有一些说法:

有些资料说, POST 比 GET 更安全.

我觉得,上述说法,有些勉强了,安全性核心,在于针对密码进行加密.
把密码明文传输,即使你是 post ,此时还是不安全,只是不直接显示了,但是黑客稍微抓个包,很容易获取到~
关于传输的数据量
网上有个说法, GET 请求能够传输的数据量有上限.(GET 通过 URL 的 query string 传数据)并且 URL 长度存在上限.

POST 则可以传输更大的数据, Body 这里的长度没有限制~

HTTP 协议标准上,并没有规定 URL 的长度,之所以有长度上限的说法,是在上古时期的 IE 浏览器,实现的过程中引入的限制.
咱们现在是 2024 年, IE 浏览器早就完了.
传输数据类型
GET 只能传输文本数据.
POST 可以传输文本,也能传输二进制.

GET 也能传二进制:
1. 基于 query string, 可以把二进制进行 urlencode / base64 转码
2. 给 get 添加 body,并确保使用的库(客户端,服务器)都能支持这种用法即可.

其他方法

PUT 与 POST 相似,只是具有幂等特性,一般用于更新.
DELETE 删除服务器指定资源.
OPTIONS 返回服务器所支持的请求方法.
HEAD 类似于 GET ,只不过响应体不返回,只返回响应头.
TRACE 回显服务器端收到的请求,测试的时候会用到这个.
CONNECT 预留,暂无使用.

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

JavaEE: 深入解析HTTP协议的奥秘(2)

JavaEE: 深入解析HTTP协议的奥秘(2)

HTTP

认识 URL

URL encode 介绍

认识 “方法”(method)

GET

POST

其他方法

相关文章

HashTeam web_浑元形意 writeup

在Java、Java Web中放置图片、视频、音频、图像文件的方法

django从入门到实战（一）——路由的编写规则与使用

django从入门到实战(三)——CBV视图介绍

curl get,post, patch,delete请求封装

路由实现原理

算法实战：快速找到100亿个URL中的重复项！

js 实现视频封面截图

【网络攻击】慢速连接攻击和处理方式

【Java面试题】SpringMVC

作者介绍

最新文章

在Java、Java Web中放置图片、视频、音频、图像文件的方法

【Java面试题】SpringMVC

Vue学习笔记：路由开发 Part 01

PHP 伪静态详解及实现方法

Python之URL

基于 Spring Security URL 级别的安全访问控制

热门文章

URL网络编程

PHP 伪静态详解及实现方法

网络通信第四课 C++发送Post请求的完整案例

网络通信第一课 C++封装HTTP请求报文说明

从PHP开始学渗透 -- GET请求和POST请求

基于 Spring Security URL 级别的安全访问控制

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

基于 Spring Security URL 级别的安全访问控制

从PHP开始学渗透 -- GET请求和POST请求

URL网络编程

Python之URL

Vue学习笔记：路由开发 Part 01

网络通信第一课 C++封装HTTP请求报文说明