五种IO模型
IO的本质就是 = 等 + 拷贝
, 因为读写条件不满足,会阻塞,等待满足后才可读写。
五种IO模型分类
- 其中,
阻塞,非阻塞,信号驱动,多路复用多路转接
都是同步IO
。
阻塞IO
-
阻塞 IO: 在内核将数据准备好之前, 系统调用会一直等待.
所有的套接字, 默认都是阻塞方式
。 -
阻塞 IO 是最常见的 IO 模型
非阻塞 IO
- 非阻塞 IO: 如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回
EWOULDBLOCK
错误码. 非阻塞 IO 往往需要程序员循环的方式反复尝试读写文件描述符, 这个过程称为轮询
. 这对 CPU 来说是较大的浪费, 一般只有特定场景下才使用.
信号驱动 IO
- 信号驱动 IO: 内核将数据准备好的时候, 使用 SIGIO 信号通知应用程序进行 IO操作.
IO 多路转接
- IO 多路转接: 虽然从流程图上看起来和阻塞 IO 类似. 实际上最核心在于
IO 多路转接能够同时等待多个文件描述符的就绪状态
.
异步 IO
- 异步 IO: 由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据).
小结
- 任何 IO 过程中, 都包含两个步骤.
第一是等待, 第二是拷贝
. 而且在实际的应用场景中, 等待消耗的时间往往都远远高于拷贝的时间.让 IO 更高效
,最核心的办法就是让等待的时间尽量少
.
高级 IO
重要概念
在这里, 我们要强调几个概念
同步通信 vs 异步通信
同步和异步关注的是消息通信机制.
- 所谓同步,就是在发出一个调用时,在没有得到结果之前,该调用就不返回. 但是一旦调用返回,就得到返回值了; 换句话说,就是由调用者主动等待这个调用的结果;
- 异步则是相反,调用在发出之后,这个调用就直接返回了,所以没有返回结果; 换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果; 而是在调用发出后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用.
另外, 我们回忆在讲多进程多线程的时候, 也提到同步和互斥. 这里的同步通信和进程之间的同步是完全不相干的概念.
- 进程/线程同步也是进程/线程之间直接的制约关系
- 是为完成某种任务而建立的两个或多个线程,这个线程需要在某些位置上协调他们的工作次序而等待、传递信息所产生的制约关系. 尤其是在访问临界资源的时候. 以后在看到 “同步” 这个词, 一定要先搞清楚大背景是什么. 这个同步, 是同步通信异步通信的同步, 还是同步与互斥的同步.
阻塞 vs 非阻塞
阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.
- 阻塞调用是指调用结果返回之前,当前线程会被挂起. 调用线程只有在得到结果之后才会返回.
- 非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程.
其他高级 IO
非阻塞 IO,纪录锁,系统 V 流机制,I/O 多路转接(也叫 I/O 多路复用),readv 和writev 函数以及存储映射 IO(mmap),这些统称为高级 IO
.
我们此处重点讨论的是 I/O 多路转接
非阻塞 IO
open,send,recv 等
读写操作都有相应的标记为来改变等待的模式,可以使用这个实现非阻塞IO。
fcntl
一个文件描述符, 默认都是阻塞 IO
. 那么我们只需要将文件描述符直接设置为非阻塞就实现了非阻塞IO。fcntl系统调用
可以实现。
-
函数原型如下.
-
参数介绍:
- fd: 文件描述符,一个非负整数,表示要操作的打开文件。
- cmd: 要执行的命令。不同的命令可能需要不同的第三个参数。
- …: 根据 cmd 的不同,可能需要额外的参数,这个参数是可选的。
fcntl 函数有 5 种功能
:
- 复制一个现有的描述符(cmd=F_DUPFD).
- 获得/设置文件描述符标记(cmd=F_GETFD 或 F_SETFD).
获得/设置文件状态标记(cmd=F_GETFL 或 F_SETFL).(F_GETFL: 获取文件描述符 fd 的文件状态标志)
- 获得/设置异步 I/O 所有权(cmd=F_GETOWN 或 F_SETOWN).
- 获得/设置记录锁(cmd=F_GETLK,F_SETLK 或 F_SETLKW).
我们此处只是用第三种功能, 获取/设置文件状态标记, 就可以将一个文件描述符设置为
非阻塞.
实现函数 SetNoBlock
基于 fcntl, 我们实现一个 SetNoBlock 函数, 将文件描述符设置为非阻塞
.
void SetNoBlock(int fd)
{
int fl = fcntl(fd, F_GETFL); //获取标记位状态
if (fl < 0) {
perror("fcntl");
return;
}
fcntl(fd, F_SETFL, fl | O_NONBLOCK); //将老的标记为或上一个新的标记位(非阻塞)
}
- 使用
F_GETFL
将当前的文件描述符的属性取出来(这是一个位图). - 然后再使用
F_SETFL
将文件描述符设置回去. 设置回去的同时, 加上一个O_NONBLOCK 参数
.
#include <iostream>
#include <unistd.h>
#include "NonBlock.hpp"
#include<fcntl.h>
void NoNBlock(int fd) // 非阻塞IO
{
int fl = fcntl(fd,F_GETFL);
if(fl < 0)
{
perror("fcntl");
return;
}
fcntl(fd,F_SETFL,fl | O_NONBLOCK);
}
// 非阻塞IO 系统调用fcnlt测试代码
int main()
{
NoNBlock(0);
char buffer[1024];
while (true){
ssize_t n = ::read(0, buffer, sizeof(buffer));
if (n > 0){
buffer[n] = 0;
std::cout << "read success,buffer::" << buffer << std::endl;
}
else{
if (errno == EAGAIN || errno == EWOULDBLOCK) // 读条件还没准备就绪 {
std::cout << "还没准备就绪,去做其他事情再来" << std::endl;
sleep(1);
continue;
}
else if (errno == EINTR) // 被信号终止{
std::cout << "被信号打断" << std::endl;
sleep(1);
continue;
}
else // 读取出错{
std::cout << "read failed" << std::endl;
sleep(1);
}
}
}
return 0;
}
- 对于大多数系统来说,
EAGAIN和EWOULDBLOCK是相同的
,它们都表示资源暂时不可用,且操作无法立即完成。