真正意义上的 异步IO 是说内核直接将数据拷贝至用户态的内存单元,再通知程序直接去读取数据。
select / poll / epoll 都是同步IO的多路复用模式

用户空间和内核空间

  • 在Linux/Unix中,对于一次读取IO的操作,数据并不会直接拷贝到应用程序的缓冲区(用户空间),它首先会被拷贝到操作系统内核的缓冲区(内核空间)中,然后才会从操作系统内核的缓冲区拷贝到应用程序的缓冲区
  • 可以看做是两个过程:1. Waiting for the data to be ready(等待数据到达内核缓冲区);2. Copying the data from the kernel to the process(从内核缓冲区拷贝数据到应用程序缓冲区)

同步/异步、阻塞/非阻塞

同步和异步关注的是消息通信机制
所谓同步,就是在发出一个调用时,没得到结果之前,该调用就不返回。但是一旦调用返回就得到返回值了,调用者主动等待这个调用的结果
所谓异步,就是在发出一个调用时,这个调用就直接返回了,不管返回有没有结果。当一个异步过程调用发出后,被调用者通过状态,通知来通知调用者,或者通过回调函数处理这个调用

阻塞和非阻塞关注的是程序在等待调用结果时的状态
阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才返回
非阻塞调用是指在不能立即得到结果之前,该调用不会阻塞当前线程

同步

  • 发出一个功能调用时,在没有得到结果之前,该调用就不返回,也就是必须一件一件事做,等前一件做完了才能做下一件事

异步

  • 当一个异步过程调用发出后,调用者一般不能立刻得到结果,实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者
  • 通知调用者的三种方式:
  • 状态——监听被调用者的状态(轮询),调用者需要每隔一定时间检查一次,效率会很低;
  • 通知——当被调用者执行完成后,发出通知告知调用者,无需消耗太多性能
  • 回调——当被调用者执行完成后,会调用调用者提供的回调函数

阻塞

  • 调用结果返回之前,当前线程会被挂起(线程进入非可执行状态,在这个状态下,OS不会给线程分配时间片,即线程暂停运行),调用结果返回后线程进入就绪态

非阻塞

  • 调用结果返回之前,该函数不会阻塞当前线程,而会立刻返回

同步和异步的区别

  • 请求发出后,是否需要等待结果,才能继续执行其他操作
  • 在网络IO模型中,数据拷贝时进程阻塞是同步,反之则是是异步

阻塞和同步的区别

  • 同步调用在结果返回之前,线程并没有进入挂起状态,OS还会给它分配占用CPU的时间片;阻塞调用在结果返回之前,线程处于挂起状态,OS不会再为其分配占用CPU的时间片,直到结果返回后,线程进入就绪状态在可能继续运行

阻塞和非阻塞的区别

  • 在网络IO模型中,应用程序的调用立即返回是非阻塞,反之则是阻塞

同步/异步和阻塞/非阻塞的区别

  • 在网络编程中,阻塞和非阻塞发生在第一阶段(准备数据阶段);同步和异步发生在第二阶段(准备好的数据从内核缓冲区拷贝到用户进程缓冲区阶段)

网络上的例子
老张爱喝茶,废话不说,煮开水。
出场人物:老张,水壶两把(普通水壶,简称水壶;会响的水壶,简称响水壶)。
1 老张把水壶放到火上,立等水开。(同步阻塞);立等就是阻塞了老张去干别的事,老张得一直主动的看着水开没,这就是同步
2 老张把水壶放到火上,去客厅看电视,时不时去厨房看看水开没有。(同步非阻塞);老张去看电视了,这就是非阻塞了,但是老张还是得关注着水开没,这也就是同步了
3 老张把响水壶放到火上,立等水开。(异步阻塞);立等就是阻塞了老张去干别的事,但是老张不用时刻关注水开没,因为水开了,响水壶会提醒他,这就是异步了
4 老张把响水壶放到火上,去客厅看电视,水壶响之前不再去看它了,响了再去拿壶。(异步非阻塞);老张去看电视了,这就是非阻塞了,而且,等水开了,响水壶会提醒他,这就是异步了
所谓同步异步,只是对于水壶而言。普通水壶,同步;响水壶,异步。对应的也就是消息通信机制
虽然都能干活,但响水壶可以在自己完工之后,提示老张水开了。这是普通水壶所不能及的。同步只能让调用者去轮询自己(情况2中),造成老张效率的低下。
所谓阻塞非阻塞,仅仅对于老张而言。立等的老张,阻塞;对应的也就是程序等待结果时的状态
看电视的老张,非阻塞。
情况1和情况3中老张就是阻塞的,媳妇喊他都不知道。虽然3中响水壶是异步的,可对于立等的老张没有太大的意义。所以一般异步是配合非阻塞使用的,这样才能发挥异步的效用。

Unix网络编程5种I/O模型

阻塞I/O(blocking I/O)

img

  • 当用户进程调用了recvfrom这个系统调用,kernel就开始了IO的第一个阶段:准备数据,对于network IO来说,一般数据在一开始还没有到达,kernel会等待足够的数据到来,而在用户进程这边,整个进程会被阻塞挂起,当kernel等到数据准备好,它就会将数据从内核缓冲区拷贝到用户进程缓冲区,然后kernel返回结果,用户进程才进入就绪状态,重新运行起来

非阻塞I/O(nonblocking IO)

img

  • 当用户进程发出recvfrom操作时,如果kernel中的数据还没有准备好,那么它并不会阻塞用户进程,而是立刻返回,从用户进程角度讲 ,它发起一个recvfrom操作后,并不需要等待,而是马上就得到了一个结果,用户进程通过结果判断数据是否准备好,如果没有准备好过段时间再次发送recvfrom操作,一旦kernel中的数据准备好了,并且又再次收到了用户进程的recvfrom调用操作,马上将数据从内核缓冲区拷贝到了用户进程缓冲区

I/O多路复用(I/O multiplexing)

img

  • select,poll以及大名鼎鼎的epoll就是IO多路复用模型,其特点就在于单个系统调用可以同时处理多个网络连接的IO,它的基本原理就是select/poll/epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程
  • 当用户进程调用了select/poll/epoll,整个进程会被阻塞,而同时,kernel会“监视”所有select/poll/epoll负责的socket,当任何一个socket中的数据准备好了,select/poll/epoll就会返回。这个时候用户进程再调用recvfrom操作,将数据从内核缓冲区拷贝到用户进程缓冲区

信号驱动I/O(signal driven I/O)

img

  • 信号驱动I/O在网络编程中基本用不到这里就不做介绍了

异步I/O(asynchronous I/O)

img

  • 用户进程发起aio_read操作之后,立刻就可以开始去做其它的事,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何阻塞,然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了