I/O 多路复用

Socket 模型

C10K 问题

从阻塞I/O 到 I/O 多路复用

阻塞 I/O 是指进程发起调用后，会被挂起（阻塞），直到收到数据再返回。如果调用一直不返回，进程就会一直被挂起。因此，当使用阻塞 I/O 时，需要使用多线程来处理多个文件描述符。多线程切换有一定的开销，因此引入非阻塞 I/O。非阻塞 I/O 不会将进程挂起，调用时会立即返回成功或错误，因此可以在一个线程里轮询多个文件描述符是否就绪。

非阻塞 I/O 的缺点是：每次发起系统调用，只能检查一个文件描述符是否就绪。当文件描述符很多时，系统调用的成本很高。

因此引入了 I/O 多路复用，可以通过一次系统调用，检查多个文件描述符的状态。这是 I/O 多路复用的主要优点，相比于非阻塞 I/O，在文件描述符较多的场景下，避免了频繁的用户态和内核态的切换，减少了系统调用的开销。进程可以通过 select、poll、epoll 发起 I/O 多路复用的系统调用，这些系统调用都是同步阻塞的：如果传入的多个文件描述符中，有描述符就绪，则返回就绪的描述符；否则如果所有文件描述符都未就绪，就阻塞调用进程，直到某个描述符就绪，或者阻塞时长超过设置的 timeout 后，再返回。I/O 多路复用内部使用非阻塞 I/O 检查每个描述符的就绪状态。

for fd in read_set
	if (readable(fd)) // fd 是否就绪
		count++
		FDSET(fd, &res_rset) // 添加 fd 到就绪集合中
		break
...
return count

I/O 多路复用相当于将「遍历所有文件描述符、通过非阻塞 I/O 查看其是否就绪」的过程从用户线程移到了内核中，由内核来负责轮询。

一个进程虽然任一时刻只能处理一个请求，但是处理每个请求的事件时，耗时控制在 1 毫秒以内，这样 1 秒内就可以处理上千个请求，把时间拉长来看，多个请求复用了一个进程，这就是多路复用，这种思想很类似一个 CPU 并发多个进程，所以也叫做时分多路复用。

select/poll/epoll 作为内核提供给用户态的多路复用系统调用，进程可以通过一个系统调用函数从内核中获取多个事件。select/poll/epoll 是如何获取网络事件的呢？在获取事件时，先把所有连接（文件描述符）传给内核，再由内核返回产生了事件的连接，然后在用户态中再处理这些连接对应的请求即可。

中断 Interrupt 是指处理器接收到来自硬件或软件的信号，提示发生某事件。调用 select 实际上就是操作系统判断你需要的资源无法满足，于是将进程放入「挂起」队列而不再分配 CPU 资源。直到网卡或者你等待的别的什么硬件发出一个中断通知操作系统，OS 就会把你移出队列重新安排时间片。

select/poll

select 函数签名

select 实现多路复用的方式是，将已连接的 Socket 都放到一个文件描述符 fd 集合，然后调用 select 函数将文件描述符集合拷贝到内核里，让内核来检查是否有网络事件产生，检查的方式很粗暴，就是通过遍历文件描述符集合的方式，当检查到有事件产生后，将此 Socket 标记为可读或可写，接着再把整个文件描述符集合拷贝回用户态里，然后用户态还需要再通过遍历的方法找到可读或可写的 Socket，然后再对其处理。

所以，对于 select 这种方式，需要进行 2 次「遍历」文件描述符集合，一次在内核态，一次在用户态，而且还会发生 2 次「拷贝」文件描述符集合，先从用户空间传入内核空间，由内核修改后再传出到用户空间

poll 和 select 几乎没有区别：poll 在用户态通过数组方式传递文件描述符，在内核会转为链表方式存储，没有最大数量的限制

两者都是使用「线性结构」存储进程关注的 Socket 集合，因此都需要遍历文件描述符集合来找到可读或可写的 Socket，时间复杂度为 O(n)，而且也需要在用户态与内核态之间拷贝文件描述符集合，这种方式随着并发数上来，性能的损耗会呈指数级增长。

总结：调用 select 时会陷入内核，这时需要将参数中的 fd_set 从用户空间拷贝到内核空，内核需要遍历传递进来的所有 fd_set 每一位，不管它们是否就绪