Linux I/O多路复用

linux中一切皆文件,不论是我们存储在磁盘上的字符文件,可执行文件还是我们的接入电脑的i/o设备等都被vfs抽象成了文件,比如标准输入设备默认是键盘,我们在操作标准输入设备的时候,其实操作的是默认打开的一个文件描述符是0的文件,而一切软件操作硬件都需要通过os,而os操作一切硬件都需要相应的驱动程序,这个驱动程序里配置了这个硬件的相应配置和使用方法。linux的i/o分为阻塞i/o,非阻塞i/o,i/o多路复用,信号驱动i/o四种。对于i/o设备的驱动,一般都会提供关于阻塞和非阻塞两种配置。我们最常见的i/o设备之一--键盘(标准输入设备)的驱动程序默认是阻塞的。
多路复用就是为了使进程能够从多个阻塞i/o中获得自己想要的数据并继续执行接下来的任务。其主要的思路就是同时监视多个文件描述符,如果有文件描述符的设定状态的被触发,就继续执行进程,如果没有任何一个文件描述符的设定状态被触发,进程进入sleep
多路复用的一个主要用途就是实现i/o多路复用并发服务器,和多线程并发或者多进程并发相比,这种服务器的系统开销更低,更适合做web服务器,但是由于其并没有实现真正的多任务,所以当压力大的时候,部分用户的请求响应会较慢
阻塞i/o阻塞i/o,就是当进程试图访问这个i/o设备而这个设备并没有准备好的时候,设备的驱动程序会通过内核让这个试图访问的进程进入sleep状态。阻塞i/o的一个好处就是可以大大的节约cpu时间,因为一旦一个进程试图访问一个没有准备好的阻塞i/o,就会进入sleep状态,而进入sleep状态的进程是不在内核的进程调度链表中,直到目标i/o准备好了将其唤醒并加入调度链表,这样就可以节约cpu时间。当然阻塞i/o也有其固有的缺点,如果进程试图访问一个阻塞i/o,但是否访问成功并不对接下来的任务有决定性影响,那么直接使其进入sleep状态显然会延误其任务的完成。
典型的默认阻塞io有标准输入设备,socket设备,管道设备等,当我们使用gets(),scanf(),read()等操作请求这些io时而io并没有数据流入,就会造成进程的sleep。 进程会一直阻塞下去直到接收缓冲区中有数据可读,此时内核再去唤醒该进程,通过相应的函数从中获取数据。如果阻塞过程中对方发生故障,那么这个进程将会永远阻塞下去。写操作时发生阻塞的情况要比读操作少,主要发生在要写入的缓冲区的大小小于要写入的数据量的情况下,这时写操作将不进行任何任何拷贝工作,将发生阻塞。一旦发送缓冲区内有足够的空间,内核将唤醒进程,将数据从用户缓冲区中拷贝到相应的发送数据缓冲区。udp不用等待确认,没有实际的发送缓冲区,所以udp协议中不存在发送缓冲区满的情况,在udp套接字上执行的写操作永远都不会阻塞现假设一个进程希望通过三个管道中任意一个中读取数据并显示,伪代码如下
read(pipe_0,buf,sizeof(buf)); //sleepprint buf;read(pipe_1,buf,sizeof(buf));print buf;read(pipe_2,buf,sizeof(buf));print buf;由于管道是阻塞i/o,所以如果pipe_0没有数据流入,进程就是在第一个read()处进入sleep状态而即使pipe_1和pipe_2有数据流入也不会被读取。
如果我们使用下述代码重新设置管道的阻塞属性,显然,如果三个管道都没有数据流入,那么进程就无法获得请求的数据而继续执行,倘若这些数据很重要(所以我们才要用阻塞i/o),那结果就会十分的糟糕,改为轮询却又大量的占据cpu时间。
int fl = fcntl(pipe_fd, f_getfl);fcntl(pipe_fd, f_setfl, fl | o_nonblock);如何让进程同时监视三个管道,其中一个有数据就继续执行而不会sleep,如果全部没有数据流入再sleep,就是多路复用技术需要解决的问题。
非阻塞i/o非阻塞i/o就是当一个进程试图访问一个i/o设备的时候,无论是否从中获取了请求的数据都会返回并继续执行接下来的任务。,但非常适合请求是否成功对接下来的任务影响不大的i/o请求。但如果访问一个非阻塞i/o,但这个请求如果失败对进程接下来的任务有致命影响,最粗暴的就是使用while(1){read()}轮询。显然,这种方式会占用大量的cpu时间。
select机制select是一种非常古老的同步i/o接口,但是提供了一种很好的i/o多路复用的思路
模型fd_set //创建fd_set对象,将来从中增减需要监视的fdfd_zero() //清空fd_set对象fd_set() //将一个fd加入fd_set对象中 select() //监视fd_set对象中的文件描述符pselect() //先设定信号屏蔽,再监视fd_isset() //测试fd是否属于fd_set对象fd_clr() //从fd_set对象中删除fdnote:
select的第一个参数nfds是指集合中的最大的文件描述符+1,因为select会无差别遍历整个文件描述符表直到找到目标,而文件描述符是从0开始的,所以一共是集合中的最大的文件描述符+1次。上一条导致了这种机制的低效,如果需要监视的文件描述符是0和100那么每一次都会遍历101次select()每次返回都会修改fd_set,如果要循环select(),需要先对初始的fd_set进行备例子_i/o多路复用并发服务器关于server本身的编程模型,参见tcp/ip协议服务器模型和udp/ip协议服务器模型这里仅是使用select实现伪并行的部分模型
#define bufsize 100#define maxnfd 1024 int main(){ /***********服务器的listenfd已经准本好了**************/ fd_set readfds; fd_set writefds; fd_zero(&readfds); fd_zero(&writefds); fd_set(listenfd, &readfds); fd_set temprfds = readfds; fd_set tempwfds = writefds; int maxfd = listenfd; int nready; char buf[maxnfd][bufsize] = {0}; while(1){ temprfds = readfds; tempwfds = writefds; nready = select(maxfd+1, &temprfds, &tempwfds, null, null) if(fd_isset(listenfd, &temprfds)){ //如果监听到的是listenfd就进行accept int sockfd = accept(listenfd, (struct sockaddr*)&clientaddr, &len); //将新accept的scokfd加入监听集合,并保持maxfd为最大fd fd_set(sockfd, &readfds); maxfd = maxfd>sockfd?maxfd:sockfd; //如果意见检查了nready个fd,就没有必要再等了,直接下一个循环 if(--nready==0) continue; } int fd = 0; //遍历文件描述符表,处理接收到的消息 for(;fd<=maxfd; fd++){ if(fd == listenfd) continue; if(fd_isset(fd, &temprfds)){ int ret = read(fd, buf[fd], sizeof buf[0]); if(0 == ret){ //客户端链接已经断开 close(fd); fd_clr(fd, &readfds); if(maxfd==fd) --maxfd; continue; } //将fd加入监听可写的集合 fd_set(fd, &writefds); } //找到了接收消息的socket的fd,接下来将其加入到监视写的fd_set中 //将在下一次while()循环开始监视 if(fd_isset(fd, &tempwfds)){ int ret = write(fd, buf[fd], sizeof buf[0]); printf(ret %d: %d\n, fd, ret); fd_clr(fd, &writefds); } } } close(listenfd);}poll机制poll是一种基于select的改良机制,其针对select的一些缺陷进行了重新设计,包括不需要备份fd_set等等,但是依然是遍历整个文件描述符表,效率较低
模型struct pollfd fds //创建一个pollfd类型的数组fds[0].fd //向fds[0]中放入需要监视的fdfds[0].events //向fds[0]中放入需要监视的fd的触发事件 pollin //i/o有输入 pollpri //有紧急数据需要读取 pollout //i/o可写 pollrdhup //流式套接字连接断开或套接字处于半关闭状态 pollerr //错误条件(仅针对输出) pollhup //挂起(仅针对输出) pollnval //无效的请求:fd没有被打开(仅针对输出)例子_i/o多路复用并发服务器/* ... */int main(){ /* ... */ struct pollfd myfds[maxnfd] = {0}; myfds[0].fd = listenfd; myfds[0].events = pollin; int maxnum = 1; int nready; //准备二维数组buf,每个fd使用buf的一行,数据干扰 char buf[maxnfd][bufsize] = {0}; while(1){ //poll直接返回event被触发的fd的个数 nready = poll(myfds, maxnum, -1) int i = 0; for(;i模型epoll_create() //创建epoll对象struct epoll_event //准备事件结构体和事件结构体数组 event.events event.data.fd ...epoll_ctl() //配置epoll对象epoll_wait() //监控epoll对象中的fd及其相应的event例子_i/o多路复用并发服务器/* ... */int main(){ /* ... */ /* 创建epoll对象 */ int epoll_fd = epoll_create(1024); //准备一个事件结构体 struct epoll_event event = {0}; event.events = epollin; event.data.fd = listenfd; //data是一个共用体,除了fd还可以返回其他数据 //ctl是监控listenfd是否有event被触发 //如果发生了就把event通过wait带出。 //所以,如果event里不标明fd,我们将来获取就不知道哪个fd epoll_ctl(epoll_fd, epoll_ctl_add, listenfd, &event); struct epoll_event revents[maxnfd] = {0}; int nready; char buf[maxnfd][bufsize] = {0}; while(1){ //wait返回等待的event发生的数目 //并把相应的event放到event类型的数组中 nready = epoll_wait(epoll_fd, revents, maxnfd, -1) int i = 0; for(;i
大华发布一站式人工智能开发平台 加速人工智能规模产业化落地
多项技术加持TCL MiniLED智屏堪称显示领域天花板
智能算力时代,一个中国答案
京东方在可折叠面板市场超越三星
南昌市政公用与欧菲光签署框架协议 预付10亿转让51%股份
Linux I/O多路复用
三星首款安卓4.0平板Galaxy Tab 2
数字调谐收音机是什么?数字调谐收音机原理分析
德国研究团队设计出创新消毒设备 采用波长为269nm的UVC LED
关于气压计的介绍和应用
教你一种实现异构设备资源共享的方法
一加7T迈凯伦定制版确认10月15日发布
高通第四季净利大增20% 前景看好
黑客可以不发出任何声音来控制智能音箱 只要一个激光笔即可
金航标/萨科微庆祝上半年业绩达标 举办茶话会派发奖金
基于FPGA的DVI接收器设计与实现
微鲸F1智能投影仪评测 到底值不值得买
TCL李东生:聚焦高科技产业,全球化战略提速
谷歌、 Facebook 相继出现全球性大规模宕机
德州仪器推出连接键盘与LCD面板IC 简化平板电脑设计