株洲网站建设优度,做订阅号要建立网站吗,信用 网站 建设方案,番禺网站建设培训学校一、零拷贝
在前面的文章“深浅拷贝、COW及零拷贝”中对零拷贝进行过分析#xff0c;但没有举例子#xff0c;也没有深入进行展开分析。本文将结合实际的例程对零拷贝进行更深入的分析和说明。 在传统的IO操作中#xff0c;以文件通过网络传输为例 #xff0c;一般会经历以…一、零拷贝
在前面的文章“深浅拷贝、COW及零拷贝”中对零拷贝进行过分析但没有举例子也没有深入进行展开分析。本文将结合实际的例程对零拷贝进行更深入的分析和说明。 在传统的IO操作中以文件通过网络传输为例 一般会经历以下几个数据拷贝的过程 磁盘缓冲区 -内核缓冲区-用户缓冲区-内核网络缓冲区-网卡缓冲区 也就是数据要经历从IO到内核空间再从内核到用户空间再进入内核空间然后才能通过IO发走至少要有四次的内在拷贝。 而这就引出了零拷贝的概念尽最大可能减少CPU参与数据拷贝的过程直到完全不参与拷贝。它主要有基于内核缓冲优化的零拷贝和DirectIO的零拷贝。 仍然以上面的链路来分析可不可以直接从硬盘把数据内核缓冲区拷贝到网卡缓冲区可不可以可不可以不过用户缓冲区直接在内核内交互数据这都是直接想到的解决问题的方法和手段。而实际上零拷贝技术也就是按这种指导思想进行开展的。 零拷贝技术的实现有以下几种方法 1、DirectIO 这个好理解不通过各种中间环节直接和IO打交道。它主要应用于上层应用本身实现了磁盘的数据缓存比如常见的数据库系统软件那么就不需要再使用PageCache进行缓冲。这样就可以减少PageCache内核缓冲区的消耗这可略过了计算中最大的中间商CPU。而诸如下面的sendfile等其实都基于PageCache优化的零拷贝。 2、新的函数sendfilewin:TransmitFile sendfile是Linux系统提供的系统API它可以解决用户空间和内核空间的数据拷贝的次数问题如果其和DMA技术重点指SG-DMAThe Scatter-Gather Direct Memory Access共同工作即sendfileDMA那么其效率更高可以直接把数据文件从磁盘拷贝到网络缓冲区 。 sendfile有其一定的局限性首先是标准不统一另外一个就是无法在数据操作中间在用户空间对数据进行操作比如从磁盘加载然后加解密等然后再发送因为得不到具体的数据 这需要引起重视。 3、函数splice splice技术更进一步它接近于 sendfile和DMA的进一步效率提高此函数在内核空间和网络缓冲区间建立管道避免二者的CPU的拷贝。注意此函数中的两个文件操作符必须有一个为管道操作符。 4、mmap mmap方式大家比较熟悉这里就简单说明一下其实mmap的零拷贝就是通过内存映射提供一个内核和用户空间直接通信的手段。mmap应用非常多最典型的是安卓的应用Framework层的数据通信很多是用mmap为实现的。 5、tee tee函数用来在两个管道文件描述符间复制数据。它要求两个文件描述符都必须为管道描述符同时它在复制过程中保持原数据不动直接复制fd而splice是移动数据从源fd到目的fd。注意二者的区别和不同。 下面就分别对几类技术实现方式进行举例分析。在分析之前先对原来的文章“深浅拷贝、COW及零拷贝”中零拷贝的图进行一下完善 主要是补齐了未描述清楚的普通DMA部分的流程。
二、sendfile
先看一下定义
int main(int argc, char* argv[])
{
......int ffd open(fname, O_RDONLY);//打开文件struct stat st;fstat(ffd, st);struct sockaddr_in addr;bzero(addr, sizeof(addr));addr.sin_family AF_INET;inet_pton(AF_INET, ip, addr.sin_addr);addr.sin_port htons(static_castuint16_t(port));int s socket(PF_INET, SOCK_STREAM, 0);int reuse 1;//设置端口重用setsockopt(s, SOL_SOCKET, SO_REUSEPORT, reuse, sizeof(reuse));int ret bind(s, reinterpret_caststruct sockaddr*(addr), sizeof(addr));ret listen(s, 3);struct sockaddr_in client;socklen_t client_addrlen sizeof(client);int cSocket accept(s, reinterpret_caststruct sockaddr*(client), client_addrlen);if (cSocket 0) {printf(accept err: %d\n, errno);}else {sendfile(cSocket, ffd, NULL, static_castsize_t(st.st_size));close(cSocket);}......return 0;
}
注意上面的代码省略了相关的安全控制和参数赋值大家可以自行设置直接写成固定的就可以只是一个测试程序么。
三、splice
splice的应用也不复杂但需要注意其中的一些要求特别是参数中在Linux2.6.21以前splice的flags设置SPLICE_F_MOVE有效其后就无效了但SPLICE_F_NONBLOCK 和SPLICE_F_MORE都有效果。看一下例程
#include fcntl.h
#include unistd.h
#include strings.h
#include arpa/inet.h
#include sys/types.h
#include sys/stat.h
#include stdio.h
#include libgen.h
#include assert.h
#include stdlib.hint main(int argc, char* argv[])
{
......struct sockaddr_in addr;bzero(addr, sizeof(addr));addr.sin_family AF_INET;inet_pton(AF_INET, ip, addr.sin_addr);addr.sin_port htons(static_castuint16_t(port));int sfd socket(PF_INET, SOCK_STREAM, 0);int reuse 1;setsockopt(sockfd, SOL_SOCKET, SO_REUSEPORT, reuse, sizeof(reuse));int r bind(sockfd, reinterpret_castsockaddr*(addr), sizeof(addr));r listen(sockfd, 3);struct sockaddr_in cSocket;socklen_t client_addrlen sizeof(cSocket);int cfd accept(sfd, reinterpret_castsockaddr*(cSocket), client_addrlen);if (cfd 0) {printf(accept err: %d\n, errno);}else {int pfd[2];ret pipe(pfd);while (1) {ssize_t res;res splice(cfd, NULL, pfd[1], NULL, 1024, SPLICE_F_MORE | SPLICE_F_MOVE);if (res 0) { // 收到EOFbreak;}res splice(pfd[0], NULL, cfd, NULL, 1024, SPLICE_F_MORE | SPLICE_F_MOVE);}close(cfd);}close(sfd);return 0;
}
相关的具体参数可以看说明文档还是相当清楚的。
四、tee和mmap
mmap的例子非常多这里只给一个tee相关的例子 #include stdio.h
#include stdlib.h
#include sys/types.h
#include sys/stat.h
#include fcntl.h
#include unistd.h
#include libgen.h
#include assert.hint main(int argc, char* argv[])
{
......int ffd open(argv[1], O_CREAT | O_TRUNC | O_WRONLY, 0666);int pfdout[2];int r pipe(pfdout);assert(r ! -1);int pfdfile[2];r pipe(pfdfile);while (1) {ssize_t res splice(STDIN_FILENO, NULL, pfdout[1], NULL, 1024, SPLICE_F_MORE | SPLICE_F_MOVE);if (res 0) {break;}res tee(pfdout[0], pfdfile[1], 1024, SPLICE_F_NONBLOCK);res splice(pfdfile[0], NULL, ffd, NULL, 1024, SPLICE_F_MORE | SPLICE_F_MOVE);assert(res ! -1);// 二次调用因为第一次调用数据已经移动所以splice函数阻塞//res splice(pfdfile[0], NULL, STDOUT_FILENO, NULL, 1024, SPLICE_F_MORE | SPLICE_F_MOVE);}.......return 0;
}
这些都没有什么难度手册上也都有相关的例程。
五、DMA技术和零拷贝
在上面的分析过程中可以清晰的知道DMA技术和零拷贝既有千丝万缕的联系又有所不同 DMA技术是负责数据的直通零拷贝重点是CPU不参与数据拷贝但需要参与数据的管理比如数据可以使用开始操作等等也就是说DMA技术和零拷贝技术中的CPU互相协作达到数据拷贝的次数最少的目的。 零拷贝其实就是考虑减少从IO到用户层的整个数据流程的拷贝次数从而提高效率要始终抓住这条主线。DMA主要是拷贝CPU重点是管理即把CPU从既管理又复制中简化工作任务只管理即可。DMA技术和硬件关系很密切所以在具体的开发使用中要明确硬件是否支持相关具体的操作。 需要注意的另外一点是在实际场景中如果是非常大的数据文件处理基于PageCache零拷贝技术则有些力不从心了还是得使用Direct IO的零拷贝技术。
六、使用零拷贝的框架
说一些技术和概念可能理解并不深刻可以参考一下相关的一些开源框架中使用的零拷贝技术 1、KAFKA 使用sendfile的零拷贝技术 2、Nginx 提供了sendfile和directio的相关零拷贝技术 3、Mysql 使用了directio的零拷贝技术 4、Netty 使用sendfile的零拷贝技术 5、RocketMQ 使用了mmap write的零拷贝技术
七、总结
其实说得更浅显一些所谓零拷贝更准确的说不是零次拷贝是指尽可能的减少拷贝。在DPDK的系列文章中这种操作被发挥的淋漓尽致。互联网的口号就是“不让中间商赚差价”这个在现实上可能有一些逻辑上的BUG但在内存操作上确实是非常用益。 当然万事万物不是说是绝对的有的时候抽象一下加一层如果能达到更好的效果又不影响实际的使用的情况下岂不更妙千头万绪又回到始终坚持的原则应用场景决定应用技术实践是检验真理的标准。