禅与计算机 禅与计算机
首页
  • Java基础

    • 聊一聊java一些核心知识点
    • 聊聊java面向对象核心知识点
    • 聊聊Java中的异常
    • 聊聊Java中的常用类String
    • 万字长文带你细聊Java注解本质
    • 来聊聊Java的反射机制
    • 深入解析Java泛型的魅力与机制
    • Java集合框架深度解析与面试指南
    • Java常用集合类HashMap深度解析
    • LinkedHashMap源码到面试题的全解析
    • 深入解析CopyOnWriteArrayList的工作机制
    • Java基础IO总结
    • Java三大IO模型小结
    • Java BIO NIO AIO详解
    • Java进阶NIO之IO多路复用详解
    • Java8流式编程入门
    • 一文速通lambda与函数式编程
    • Java8函数式方法引用最佳实践
  • Java并发编程

    • Java并发编程基础小结
    • 深入理解Java中的final关键字
    • 浅谈Java并发安全发布技术
    • 浅谈Java并发编程中断的哲学
    • Java线程池知识点小结
    • 浅谈Java线程池中拒绝策略与流控的艺术
    • synchronized关键字使用指南
    • 深入源码解析synchronized关键字
    • 详解JUC包下的锁
    • 详解并发编程中的CAS原子类
    • LongAdder源码分析
    • AQS源码解析
    • 深入剖析Java并发编程中的死锁问题
    • Java并发容器总结
    • 详解Java并发编程volatile关键字
    • 并发编程ThreadLocal必知必会
    • CompletableFuture基础实践小结
    • CompletableFuture异步多任务最佳实践
    • 硬核详解FutureTask设计与实现
    • 线程池大小设置的底层逻辑与场景化方案
    • 来聊一个有趣的限流器RateLimiter
  • JVM相关

    • 从零开始掌握 JVM
    • JVM核心知识点小结
    • JVM指令集概览:基础与应用
    • JVM类加载器深度解析
    • JVM方法区深度解析
    • Java内存模型JMM详解
    • Java对象大小的精确计算方法
    • 逃逸分析在Java中的应用与优化
    • 从零开始理解JVM的JIT编译机制
    • G1垃圾回收器:原理详解与调优指南
    • JVM故障排查实战指南
    • JVM内存问题排错最佳实践
    • JVM内存溢出排查指南
    • 简明的Arthas使用教程
    • 简明的Arthas配置及基础运维教程
    • 基于Arthas Idea的JVM故障排查与指令生成
    • 基于arthas量化监控诊断java应用方法论与实践
    • 深入剖析arthas技术原理
  • 深入理解Spring框架

    • Spring 核心知识点全面解析
    • Spring核心功能IOC详解
    • Spring AOP 深度剖析与实践
    • Spring 三级缓存机制深度解析
    • 深入 Spring 源码,剖析设计模式的落地实践
    • 探索 Spring 事务的奥秘
    • 深入解析Spring Bean的生命周期管理
    • 解读 Spring Boot 核心知识点
    • Spring Boot 启动优化实战:1分钟到13秒的排查与优化之路
    • Spring Boot自动装配原理及实践
    • 一文快速上手Sharding-JDBC
    • sharding-jdbc如何实现分页查询
    • 基于DynamicDataSource整合分库分表框架Shardingsphere
  • 计算机组成原理

    • 计算机硬件知识小结
    • CPU核心知识点小结
    • 浅谈CPU流水线的艺术
    • 从Java程序员视角聊聊CPU缓存
    • CPU任务调度和伪共享问题小结
    • CPU MESI缓存一致性协议
    • CPU内存管理机制
    • 内存深度解析
    • 磁盘存储原理
    • 详解计算机启动步骤
    • CPU南北桥架构与发展史
    • CPU中断机制与硬件交互详解
  • 操作系统

    • 如何实现一个高性能服务器
    • Linux文件结构与文件权限
    • Linux常见压缩指令小结
    • Linux核心系统调用详解
    • Linux进程管理
    • Linux线程管理
    • 进程与线程深度解析
    • Linux进程间通信机制
    • 零拷贝技术原理与实践
    • CPU缓存一致性问题深度解析
    • IO任务与CPU调度艺术
  • 计算机网络

    • 网卡通信原理详解
    • 网卡数据包处理指南
    • 基于抓包详解TCP协议
  • 编码最佳实践

    • 浅谈现代软件工程TDD最佳实践
    • 浅谈TDD模式下并发程序设计与实现
    • 面向AI编程新范式Trae后端开发环境搭建与实践
    • 基于提示词工程的Redis签到功能开发实践
    • 基于Vibe Coding的Redis分页查询实现
    • 告别AI无效对话:资深工程师的提示词设计最佳实践
  • 实用技巧与配置

    • Mac常用快捷键与效率插件指南
    • Keynote技术科普短视频制作全攻略
  • 写作

    • 写好技术博客的5大核心原则:从认知科学到AI工具的全流程指南
  • 开发工具

    • IDEA配置详解与高效使用指南
  • Nodejs
  • 博客搭建
  • Redis

    • Redis核心知识小结
    • 解锁Redis发布订阅模式
    • 掌握Redis事务
    • Redis主从复制技术
    • Redis的哨兵模式详解
    • 深度剖析Redisson分布式锁
    • 详解redis单线程设计思路
    • 来聊聊Redis所实现的Reactor模型
    • Redis RDB持久化源码深度解析
    • 来聊聊redis的AOF写入
    • 来聊聊Redis持久化AOF管道通信的设计
    • 来聊聊redis集群数据迁移
    • Redis SDS动态字符串深度解析
    • 高效索引的秘密:redis跳表设计与实现
    • 聊聊redis中的字典设计与实现
  • MySQL

    • MySQL基础知识点小结
    • 解读MySQL 索引基础
    • MySQL 索引进阶指南
    • 解读MySQL Explain关键字
    • 探秘 MySQL 锁:原理与实践
    • 详解MySQL重做日志redolog
    • 详解undoLog在MySQL MVCC中的运用
    • MySQL二进制日志binlog核心知识点
    • MySQL高效插入数据的最佳实践
    • MySQL分页查询优化指南
    • MySQL流式查询的奥秘与应用解析
    • 来聊聊分库分表
    • 来聊聊大厂常用的分布式ID生成方案
  • ElasticSearch

    • 从Lucene到Elasticsearch:进化之路
    • ES 基础使用指南
    • ElasticSearch如何写入一篇文档
    • 深入剖析Elasticsearch文档读取原理
    • 聊聊ElasticSearch性能调优
    • Spring借助Easy-Es操作ES
  • Netty

    • 一文快速了解高性能网络通信框架Netty
    • Netty网络传输简记
    • 来聊聊Netty的ByteBuf
    • 来聊聊Netty消息发送的那些事
    • 解密Netty高性能之谜:NioEventLoop线程池阻塞分析
    • 详解Netty中的责任链Pipeline如何管理ChannelHandler
    • Netty Reactor模型常见知识点小结
    • Netty如何驾驭TCP流式传输?粘包拆包问题全解
    • Netty解码器源码解析
  • 消息队列

    • 一文快速入门消息队列
    • 消息队列RocketMQ入门指南
    • 基于RocketMQ实现分布式事务
    • RocketMQ容器化最佳实践
    • RocketMQ常见问题与深度解析
    • Kafka快速安装与使用指南
  • Nginx

    • Linux下的nginx安装
    • Nginx基础入门总结
    • Nginx核心指令小结
    • Nginx进程结构与核心模块初探
    • Nginx应用进阶HTTP核心模块配置
    • Nginx缓存及HTTPS配置小记
    • nginx高可用实践简记
    • Nginx性能优化
  • 微服务基础

    • 微服务基础知识小结
    • 分布式事务核心概念小结
    • OpenFeign核心知识小结
    • 微服务组件Gateway核心使用小结
    • 分布式事务Seata实践
    • 用 Docker Compose 完成 Seata 的整合部署
  • Nacos

    • Nacos服务注册原理全解析
    • Nacos服务订阅流程全解析
    • Nacos服务变更推送流程全解析
    • 深入解析SpringCloud负载均衡器Loadbalancer
    • Nacos源码环境搭建与调试指南
  • Seata

    • 深度剖析Seata源码
  • Docker部署

    • 一文快速掌握docker的理念和基本使用
    • 使用docker编排容器
    • 基于docker-compose部署微服务基本环境
    • 基于docker容器化部署微服务
    • Gateway全局异常处理及请求响应监控
    • Docker图形化界面工具Portainer最佳实践
  • Go基础

    • 一文带你速通Go语言基础语法
    • 一文快速掌握Go语言切片
    • 来聊聊go语言的hashMap
    • 一文速通go语言类型系统
    • 浅谈Go语言中的面向对象
    • go语言是如何实现协程的
    • 聊聊go语言中的GMP模型
    • 极简的go语言channel入门
    • 聊聊go语言基于epoll的网络并发实现
    • 写给Java开发的Go语言协程实践
  • mini-redis实战

    • 来聊聊我用go手写redis这件事
    • mini-redis如何解析处理客户端请求
    • 实现mini-redis字符串操作
    • 硬核复刻redis底层双向链表核心实现
    • 动手复刻redis之go语言下的字典的设计与落地
    • Go 语言下的 Redis 跳表设计与实现
    • Go 语言版 Redis 有序集合指令复刻探索
  • 项目编排

    • Spring脚手架创建简记
    • Spring脚手架集成分页插件
    • Spring脚手架集成校验框架
    • maven父子模块两种搭建方式简记
    • SpringBoot+Vue3前后端快速整合入门
    • 来聊聊Java项目分层规范
  • 场景设计

    • Java实现文件分片上传
    • 基于时间缓存优化浏览器轮询阻塞问题
    • 基于EasyExcel实现高效导出
    • 10亿数据高效插入MySQL最佳方案
    • 从开源框架中学习那些实用的位运算技巧
  • CI/CD

    • 基于NETAPP实现内网穿透
    • 基于Gitee实现Jenkins自动化部署SpringBoot项目
    • Jenkins离线安装部署教程简记
    • 基于Nexus搭建Maven私服基础入门
    • 基于内网的Jenkins整合gitlab综合方案简记
  • 监控方法论

    • SpringBoot集成Prometheus与Grafana监控
    • Java监控度量Micrometer全解析
    • 从 micrometer计量器角度快速上手promQL
    • 硬核安利一个监控告警开源项目Nightingale
  • Spring AI

    • Spring AI Alibaba深度实战:一文掌握智能体开发全流程
    • Spring AI Alibaba实战:JVM监控诊断Arthas Agent的工程化构建与最佳实践
  • 大模型评测

    • M2.7 真能打!我用两个真实场景测了测,结果有点意外
    • Qoder JetBrains插件评测:祖传代码重构与接口优化实战
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

sharkchili

计算机禅修者
首页
  • Java基础

    • 聊一聊java一些核心知识点
    • 聊聊java面向对象核心知识点
    • 聊聊Java中的异常
    • 聊聊Java中的常用类String
    • 万字长文带你细聊Java注解本质
    • 来聊聊Java的反射机制
    • 深入解析Java泛型的魅力与机制
    • Java集合框架深度解析与面试指南
    • Java常用集合类HashMap深度解析
    • LinkedHashMap源码到面试题的全解析
    • 深入解析CopyOnWriteArrayList的工作机制
    • Java基础IO总结
    • Java三大IO模型小结
    • Java BIO NIO AIO详解
    • Java进阶NIO之IO多路复用详解
    • Java8流式编程入门
    • 一文速通lambda与函数式编程
    • Java8函数式方法引用最佳实践
  • Java并发编程

    • Java并发编程基础小结
    • 深入理解Java中的final关键字
    • 浅谈Java并发安全发布技术
    • 浅谈Java并发编程中断的哲学
    • Java线程池知识点小结
    • 浅谈Java线程池中拒绝策略与流控的艺术
    • synchronized关键字使用指南
    • 深入源码解析synchronized关键字
    • 详解JUC包下的锁
    • 详解并发编程中的CAS原子类
    • LongAdder源码分析
    • AQS源码解析
    • 深入剖析Java并发编程中的死锁问题
    • Java并发容器总结
    • 详解Java并发编程volatile关键字
    • 并发编程ThreadLocal必知必会
    • CompletableFuture基础实践小结
    • CompletableFuture异步多任务最佳实践
    • 硬核详解FutureTask设计与实现
    • 线程池大小设置的底层逻辑与场景化方案
    • 来聊一个有趣的限流器RateLimiter
  • JVM相关

    • 从零开始掌握 JVM
    • JVM核心知识点小结
    • JVM指令集概览:基础与应用
    • JVM类加载器深度解析
    • JVM方法区深度解析
    • Java内存模型JMM详解
    • Java对象大小的精确计算方法
    • 逃逸分析在Java中的应用与优化
    • 从零开始理解JVM的JIT编译机制
    • G1垃圾回收器:原理详解与调优指南
    • JVM故障排查实战指南
    • JVM内存问题排错最佳实践
    • JVM内存溢出排查指南
    • 简明的Arthas使用教程
    • 简明的Arthas配置及基础运维教程
    • 基于Arthas Idea的JVM故障排查与指令生成
    • 基于arthas量化监控诊断java应用方法论与实践
    • 深入剖析arthas技术原理
  • 深入理解Spring框架

    • Spring 核心知识点全面解析
    • Spring核心功能IOC详解
    • Spring AOP 深度剖析与实践
    • Spring 三级缓存机制深度解析
    • 深入 Spring 源码,剖析设计模式的落地实践
    • 探索 Spring 事务的奥秘
    • 深入解析Spring Bean的生命周期管理
    • 解读 Spring Boot 核心知识点
    • Spring Boot 启动优化实战:1分钟到13秒的排查与优化之路
    • Spring Boot自动装配原理及实践
    • 一文快速上手Sharding-JDBC
    • sharding-jdbc如何实现分页查询
    • 基于DynamicDataSource整合分库分表框架Shardingsphere
  • 计算机组成原理

    • 计算机硬件知识小结
    • CPU核心知识点小结
    • 浅谈CPU流水线的艺术
    • 从Java程序员视角聊聊CPU缓存
    • CPU任务调度和伪共享问题小结
    • CPU MESI缓存一致性协议
    • CPU内存管理机制
    • 内存深度解析
    • 磁盘存储原理
    • 详解计算机启动步骤
    • CPU南北桥架构与发展史
    • CPU中断机制与硬件交互详解
  • 操作系统

    • 如何实现一个高性能服务器
    • Linux文件结构与文件权限
    • Linux常见压缩指令小结
    • Linux核心系统调用详解
    • Linux进程管理
    • Linux线程管理
    • 进程与线程深度解析
    • Linux进程间通信机制
    • 零拷贝技术原理与实践
    • CPU缓存一致性问题深度解析
    • IO任务与CPU调度艺术
  • 计算机网络

    • 网卡通信原理详解
    • 网卡数据包处理指南
    • 基于抓包详解TCP协议
  • 编码最佳实践

    • 浅谈现代软件工程TDD最佳实践
    • 浅谈TDD模式下并发程序设计与实现
    • 面向AI编程新范式Trae后端开发环境搭建与实践
    • 基于提示词工程的Redis签到功能开发实践
    • 基于Vibe Coding的Redis分页查询实现
    • 告别AI无效对话:资深工程师的提示词设计最佳实践
  • 实用技巧与配置

    • Mac常用快捷键与效率插件指南
    • Keynote技术科普短视频制作全攻略
  • 写作

    • 写好技术博客的5大核心原则:从认知科学到AI工具的全流程指南
  • 开发工具

    • IDEA配置详解与高效使用指南
  • Nodejs
  • 博客搭建
  • Redis

    • Redis核心知识小结
    • 解锁Redis发布订阅模式
    • 掌握Redis事务
    • Redis主从复制技术
    • Redis的哨兵模式详解
    • 深度剖析Redisson分布式锁
    • 详解redis单线程设计思路
    • 来聊聊Redis所实现的Reactor模型
    • Redis RDB持久化源码深度解析
    • 来聊聊redis的AOF写入
    • 来聊聊Redis持久化AOF管道通信的设计
    • 来聊聊redis集群数据迁移
    • Redis SDS动态字符串深度解析
    • 高效索引的秘密:redis跳表设计与实现
    • 聊聊redis中的字典设计与实现
  • MySQL

    • MySQL基础知识点小结
    • 解读MySQL 索引基础
    • MySQL 索引进阶指南
    • 解读MySQL Explain关键字
    • 探秘 MySQL 锁:原理与实践
    • 详解MySQL重做日志redolog
    • 详解undoLog在MySQL MVCC中的运用
    • MySQL二进制日志binlog核心知识点
    • MySQL高效插入数据的最佳实践
    • MySQL分页查询优化指南
    • MySQL流式查询的奥秘与应用解析
    • 来聊聊分库分表
    • 来聊聊大厂常用的分布式ID生成方案
  • ElasticSearch

    • 从Lucene到Elasticsearch:进化之路
    • ES 基础使用指南
    • ElasticSearch如何写入一篇文档
    • 深入剖析Elasticsearch文档读取原理
    • 聊聊ElasticSearch性能调优
    • Spring借助Easy-Es操作ES
  • Netty

    • 一文快速了解高性能网络通信框架Netty
    • Netty网络传输简记
    • 来聊聊Netty的ByteBuf
    • 来聊聊Netty消息发送的那些事
    • 解密Netty高性能之谜:NioEventLoop线程池阻塞分析
    • 详解Netty中的责任链Pipeline如何管理ChannelHandler
    • Netty Reactor模型常见知识点小结
    • Netty如何驾驭TCP流式传输?粘包拆包问题全解
    • Netty解码器源码解析
  • 消息队列

    • 一文快速入门消息队列
    • 消息队列RocketMQ入门指南
    • 基于RocketMQ实现分布式事务
    • RocketMQ容器化最佳实践
    • RocketMQ常见问题与深度解析
    • Kafka快速安装与使用指南
  • Nginx

    • Linux下的nginx安装
    • Nginx基础入门总结
    • Nginx核心指令小结
    • Nginx进程结构与核心模块初探
    • Nginx应用进阶HTTP核心模块配置
    • Nginx缓存及HTTPS配置小记
    • nginx高可用实践简记
    • Nginx性能优化
  • 微服务基础

    • 微服务基础知识小结
    • 分布式事务核心概念小结
    • OpenFeign核心知识小结
    • 微服务组件Gateway核心使用小结
    • 分布式事务Seata实践
    • 用 Docker Compose 完成 Seata 的整合部署
  • Nacos

    • Nacos服务注册原理全解析
    • Nacos服务订阅流程全解析
    • Nacos服务变更推送流程全解析
    • 深入解析SpringCloud负载均衡器Loadbalancer
    • Nacos源码环境搭建与调试指南
  • Seata

    • 深度剖析Seata源码
  • Docker部署

    • 一文快速掌握docker的理念和基本使用
    • 使用docker编排容器
    • 基于docker-compose部署微服务基本环境
    • 基于docker容器化部署微服务
    • Gateway全局异常处理及请求响应监控
    • Docker图形化界面工具Portainer最佳实践
  • Go基础

    • 一文带你速通Go语言基础语法
    • 一文快速掌握Go语言切片
    • 来聊聊go语言的hashMap
    • 一文速通go语言类型系统
    • 浅谈Go语言中的面向对象
    • go语言是如何实现协程的
    • 聊聊go语言中的GMP模型
    • 极简的go语言channel入门
    • 聊聊go语言基于epoll的网络并发实现
    • 写给Java开发的Go语言协程实践
  • mini-redis实战

    • 来聊聊我用go手写redis这件事
    • mini-redis如何解析处理客户端请求
    • 实现mini-redis字符串操作
    • 硬核复刻redis底层双向链表核心实现
    • 动手复刻redis之go语言下的字典的设计与落地
    • Go 语言下的 Redis 跳表设计与实现
    • Go 语言版 Redis 有序集合指令复刻探索
  • 项目编排

    • Spring脚手架创建简记
    • Spring脚手架集成分页插件
    • Spring脚手架集成校验框架
    • maven父子模块两种搭建方式简记
    • SpringBoot+Vue3前后端快速整合入门
    • 来聊聊Java项目分层规范
  • 场景设计

    • Java实现文件分片上传
    • 基于时间缓存优化浏览器轮询阻塞问题
    • 基于EasyExcel实现高效导出
    • 10亿数据高效插入MySQL最佳方案
    • 从开源框架中学习那些实用的位运算技巧
  • CI/CD

    • 基于NETAPP实现内网穿透
    • 基于Gitee实现Jenkins自动化部署SpringBoot项目
    • Jenkins离线安装部署教程简记
    • 基于Nexus搭建Maven私服基础入门
    • 基于内网的Jenkins整合gitlab综合方案简记
  • 监控方法论

    • SpringBoot集成Prometheus与Grafana监控
    • Java监控度量Micrometer全解析
    • 从 micrometer计量器角度快速上手promQL
    • 硬核安利一个监控告警开源项目Nightingale
  • Spring AI

    • Spring AI Alibaba深度实战:一文掌握智能体开发全流程
    • Spring AI Alibaba实战:JVM监控诊断Arthas Agent的工程化构建与最佳实践
  • 大模型评测

    • M2.7 真能打!我用两个真实场景测了测,结果有点意外
    • Qoder JetBrains插件评测:祖传代码重构与接口优化实战
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 计算机组成原理

  • 操作系统

    • 如何实现一个高性能服务器
    • Linux文件结构与文件权限
    • Linux常见压缩指令小结
    • 浅谈Linux权限管理
    • Linux核心系统调用详解
    • Linux进程管理
    • Linux线程管理
    • 进程与线程深度解析
    • Linux进程间通信机制
    • 浅谈Linux基于信号处理中断的哲学
    • 从操作系统底层浅谈程序栈的高效性
    • 零拷贝技术原理与实践
      • 引言
      • 详解零拷贝工作原理
        • 传统的IO流程是什么样的
        • 解决传统IO性能瓶颈的思路有哪些
        • mmap+write零拷贝
        • sendfile实现零拷贝
        • sendfile更进一步的优化
        • splice实现零拷贝
      • 聊聊零拷贝技术在大型开源项目中的运用
        • mmap+write技术的运用
        • Kafka对于sendfile技术的运用
      • 小结
      • 参考
    • CPU缓存一致性问题深度解析
    • IO任务与CPU调度艺术
    • 来聊聊函数回调
    • 一个完美主义者的自我救赎
  • 计算机网络

  • 运维

  • 编码最佳实践

  • 计算机基础
  • 操作系统
sharkchili
2026-03-25
目录

零拷贝技术原理与实践

[toc]

# 引言

在现代计算机系统中,高效的IO(输入/输出)操作对于系统整体性能至关重要。随着应用程序对数据处理需求的不断增长,如何减少CPU在IO操作中的开销,提高数据传输效率,成为系统设计中的重要课题。零拷贝(Zero-Copy)技术应运而生,成为解决这一问题的关键技术之一。

零拷贝技术通过减少或消除数据在内存中的拷贝次数,以及减少用户态与内核态之间的上下文切换,显著提升了IO操作的性能。本文将详细介绍零拷贝技术的工作原理及其在实际项目中的应用。

我是 sharkchili ,CSDN Java 领域博客专家,mini-redis的作者,我想写一些有意思的东西,希望对你有帮助,如果你想实时收到我写的硬核的文章也欢迎你关注我的公众号: 写代码的SharkChili 。 因为近期收到很多读者的私信,所以也专门创建了一个交流群,感兴趣的读者可以通过上方的公众号获取笔者的联系方式完成好友添加,点击备注 "加群" 即可和笔者和笔者的朋友们进行深入交流。

# 详解零拷贝工作原理

# 传统的IO流程是什么样的

我们先简单了解一下文件读取的粗略流程,应用程序需要读取文件时,对应的流程为:

  1. 应用程序发起read读取请求。
  2. 系统内核将数据从硬盘加载到内核缓冲区。
  3. 内核缓冲区拷贝用户空间缓冲区。
  4. 应用程序基于用户缓冲区读取数据进行业务流程处理。

基于上述基础,我们在进行深入了解如下几个概念,这对我们了解传统IO流程的理解有着重要的作用:

  1. 内核态:内核态是操作系统内核运行的模式,当我们需要操作系统内核级别的特权指令(例如上文的read操作),就需要切换为内核态。内核态具备操作系统的最高权限,可以访问计算机所有的硬件资源和数据。
  2. 用户态:和内核态相反,应用程序所处的模式也就是用户态,是应用程序运行的模式,在该模式下仅仅能执行普通指令,无法直接访问操作操作系统敏感数据和计算机硬件资源。
  3. 内核缓冲区:内核缓冲区可以理解为应用程序和外部存储介质数据的中介,即应用程序和外部存储介质或者网络socket交互的数据都会经由内核缓冲区进行中转。
  4. 用户缓冲区:提供于应用程序直接读写操作的内存空间,这也就意味着我们需要处理任何外部存储介质或者网络socket数据都必须加载到内核缓冲区应用程序才能进行进一步的操作。
  5. 磁盘空间缓冲区:磁盘缓冲区用于处理那些从磁盘中读取或者准备写入磁盘的数据的临时内存存储空间,它是一种对于磁盘I/O的优化策略,本质上就是通过内存高速的访问速度,减少读取磁盘数据的耗时,从而提高数据读写的执行性能。
  6. PageCache:PageCache也就是我们所说的磁盘高速缓存,操作系统为了保证读写性能,用到了局部性原理,通俗来说也就是操作系统认为近期被读取的数据以及相邻的数据再次被访问的概率很高,于是这些读取过的数据以及相邻的数据都会缓存在PageCache中,当我们再次进行相同数据读取时,如果PageCache存在该数据则会直接返回,反之则会到外部存储介质读取。注意PageCache数据并非一直活跃于内存中,一旦内存空间被占满,由于缓存置换算法,某些长时间未被访问的PageCache就会被淘汰。

有了初步的认识我们就可以更加深入的去分析传统IO流程了,先来说说读的详细流程,对应的时序图如下所示,可以看到完整IO读流程为:

  1. 应用程序发起read调用,因为涉及系统内核的操作,所以需要进行一次模式切换,从用户态转为内核态。
  2. 内核通过外部存储介质或者网络socket发起读操作。
  3. 磁盘或者网络数据写入磁盘缓冲区。
  4. 内核将数据从磁盘缓冲区加载到内核缓冲区。
  5. 内核缓冲区将数据拷贝到用户缓冲区,提供应用程序处理。
  6. 完成上述操作后,再次进行模式切换,从内核态转为用户态。

同理我们再次给出传统IO的写入操作:

  1. 应用程序发起write调用,进行一次模式切换,从用户态转为内核态。
  2. 将数据从用户缓冲区写入内核缓冲区。
  3. 内核缓冲区将数据写入到磁盘缓冲区。
  4. 最终磁盘缓冲区数据被写入到磁盘或者网络套接字中。

# 解决传统IO性能瓶颈的思路有哪些

传统IO模式性能开销存在于以下三点:

  1. 整个数据的传输过程都需要CPU参与,在此过程期间CPU不能做其他事情。
  2. 因为数据需要经过内核缓冲区的缘故,导致发起IO调用时存在用户态到内核态模式上下文切换的开销。
  3. 数据传输时需要在用户缓冲区、内核缓冲区来回拷贝的开销,消耗了大量CPU时间片和内存带宽。

# mmap+write零拷贝

第一点本质上可以通过内存映射文件技术(Memory-mapped Files)解决。该技术通过将文件直接映射到用户空间的内存区域,使得应用程序可以直接访问文件数据,避免了数据在用户空间和内核空间之间的拷贝操作:

通过DMA进行数据写入时,也是一个道理,通过DMA将内核缓冲区数据写入至外部存储/socket:

再来聊聊第二点,针对用户态、内核态上下文切换的开销,我们可以通过内存映射文件技术(Memory-mapped Files)解决。该技术将文件直接映射到用户空间的内存区域,使得应用程序可以直接访问文件数据,避免了数据在用户空间和内核空间之间的拷贝操作,从而减少了上下文切换的开销:

# sendfile实现零拷贝

接下来就是第三点,针对直接文件传输,实际上Linux内核2.1及其以上版本提供sendfile内核函数,该函数可直接将文件数据从一个文件描述符传输到另一个文件描述符(如从文件到socket),减少了数据在内核缓冲区和用户缓冲区之间的拷贝操作,节省了一大部分拷贝的开销:

# sendfile更进一步的优化

实际上sendfile内核函数在Linux的2.4版本做了更进一步的优化,若网卡支持SG-DMA(Scatter-Gather DMA)技术的情况下,上一步将磁盘数据写入到内核缓冲区再通过CPU将磁盘数据拷贝到socket缓冲区的步骤可以省去,通过DMA控制器将数据直接写入到网卡,将写入的文件描述符和数据长度告知socket缓冲区,由此通过避免CPU参与,完成大文件的高效传输:

# splice实现零拷贝

除了sendfile,Linux还提供了splice系统调用,它可以在两个文件描述符之间移动数据,其中一个必须是管道描述符。splice通过在内核空间中直接移动数据,避免了用户空间和内核空间之间的数据拷贝,进一步提升了IO性能:

应用程序 → splice() → 管道缓冲区 → splice() → 目标文件描述符
1

splice特别适用于需要在文件和管道之间传输数据的场景,例如在网络服务器中将文件数据传输到网络套接字。

# 聊聊零拷贝技术在大型开源项目中的运用

# mmap+write技术的运用

对于mmap+write技术的运用,最典型的就是RocketMQ中MappedFile的init方法,可以看到它的mappedByteBuffer 就是通过map方法与内核缓冲区构成映射,实现尽可能少的数据拷贝提升数据读写性能:

private void init(final String fileName, final int fileSize) throws IOException {
	//封装文件信息
    this.fileName = fileName;
    this.fileSize = fileSize;
    this.file = new File(fileName);
    this.fileFromOffset = Long.parseLong(this.file.getName());
    boolean ok = false;
	
    ensureDirOK(this.file.getParent());

    try {
    	//与文件file的内核缓冲区数据构成映射,并将内核缓冲区数据地址信息封装到mappedByteBuffer 
        this.fileChannel = new RandomAccessFile(this.file, "rw").getChannel();
        this.mappedByteBuffer = this.fileChannel.map(MapMode.READ_WRITE, 0, fileSize);
       //......
    } catch (FileNotFoundException e) {
          //......
    } catch (IOException e) {
         //......
    } finally {
        if (!ok && this.fileChannel != null) {
            this.fileChannel.close();
        }
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

从java开发者的角度来说,mmap+write技术在java中的实现有如下优缺点,先来说说优点:

  1. 通过内存映射减少了内核缓冲区和用户缓冲区来回拷贝的开销,提升程序读写效率。
  2. 对于小文件,这种方式即使频繁调用,效果也会比sendfile更好。

说完了优点,我们再来说说缺点:

  1. MappedByteBuffer 一次只能映射2G的文件,超出则会抛出异常,这也是为什么RocketMQ的CommitLog日志文件大小为1G。
  2. 在网络传输过程中,内核缓冲区的数据仍然需要CPU进行拷贝,在某些场景下相较于sendfile会多消耗CPU资源。
  3. mmap技术内存分配存在复杂的安全性控制,对于内存进行严格管控处理,避免JVM Crash问题。

# Kafka对于sendfile技术的运用

查看Kafka中FileRecords的writeTo方法可知,Kafka中partition leader到follower的消息同步和consumer拉取partition中的消息,都是直接通过transferFrom(底层就是通过sendfile实现)实现的:

// org.apache.kafka.common.record.FileRecords
    @Override
    public long writeTo(GatheringByteChannel destChannel, long offset, int length) throws IOException {
       	//......
        if (destChannel instanceof TransportLayer) {
            TransportLayer tl = (TransportLayer) destChannel;
            //调用transferFrom从channel中拉取数据到destChannel中
            bytesTransferred = tl.transferFrom(channel, position, count);
        } else {
        	//将channel数据写到destChannel中
            bytesTransferred = channel.transferTo(position, count, destChannel);
        }
        return bytesTransferred;
    }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

这种方式实现的零拷贝可以很好的利用DMA方式,尽可能减少CPU的消耗,对于大块的文件传输,效率会高一些,但它也有着如下几个缺点:

  1. 就当前java的实现而言,它仅仅支持源为FileChannel传输到socketChannel,不支持源为socketChannel。
  2. 对于小文件传输,处理效率不如mmap方式,只能是BIO方式传输,不能使用NIO。

# 小结

零拷贝技术通过减少或消除数据在内存中的拷贝次数,以及减少用户态与内核态之间的上下文切换,显著提升了IO操作的性能。本文详细介绍了以下几种零拷贝技术:

  1. mmap+write:通过内存映射文件技术,将文件直接映射到用户空间,避免了数据在用户空间和内核空间之间的拷贝。
  2. sendfile:通过系统调用直接在内核空间中传输数据,避免了用户空间和内核空间之间的数据拷贝。
  3. splice:通过管道在内核空间中传输数据,进一步减少了数据拷贝。

在实际应用中,不同的零拷贝技术适用于不同的场景:

  • 对于小文件传输,mmap方式通常表现更好
  • 对于大文件传输,sendfile方式通常表现更好
  • 在网络传输中,sendfile可以更好地利用DMA技术,减少CPU消耗

通过合理选择和应用零拷贝技术,可以显著提升系统的IO性能,特别是在处理大量数据传输的场景中。

我是 sharkchili ,CSDN Java 领域博客专家,mini-redis的作者,我想写一些有意思的东西,希望对你有帮助,如果你想实时收到我写的硬核的文章也欢迎你关注我的公众号: 写代码的SharkChili 。 因为近期收到很多读者的私信,所以也专门创建了一个交流群,感兴趣的读者可以通过上方的公众号获取笔者的联系方式完成好友添加,点击备注 "加群" 即可和笔者和笔者的朋友们进行深入交流。

# 参考

原来 8 张图,就可以搞懂「零拷贝」了:https://www.cnblogs.com/xiaolincoding/p/13719610.html (opens new window) 【linux】图文并茂|彻底搞懂零拷贝(Zero-Copy)技术:https://zhuanlan.zhihu.com/p/362499466 (opens new window) 彻底理解零拷贝,看这一篇就够了:https://blog.csdn.net/huhigher/article/details/134908031 (opens new window) Using MemoryMappedBuffer to handle large file in Java:https://www.pixelstech.net/article/1447399705-Using-MemoryMappedBuffer-to-handle-large-file-in-Java (opens new window) Java NIO - 零拷贝实现:https://www.pdai.tech/md/java/io/java-io-nio-zerocopy.html#mappedbytebuffer (opens new window) 如何使用 ethtool 命令管理以太网卡 | Linux 中国:https://zhuanlan.zhihu.com/p/146383216 (opens new window) RocketMQ原理详解——零拷贝机制:https://blog.csdn.net/qq_40744423/article/details/124563671 (opens new window) 【kafka】源码分析-ZeroCopy助力kafka实现高吞吐:https://blog.csdn.net/u013128262/article/details/105255854 (opens new window) Linux 零拷贝技术-mmap与sendFile:https://www.cnblogs.com/hongdada/p/16926179.html (opens new window) 《趣话计算机底层技术》

编辑 (opens new window)
上次更新: 2026/03/26, 01:05:31
从操作系统底层浅谈程序栈的高效性
CPU缓存一致性问题深度解析

← 从操作系统底层浅谈程序栈的高效性 CPU缓存一致性问题深度解析→

最近更新
01
基于EasyExcel实现高效导出
03-25
02
从开源框架中学习那些实用的位运算技巧
03-25
03
浅谈分布式架构设计思想和常见优化手段
03-25
更多文章>
Theme by Vdoing | Copyright © 2025-2026 Evan Xu | MIT License | 桂ICP备2024034950号 | 桂公网安备45142202000030
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×
×