RDMA,远程直接内存访问,将数据直接从一台计算机的内存传输到另一台计算机的内存,绕过CPU、操作系统,可以减少延迟,快速传递数据。
传统TCP/IP网络通信内核会参与,数据移动与复制时会增大内核处理需求,从而限制了传输带宽。为消除数据传输增加的计算任务,实现高通量、低延迟网络通信,RDMA技术被提出,其特别适合应用在大规模并行计算机集群中,例如数据中心。
早期,RDMA主要应用在高性能计算方面。在万物互联、人工智能产业快速发展背景下,数据产生量迅速增长,数据中心建设规模不断扩大,高速数据传输对网络带宽的要求不断提高,传统TCP/IP协议会占用大量CPU算力,为实现高性能网络通信,RDMA技术在数据中心领域被大规模使用。
在我国,RDMA技术相关布局企业主要有华为、阿里巴巴、腾讯、百度、中兴通讯、浪潮集团、联想集团、北京数渡等。这些企业在RDMA领域的布局主要集中在高性能计算、数据中心、云计算、人工智能等方面。2025年3月,北京数渡信息科技有限公司公开了一项名为“一种基于PCIe的RDMA连接管理方法”的专利。
支持RDMA的通信技术主要包括InfiniBand(IB)、以太网RoCE、以太网iWARP等。InfiniBand(IB)直接支持RDMA,需要专用网卡、交换机,其性能好、成本高;以太网RoCE需要支持RoCE的网卡,在标准以太网架构上使用RDMA,其性能好、成本低;以太网iWARP是互联网广域RDMA协议,需要支持iWARP的网卡,在标准以太网架构上使用RDMA,允许通过TCP执行RDMA网络协议,其性能稍差,成本居中。
新思界
行业分析人士表示,2024年8月,我国工信部发布国家重点研发计划“多模态网络与通信”重点专项2024年度项目申报指南,提出面向未来智算网络应用对超高吞吐、超低时延、广域传输的需求,针对传统RDMA网络面临难以高效广域传输的挑战,开展广域RDMA技术研究。在AI大模型训练规模持续扩大、智算需求快速增长背景下,我国政府对广域RDMA技术发展极为重视。