北京2022年10月26日 /美通社/ -- 从智能网卡的出现,到DPU在云基础设施领域的兴起,其所涉及到的芯片、产品以及云服务等多个领域的提供商,对于智能网卡的解读也越加丰富。与此同时,伴随DPU的不断迭代升级,进一步引发了整个产业对于IT基础架构体系未来演进方向的热烈探讨。
在由高效能服务器和存储技术国家重点实验室与开放计算中国社区联合主办的"第六期开放计算技术沙龙:网络技术研究与实践"线上研讨会中,来自阿里云神龙计算平台、中国电子云、NVIDIA、矩向科技以及网络、芯片领域的合作伙伴、专家,围绕DPU的价值、作用以及未来发展方向,进行了充分解读。
DPU 使数据中心性能提升 开放全新"视野"
DPU作为数据处理单元,它在网络计算领域中正扮演着关键角色。借助DPU,传统通信方式中所存在的网络拥塞及主机CPU资源被大量消耗的问题有望得到有效解决。同时,它还能够有效应对多租户应用性能隔离的难题。
NVIDIA网络高级总监宋庆春介绍到,DPU作为NVIDIA "云原生超级计算架构"中的重要一员,使计算平台、网络、存储均成为计算单元,实现了在一个数据中心里,数据在哪里,计算就在哪里。如此也就实现了在一个统一的架构下面,无论是像AI训练这样的大规模应用,还是非常小的一些基于VM实现的应用,租户都可以使其性能达到最大化。
宋庆春通过一组数据,展现了DPU给用户所带来的收益。iAlltoall是HPC、AI应用过程中会经常采用的一种通信模型,通过用DPU和CPU实现计算通信Overlap,让iAlltoall性能得到44%提升。iAllgather是AI大规模模型训练过程中会使用的一个通信模型,通过DPU和CPU计算通信的Overlap,能够让iAllgather性能提升36%。
面对DPU在超大规模云数据中心领域被逐渐广泛接受的现状,矩向科技创始人黄朝波指出当下的DPU演进还在持续当中。黄朝波认为,伴随着Chiplet等技术的成熟,在边缘计算和企业云等规模更大、计算负载轻量的一些场景中,CPU、GPU和DPU会融合成一颗芯片,市场上将会出现超异构处理器——HPU产品。
智能网卡演进 促动数据中心体系架构创新
面对业界对于SmartNIC、DPU、IPU抑或是新进"登场"的CIPU的广泛关注,中国电子云研发副总裁刘年超认为,智能网卡虽然在命名方式方面缺乏统一的标准,但它的出现反映出一种趋势,以CPU为中心的体系架构,正在发生新的变化。
新一代 DPU/IPU 设备的共同特点是它们采用易于编程的多核CPU、先进的网络接口以及一组强大的网络、存储和安全加速器,并可以进行编程以执行多个软件定义的硬件加速功能。刘年超认为,这不仅在技术层面实现了对Host CPU计算性能的卸载,同时对于云服务商而言,DPU的应用能够让云服务商有更多可进行销售的产品或服务,提升了主机CPU的对外售卖能力。
在大规模部署过程中,刘年超认为,DPU作为一个"小系统",对它的运维和管理也显得尤为重要。中国电子云通过独立的BMC,面对不同用户的实际应用场景,均可实现对DPU网卡的直接管理。
在过去5年的DPU研发迭代过程中,阿里云愈加意识到自身的数据中心架构正在发生新的变化。阿里云神龙计算平台负责人蒋林泉认为阿里云的新架构有可能不再以CPU为核心,它更需要借助以阿里云自主研发的CIPU(Cloud Infrastructure Processing Unit)为中心,连接起SSD、RDMA,CPU、GPU和其他异构计算设备。这一点已经在阿里云自研的云操作系统——飞天的一步步演进过程中得到了验证。阿里云已经认识到,当初的智能网卡已经不再是插在服务器上的一张网卡。在未来,它的物理形态很有可能还会发生变化。
面对智能网卡以及DPU的技术演进特点,为了确保用户在智能网卡的应用实践过程中,最大限度降低试错成本、契合应用场景的实际需求,浪潮网络在智能网卡解决方案的制定过程中,从软、硬件层面充分考虑了不同规模、不同IT技术能力储备的企业用户需求。
针对IT能力储备有限的传统企业,浪潮网络提供完备的软硬件一体化智能网卡方案,为上层应用提供标准的计算、存储、网络卸载和加速服务,简化与主机软件的集成,帮助客户快速获取智能网卡的技术红利。从而降低最终用户在网络应用开发和运维管理等方面的技术门槛。对于大型互联网、电信以及金融行业,浪潮网络不仅提供了相应的技术支持服务,在产品线上也提供了业界领先,具备集成2个25GE或1个100GE以太网口,与主机端实现PCIe 4.0高速连接的N20X智能网卡。
浪潮网络智能网卡具备三大性能优势:
与此同时,智能网卡的应用需求正在从超算平台、超大规模数据中心,逐渐向边缘数据中心渗透。这种趋势更加凸显出云边协同对于构建开放网络的重要性。浪潮网络所打造的云边协同智慧联接架构,在云中心侧以领先的开放网络平台为核心,打造高性能、低成本、弹性可扩展的解决方案,使新业务上线时间缩短20%,提升排障效率30%,实现秒级网络业务调整,满足云业务弹性、敏捷扩展的需求。在边缘侧,浪潮网络通过新一代边缘网络平台,融合传统有线、无线网络,以及Zigbee、LoRa等终端网络,打造低延迟、实时可靠的边缘网络,实现网络的智能可视化调度,将网络传输力提升27%、算力利用率提升30%。目前,浪潮网络的云边协同智慧联接架构已在政府、教育、医疗、制造等诸多行业得到广泛部署和应用。
对于智能网卡、DPU技术及产品的长期研发、推广,体现出浪潮网络以产品创新为引擎的技术实力。浪潮网络通过云边协同的智慧网络,实现云、边、端的智慧联接、资源调度,为数据赋能,推动行业的数字化、智能化发展。