MLPerf全球AI基准测试发榜，浪潮AI服务器斩获半数冠军

浪潮

2021-07-01 21:22 5562

美国东部时间6月30日，国际权威AI基准测试MLPerf公布2021年最新榜单，在固定任务(Closed)赛道的全部8项模型训练任务中，浪潮获得4项性能第一，斩获半数冠军。

北京2021年7月1日 /美通社/ -- 美国东部时间6月30日，国际权威AI基准测试MLPerf™公布2021年最新榜单，在固定任务(Closed)赛道的全部8项模型训练任务中，浪潮获得4项性能第一，斩获半数冠军。

MLPerf™由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等知名学术机构发起成立，是影响力最广的国际AI性能基准评测。此次性能评测基于最新MLPerf™ Training V1.0基准，涵盖了图像分类(ResNet)、医学影像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN)、语音识别(RNN-T)、自然语言理解(BERT)、智能推荐(DLRM)以及强化机器学习(Minigo)8类AI应用场景，每类场景都包含固定任务(Closed)和开放优化(Open)两类性能竞赛。

除浪潮外，Google、NVIDIA、Intel、DELL等12家厂商也参与了此次MLPerf™训练基准测试，竞争十分激烈。最终，浪潮在固定任务(Closed)赛道的全部8项任务中，获得图像分类ResNet、自然语言理解BERT、目标检测SSD和智能推荐DLRM4项训练任务性能冠军，其中，浪潮NF5688M6获得ResNet、DLRM和SSD的单机训练性能第一，NF5488A5获得BERT的单机训练性能桂冠。

凭借卓异的软硬件系统优化能力，浪潮将MLPerf™训练基准的单机效率进一步提升至新的高度。相比2020年MLPerf™ Training v0.7榜单，浪潮刷新了图像分类、自然语言理解、目标检测(SSD)和智能推荐4项任务的单机训练性能纪录，将模型训练耗时分别缩短了17.95%、56.85%、18.61%和42.64%，凸显出优质AI服务器在AI模型训练效率上的巨大价值。

浪潮在MLPerf™基准评测中的出色表现，得益于在AI计算系统创新上卓越的系统设计能力和全栈优化能力。在硬件层面，针对AI训练中常见的密集IO传输瓶颈，浪潮PCIe Retimer Free设计实现了CPU-GPU间通道免中继高速互联，大幅降低通信延迟，极大提升了AI训练效率；同时，针对高负载多GPU协同任务调度，对NUMA节点与GPU之间的数据传输进行全面优化和深度调校，确保训练任务中的数据IO无阻塞；此外，在散热层面，针对目前业界功率最高的500W 80GB A100 GPU，浪潮率先开发的先进片上液冷系统，确保GPU在全功率甚至超频负载下依然稳定工作，将AI计算系统的性能发挥到极致。

在不断斩获MLPerf™冠军的同时，浪潮也把竞赛过程中探索出的高效优化方法回馈至MLPerf社区，推动AI技术的共同进步。在MLPerf™ Training v0.7中，浪潮开创性提出效率更高的ResNet收敛性优化方案：在ImageNet数据集上，仅使用85%的迭代步数就达到了75.9%的目标精度，该优化方案将训练性能提升了15%。目前，该方案已被社区成员采纳，并广泛应用到MLPerf™ Training V1.0测试中，这也是此次ResNet任务成绩得以大幅提升的重要原因。

自2020年至今，浪潮参与了MLPerf™ training v0.7, Inference v0.7, Inference v1.0, training v1.0四次竞赛。已经累计斩获41项冠军。

浪潮是全球领先的AI计算厂商，AI服务器市场份额全球第一，在中国的市场份额已连续四年保持在50%以上。浪潮致力于AI计算平台、资源平台和算法平台的研发创新，并通过元脑生态与AI领先企业共同推进AI产业化和产业AI化进程。

消息来源：浪潮