大模型浪潮,率先将算力推至风口浪尖。大模型对算力的需求是显而易见的,但更关键的点可能在于是否能把算力更高效地挖掘出来。
深度学习出现之前,用于AI训练的算力增长大约每20个月翻一番;之后,用于AI训练的算力大约每6个月翻一番;2012年后,全球头部AI模型训练算力需求更是加速到每3-4个月翻一番,即平均每年算力增长幅度达到惊人的10倍;目前大模型发展如火如荼,训练算力需求有望扩张到原来的10-100倍,算力需求的指数级增长曲线将更加陡峭。
作为算力的供给载体,数据中心如何优化升级以满足人工智能对于算力的需要成为当下紧要任务。作为大模型时代的重要基础设施,数据中心的架构和商业模式都将持续变革。
大模型时代数据中心如何发展?
目前我国已经形成体系较为完整,规模体量庞大,创新活跃的计算产业。算力基础设施的供给体系已经初步形成,助力经济社会数字化转型已经取得了积极的成效。
2023年算力大会AIGC数据中心新技术发展论坛上行业专家给出了答案,中国信息通信研究院云计算与大数据所所长何宝宏在致辞中表示,在AI新浪潮的生态架构中,算力基础设施的创新和发展以及大模型的应用革新,为行业带来了全新的发展机遇。人工智能引领全球产业的新变革,算力支撑数字经济高质量发展,未来高效的运维、快速交付、绿色节能、多元算力和云边协同等将成为算力基础设施的新趋势。
以ChatGPT为首的大语言模型时代到来,为数字经济与人工智能的发展刻下了新的印记。而算力产业也迎来新的发展机遇和调整,对于产业上下游成员他们又有着怎样的思考呢?
芯片是数据中心的底座,Intel运营商事业部中国区技术总监侯志强在《提升算力与能耗有效性,构建新型IT基础设施》主题演讲中表示,我们一方面通过数字化提升企业的运营管理水平,另一方面也需要保持可持续发展的策略。针对绿色数据中心,英特尔推出了绿色数据中心技术框架2.0从基础设施的能耗有效性、散热有效性、智能化和可循环设计方面入手解决问题。
服务器是数据中心的重要组成,浪潮信息服务器产品线总经理赵帅在《生成式AI时代 算力基础设施的挑战与创新》主题演讲中表示,多元、开放、高效、融合的新型算力基础设施可以应对AIGC时代算力挑战。为此,浪潮信息发布了《开放加速规范AI服务器设计指南》,为用户提供最佳匹配应用场景的AI算力产品方案,把握生成式AI爆发带来的算力产业巨大机遇。
在新的大模型范式下,算力不仅仅是计算载体,更是智能载体。AI2.0时代,我们需要将算力和数据有机结合训练模型,而腾讯云进行了积极探索。
腾讯云AI行业高级架构师王彬在《大模型新范式下的挑战和机会》主题演讲中表示,在系统工程层面,技术实践经验往往决定了最终模型的产出时效。借助腾讯云的基础设施能力和加速优化能力,在研发过程中帮助企业更系统化、更便捷、更高效的训练自己的模型。
大模型时代,IDC迎来全新发展期,数据中心全生命周期面临大变革。ODCC数据中心设施工作组组长李代程在《新机遇 新征程——ODCC设施技术创新与探索》主题演讲中表示,这些变革表现为绿色低碳、高密高效、弹性灵活、智能运营等方面。ODCC聚焦行业热点技术,包括液冷、AI冷却、光伏、氢能等,与行业专家持续探讨,累计发布了数十项成果,共同推进产业的繁荣。
总之,从芯片到服务器、云厂商、开放计算组织,整个算力产业链已经在积极应对大语言模型带来的变革,推动算力产业的转型升级。
秦淮数据面对高算力需求 打造AIGC时代的新型数据中心
秦淮数据一直深刻计算产业,其对于产业需求和变革也有着自己的思考。面对大规模、高算力、高弹性、高能效、智能化的五大挑战,秦淮数据通过创新“磐石”六维一体架构重塑AIGC时代的数据中心。
在2023中国算力(基础设施)大会上,秦淮数据荣获系列重磅荣誉:
随着AIGC业务需求的快速发展,芯片、服务器和机柜功率不断攀升,面对高功率密度AI应用场景,数据中心呈现高密化、规模化的发展趋势,创新供电和制冷等技术应运而生。
针对AIGC时代高算力的GPU或CPU服务器供电与制冷问题,充分满足客户不同计算场景需求,秦淮数据联合合作伙伴首次发布AIGC时代数据中心全栈解决方案,与此同时,秦淮数据集团和中国信息通信研究院承办的AIGC时代数据中心新技术发展论坛在银川召开,论坛以“拥抱产业生态 驱动智算未来”为主题,聚焦大模型时代数据中心的发展趋势和创新路径。
秦淮数据集团CTO张炳华在《拥抱产业生态 驱动智算未来》主题分享中表示,AIGC时代数据中心全栈解决方案为大模型时代数据中心提供了全新的技术框架和演进路线,秦淮数据凭借技术创新力与合作伙伴的敏捷协同力,以领先的设计理念,打破数据中心的创新边界,通过多项技术的融合创新,赋能智算产业快速发展。
该方案聚焦新算力、快交付、低碳化三大核心价值,面向大规模、高算力、高弹性、高能效、智能化五大目标,发布四大核心产品方案,包括“玄铁”智能电力模块3.0、“玄冰”磁悬浮相变系统、大规模全预制数据中心技术、鲲鹏IDC运营平台。
从供电、制冷到数据中心建设和运维,秦淮数据打造的AIGC时代数据中心全栈解决方案展示了全链条的创新成果。基于此,秦淮数据“玄铁”智能电力模块3.0,“玄冰”磁悬浮相变冷却技术荣获了2023中国算力大会“DC Tech创新先锋”优秀成果。
AIGC时代数据中心全栈解决方案既具有前瞻性又具有落地性,展现了秦淮数据对于为了数据中心的新思考和技术创新。
为深入贯彻国家各项政策文件,充分发挥业界专家力量,深化算力、存力、运力技术创新和应用赋能,指导我国算力产业高质量发展,前期,中国工程院邬贺铨院士等八位院士领衔的“中国算力专家委员会”广泛开展专家组委员征集工作,经过报名、评审等环节,“中国算力专家委员会”又添新力量。在2023中国算力大会上,“中国算力专家委员会”盛大推进。
中国工程院倪光南院士、中国工程院沈昌祥院士、中国工程院张宏科院士、中国通信标准化协会闻库理事长、中国互联网协会陈家春常务副秘书长、中国信息通信研究院余晓晖院长、工信部通信科技委常委周建明先生、工信部新闻宣传中心王保平总编辑、华为公司副总裁周跃峰先生、中兴通讯高级副总裁王翔先生、秦淮数据首席技术官张炳华先生共同上台出席推进仪式。
协同创新,全栈解决方案彰显秦淮数据生态力
AIGC时代数据中心全栈解决方案是秦淮数据集团和生态合作伙伴携手打造的解决方案,论坛的实践分享环节也是由秦淮数据专家与合作伙伴嘉宾联合进行,分别聚焦分别聚焦极简供电、极致冷却、全预制化、创新实践四大话题。
在供电方面,秦淮数据作为第三方超大规模数据中心建设的先行者,在客户应用和场景需求的层面有更深刻的认知。为了更好地服务客户需求,满足快速部署、敏捷交付的建设要求,提高数据中心的系统可用性,“玄铁”智能电力模块3.0应运而生。以创新设计有效降低数据中心的能耗,提高能源使用效率,从而降低运营成本,提高数据中心的经济效益。
“玄铁”智能电力模块3.0,精简供电链路,全铜排连接,系统效率可高达98.5%;创新的结构设计,在实现完整可靠保护功能的同时,配电面积节省20%+;完全实现工厂预制和调试,现场快速部署,交付周期从2个月缩短至1周可完成;采用功能单元模组设计,灵活组合,多场景适配;按需设置运输单元,降低土建预留要求,初期建设及后期扩容均适用;独特的UPS推出推入结构,极大方便后期检修和更换;关键设备多品牌兼容,提高招采灵活性;模块级监控系统,全量数据实时通讯。可有效应对算力激增下数据中心供配电系统部署周期长、能源效率低、运营成本高等挑战,保障供电全生命周期的安全可靠。
在制冷方面,要打造绿色数据中心,降低制冷系统能耗是核心关键。秦淮数据集团产品规划和研发总监王舜在《“玄冰”磁悬浮相变冷却系统》主题分享中表示,随着功率密度的提升,建筑的多样,磁悬浮相变冷却系统将成为冷板液冷空气冷却部分最佳的拍档。“玄冰”磁悬浮相变冷却系统具备极简架构、技术融合、无油离心、高效节能、弹性部署等特点。解决数据中心高密度和极致能效问题,为AIGC时代的数据中心用户带来极致的“冷”体验。
“玄冰”磁悬浮相变冷却技术,是集中式冷冻水系统的最佳分布式替代方案,它将磁悬浮技术、泵驱相变技术、分布多联技术、蒸发冷凝技术、薄板风墙技术、蒸发换热技术、直流风机技术及AI智能群控技术有机融合,解决单机柜10-35kW高功率密度的空气冷却技术难题。同时,突破建筑条件制约,与冷板液冷有机结合,成为全面支持AIGC时代的最佳冷却方案之一。
“玄冰”磁悬浮相变冷却技术分为室内机和室外机两部分,一台室外机可以与多台室内机连接。室外机根据当地气候和水资源情况,可以采用风冷冷凝、蒸发冷凝和水冷冷凝三种方式之一。室外机的核心器件包括可支持低压比运行的磁悬浮无油离心压缩机,实现自然冷却和无油可靠运行的制冷剂泵。室内机采用薄板风墙方案,它的厚度仅为0.2-0.3m,大大节省了机房空间;它还配备了送风温度更均匀的高效换热的翅片铜管换热器和G4过滤器,前者确保制冷剂在换热器内高效蒸发吸热,后者提升机房空气清洁度。
快速部署是当前数据中心的强需求,预制集装箱数据中心的最大优势之一是可以更快地部署,而且通常总成本TCO更低。秦淮数据集团产品研发部总监梁旭飞在《创新数据中心建设模式探讨》主题分享中表示,集装箱替代传统的建筑基建,它的功率密度可达传统数据中心的6倍,而建制成本不到传统数据中心的一半。当大模型对算力的灵活性越来越高,用预制式模块化数据中心的“集装箱+”方案,高效、绿色、可靠,项目现场的施工压缩到了6个月,总体的投资回报速度提高10%。
大规模全预制数据中心技术,开启了国内工厂预制+海外钢结构建造的高质量快速交付新模式。在马来西亚正在建设的数据中心项目,采用整体模块化设计、模块化组装,大幅缩减了海外项目建设周期,仅仅用时8个月完成了从土建桩基到机电安装完成、综合测试到交付业务,再次打破传统数据中心项目建设最短周期的记录。
在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。秦淮数据集团鲲鹏产品设计总监纪少鹏在《鲲鹏IDC运营平台的进阶之路》主题分享中表示,鲲鹏IDC运营管理平台根据不同的功能和场景,分成了八大核心功能模块,包括了可视化、监控、运维、运营、服务等,采用了松耦合设计、云边协同、大中台小前台的交付模式。
鲲鹏IDC运营管理平台的进阶之路,实现了运维标准化体系的完美落地,不断为运维管理者和一线运维者赋能;采用大数据技术架构构建,以大数据全栈技术能力为支撑,是一个标准化、智能化、多技术、跨地域管理的综合性创新平台;同时,平台紧密贴合数据中心运营平台技术和发展趋势,推进数据中心运维进入AI时代。
数据中心规划设计的重要性不言而喻,其直接影响到数据中心的空间利用率和设备的布局效果。秦淮数据集团设计院院长郭震在《新形势下的数据中心规划设计》演讲中表示,面对模块化、标准化、兼容性、弹性的数据中心规划设计需求,秦淮数据在建筑布局上充分考虑预制化的安装条件,建筑设计与预制模块设计同步,实现快速交付、可复用。
生态协同是数字经济时代的鲜明特色,秦淮数据与众多合作伙伴在数据中心领域的联合创新显示了生态的活力和价值。
结语
AIGC时代已经到来,算力产业迎来巨大的市场机遇。展望未来,秦淮数据将继续拥抱产业生态,与行业伙伴精诚合作、联合创新,推动数据中心领先技术持续落地,给行业输出更多的经典案例,共同驱动智算产业快速迭代,构筑美好未来。