北京2024年4月26日 /美通社/ -- "谈到当下人工智能的发展形势,现在有一个词叫‘怕错过',每个人都怕错过,我们的客户也怕错过,所以我们都在加速学习。"
"这是一个人工智能的新时代,我们不仅是这个时代的见证者,我们更是这个时代的建设者"
……
百模的战场依旧硝烟四起,AI Agents顺势风起云涌,人工智能技术与应用依然在一路狂奔。今年政府工作报告中提出要开展"人工智能+"行动,成为推动产业升级和经济增长的重要助力。2024年浪潮信息生态伙伴大会(IPF2024)高峰论坛汇聚了应用开发、数据服务、算力系统、算法领域的领军企业。"人工智能+"应该"+"什么、怎么"+"?如何携生态之力,落地"人工智能+",这些话题被激烈讨论。
观风之所起,度风之所向。中科软董事长左春,拓尔思董事长施水才,荣联科技首席科学家王向东,潞晨科技创始人兼董事长尤洋,衔远科技COO、创始合伙人王晓波,浪潮信息高级副总裁刘军等行业大咖在这场高峰对话中交锋交流,每一位与会嘉宾既是AI变革的见证者,更是推动者,他们分享洞见,探讨如何利用AI技术赋能千行百业、如何让"人工智能+"的愿景成为现实。
高峰对话由浪潮信息高级副总裁陈昌浩主持。在不改变原意的基础上,本文对内容进行了编辑整理,希望能够给您带来更多的启发与思考。
话题要点:
嘉宾精彩观点
中科软董事长 左春:
面向垂直领域的大模型应用,第一步是选择基座,第二步是训练模型,第三步是整合解决方案,这三步都要在企业端建立起来,进行技术迁移、搭建、运行,以实用为标准,真正能够实用好用。
拓尔思董事长 施水才:
大模型的落地需要三个"实",实在、实用和实效。实在是指 AI落地的时候工程化交付;实用是和用户的业务吻合;实效是需要降本增效。
荣联科技首席科学家 王向东:
只解决了算力的调度问题是不行的,面对生物医疗、生命科学等领域高算力、海量数据的存储及管理需求,必须与生态伙伴协同才能满足客户要求。
潞晨科技创始人兼董事长 尤洋:
通过极致的算力软件和内存优化来提升算力的附加值,用同样的设备训出更大的模型,帮助企业尽可能降低关键领域大模型的门槛。
衔远科技COO、创始合伙人 王晓波:
对于技术的商业化路径,我们倾向于先改变模式,利用行业认知和模型能力选择一个闭环场景,形成数据飞轮,不断打磨自己的模型和产品,与客户一起成长。
浪潮信息高级副总裁 刘军:
针对算力多元化、模型多样化及场景多样化,浪潮信息希望连接和聚集生态力量,助力每个元脑生态伙伴利用自身场景和数据,通过企业大模型开发平台先行先试,有了锤子再去找钉子,快速入局AI+市场。
IPF2024,你怎么看?
浪潮信息陈昌浩:
再次感谢各位来到IPF2024!今年IPF的主题是"智能元启 创见•共行"。首先想听听各位对今天大会的感受,哪个观点是你们印象最为深刻的?
中科软左春:谈到人工智能的发展,现在有一个词叫"怕错过",每个人都怕错过,我们的客户也怕错过,所以我们都在加速学习。今天看到浪潮信息在系统软件平台的努力,以及算力、算法等方面的成果,我对此印象尤为深刻。
拓尔思施水才:第一,我感受到了浪潮信息正在集全栈AI系统创新之力,全面拥抱AI。第二个印象比较深的是浪潮信息的伙伴生态体系非常健全。第三,大模型应用开发的一体化端到端的开发平台EPAI平台也是亮点,跟我们的拓天LLMOps 有着相似的路径。
荣联科技王向东:两个词,第一个词是信心,彭总讲的以应用为导向,以系统为核心。应用为导向点破了我们所处的时代特点,从技术竞争变成应用的竞争。浪潮信息倡导以系统为核心,以平台带动应用创新,是以生态模式在竞争。对于未来我们与浪潮信息的合作,我们信心十足。第二个词是心动,看着EPAI,很心动,正琢磨着怎么回去跟用户的应用结合。
潞晨科技尤洋:我的第一点感受是,浪潮信息今天所发布的产品、工具有助于合作伙伴们更便捷、高效地去做自己的业务,特别是在AI方面。第二点是,浪潮信息对整个技术,大趋势的理解是比较深的,有利于进一步巩固生态的力量。
衔远科技王晓波:生态两个字就足以热血沸腾了。在大模型赛道,中国领先的是丰富的消费场景和应用场景,以及非常好的数据基建。在生态方面,我们很希望拥抱生态,也希望我们自己的产品也有SaaS、MaaS各种服务。
产业链各方,在战略布局上,会选择如何拥抱"AI+" ?
浪潮信息陈昌浩:首先,浪潮信息作为系统厂商,面向算力多元化、场景差异化、大模型多样化的产业现状,会如何加速AI+落地?
浪潮信息刘军:如果从生态模式思考,针对算力多元化、模型多样化及场景多样化问题,浪潮信息期待通过元脑生态来提高整个产业在AI创新落地的效率,我们非常愿意成为这样的平台生态承载者。
元脑生态聚合链接600+算法厂商、8000+系统集成商。对于具备AI开发核心能力的左手伙伴,我们在元脑企智EPAI平台实现对多元算力、多模算法的支持。对于右手伙伴,ISV可针对行业落地的解决方案,落地到各个场景客户这一端,我们希望通过EPAI工具化平台,使右手伙伴能够快速高效的面向领域大模型进行开发并落地。
生态的快速发展和繁荣需要有一个能够连接、聚集力量的产品,这就是今天我们推出企业大模型开发平台(EPAI)的思考。我们希望通过EPAI开发平台,为上万家合作伙伴提供工具箱,提供方法论,凝聚并激发生态的活力、伙伴的创新力,加速赋能千行百业的智能化转型。
浪潮信息陈昌浩:中科软当前面向保险、医疗等领域进行AIGC研究和生态建设。请左总分享一下中科软的经验和体会?
中科软左春:当客户想要建立垂直领域的应用时,他需要选择基座,这个基座是初始化的基座,需要带着通用知识,也需要低能耗;另外它的技术要开放,这个也涉及到开源。为什么要开源呢?因为开源要解决流行性问题,即需要有大量的人来用,很多更新、很多人活跃的维护,流行的开源软件具备重大价值。我们看到客户的第一个环节即是选择基座,在初始化的阶段,需要确定模型参数,参数量与token数并不是越大越好,应该有一个合理的度。
当我们选择基座以后,第二步是训练模型,目标是基于已有的领域知识进行训练实现精准化。在训练过程中,厂家提供的是基座和工具,ISV提供了重要的知识梳理和知识的训练,客户也会根据应用需求来提出自己的方向或者重点。最后,现在AIGC主要的方法是神经网络和向量数据库,都是归纳推断,存在一定误差。人工智能的成果往往是升级版的搜索功能,需要和已有应用软件的经验和能力相结合,把二者合在一起作为一个解决方案,最终以实用效果为衡量标准。
这三步都要在企业端建立起来,在建立的过程中,首先基础技术在于厂家,我们要学习并结合客户需求,把技术做迁移,再搭建、运行,并和已有系统集成。
浪潮信息陈昌浩:AI和大模型发展离不开高质量的数据。请施董分享下,在企业级大模型应用落地时,数据层面所遇到的最核心挑战是什么,该如何更好地将数据转化为"生产力"?
拓尔思施水才:首先,从数据层面,ISV有五种类型。第一种是做是做通用软件产品的,随着开源和云服务的发展,受到很大的冲击。第二类是做行业应用软件,但是行业应用软件未来有一个重大的挑战,用户可能会成为我们的竞争者,这在银行业已经非常明显了。第三个是做人力外包型服务的,也面临着码农被AI取代的风险,人效越来越高,收益越来越低。第四条路是硬件带动软件,要做软硬一体化的东西,要做一体机。第五条路就是拓尔思想做的数据和服务。我认为,未来应该从软件到数件,数据这一块非常有前途。
其次,我们认为数据是大模型最重要的因素之一。因为大模型的大就是参数大,但是大家发现大力出奇迹,蛮力不可续,大模型有能力,没有智力,一味地在用户端搞算力竞赛,成本首先不靠谱,也没有产出。
所以,我认为现在大模型的落地需要三个"实",第一个是实在,第二个是实用,第三个实效。实在是指 AI落地的时候工程化交付非常重要;实用是需要与业务高度相关,需要和用户的业务吻合;实效是需要降本增效。解决这三个问题,是目前大模型应用非常重要的挑战。
浪潮信息陈昌浩:荣联科技正在发力深耕生物医疗、生命科学等领域,请王总谈谈,面向这类强算力、大数据需求的场景领域,如何实现以应用为导向,发挥出"高算效"?
荣联科技王向东:荣联科技把领域的业务需求转变IT需求,然后利用IT技术和业务进行深度融合,协助这个领域的客户做数字化转型。我们将生物医疗、生命科学等领域的特点总结为"两高、两多","两高"是指高算力、高IO迭代并发;"两多"是指多样性的计算需求,多维度数据交叉并存。生命科学领域正利用AI先进技术实现数据的价值化,并驱动自己的业务往前走。从技术角度来看,实质上就是AI的算力服务。
所谓"高算效"是实测性能与资源利用率的双重提升。过去谈到算力,是站在资源角度上描述有多少能力。但实质上经常遇到,客户买的都是最好的东西,但是实测的性能没有发挥出来,效力是不对等的。荣联的优势是将用户的算力需求转为技术支撑,为用户提供高效的算力服务。随着AI技术的不断引入,生命医疗领域呈现通过场景化应用开发,带动多学科的交叉创新研究的趋势。针对高算力、高IO迭代并发、多维度海量数据交叉并存的特点,利用机器学习技术,识别出可并行处理的任务和关键"瓶颈"任务,有针对性的提供不同的算力供给,将多节点并发执行和对瓶颈进行集中算力供给相结合, 最大限度的释放算力,进而提高业务处理效率。
但只解决了算力的调度问题是不行的,面对高算力、海量数据的存储及管理必须与厂商相结合才能满足客户全部要求。因此,荣联和浪潮信息在该领域开展了诸多的合作,譬如研究所的冷冻电镜系统、医院的生命科学实验室平台建设等,当然这也有“元脑生态”的发力作用。
浪潮信息陈昌浩:潞晨科技所推出的开源AI大模型开发系统可显著降低大模型落地成本,请尤洋教授从AI Infra层面分享如何更高效地用好算力,开发大模型的经验?
潞晨科技尤洋:潞晨科技的核心价值是提升算力的附加值。比如说同样的四五台机器,本来它只能训练10亿参数模型,现在能不能训练出百亿参数模型?通过极致的算力软件,内存的优化,把同样的设备训出更大的模型。还有一个角度就是,当机器资源有限时,能不能训练速度快2倍,帮助合作伙伴和客户在有限的资源内,通过优化提升更大的算力价值?
为了实现上述目标,潞晨科技主要往两个点发力,第一点是构造了Colossal-AI Platform系统,并且开源了Open-Sora、ColossalChat等AI大模型解决方案,通过在Colossal-AI把训练速度提升了2-7倍。第二点,我们专注于对算力要求较高的垂直模型或者垂直行业,目前最明显的是视频生成场景,通过我们的技术,帮企业尽可能降低关键领域视频大模型的门槛。
浪潮信息陈昌浩:衔远科技是大模型在B端落地的先行者。请晓波总谈谈大模型发展如何实现技术与应用的协同?在推动大模型落地过程中有哪些挑战?
衔远科技王晓波:如果把技术比作化学,应用就是化工,一项技术的发现或者发展,无论它是偶发的还是突发的,除了技术本身要解决的难点之外,它都逃避不了一个经济的问题。商业化的价值是支撑一项技术能够更好发展的终极动力。
技术以一个什么样的方式、在什么样的阶段去切入商业化,是所有技术在发展过程中都面临的问题。中美发展方向各有不同,目前国内业者有一种思路是追着OpenAI,或者在它的延长线上做事情。另一种思路,站在当下的产业业态当中、价值链各个环节中,优先提升效率,或者先改变模式。衔远科技选择了第二种思路,利用行业的认知和模型能力先选择一个闭环的场景,在这个闭环场景里跟客户一起去成长,形成数据飞轮,并不断打磨自己的模型和产品,以应用倒推模型技术的发展。
产业链各方,该如何携生态之力共推"AI+" ?
浪潮信息陈昌浩:我们知道各领域差异很大,"千行百业、千行千面",当AI+走向落地,离不开生态伙伴的合力推动。请各位用一句话来总结,未来生态该如何协同,各自将在AI产业链中发挥怎样的作用去协力推"AI+"?
中科软左春:"价值与交付是关键"
我用两个关健词来总结,一是价值,要区分自己的价值,一般看领域知识,有的企业是强领域知识,有些相对比较通用。二是交付,交付越通用的产品周期越短,越领域性的交付时间越长。在这两个指标基础上找到了自己的定位,然后利用生态之力协同发展。
拓尔思施才水:"ALL in AI,以数据筑基,智拓未来"
作为ISV来说,全面拥抱AI,我们确定一条规矩:如果这个产品没有AI的基因和元素,停止开发。在生态方面,我认为让伙伴赚到更多的钱,比自己多赚一点更是正路。
荣联科技王向东:"元脑生态,新质生产力落地的最佳实践"
在元脑生态,荣联是右手合作伙伴,是受益者。加入元脑生态是业务决定的,我们的期待做成的事情仅靠一家公司是无法完成的,场景设计出来以后涉及到算法,每投放一批数据和场景,算法都需要优化,基础算力也要调优,这是三个类型角色,是ISV+左手+浪潮信息。
同时,这样的合作的成果,在领域内是可复制的,在成本不断降低的同时,也将极大的促进领域应用的发展。因此,元脑生态也是创造力萃取的平台,是推动新质生产力落地的最佳实践。
潞晨科技尤洋:"我们希望,与浪潮信息一起去解放AI生产力,赋能千行百业"
衔远科技王晓波:"生态就是开放的,行业和人都需要做专业的事情,大家一起协同把专业的事情做大,整个生态就繁荣起来了"
大模型的落地跟一个企业能不能把货卖到消费者是完全一样的,但大模型更加没有边界。我认为生态就是开放的,行业和人都需要做专业的事情,大家一起协同把专业的事情做大,整个生态就繁荣起来了。
浪潮信息陈昌浩:最后再请刘总用一句话总结,浪潮信息对于打造生态共同体,推动AI+落地有怎样的策略和思考?
浪潮信息刘军:"纸上得来终觉浅,绝知此事要躬行。这是一个人工智能的新时代,我们不仅是这个时代的见证者,我们更是这个时代的建设者。"
元脑生态伙伴是一个具有学习成长能力的组织,是业界唯一一个实现AI服务器分销的生态,实现AI调度平台分销和渠道的生态,是把元脑联合解决方案复制落地的生态。
从浪潮信息自身实践来看,目前,EPAI已全面赋能浪潮信息,面向运营、服务、研发等环节,快速孵化出智能客服、智能编程、智能投标助手等应用。以智能投标助手为例,可实现招标参数自动识别,识别准确率达85%有余。而这样的场景落地,是每一个元脑生态伙伴都可以做到的,从自己的场景、自己的数据,采用EPAI工具先把它做起来。就好像我们手里有了锤子,我们就去找钉子,这是特别好的入局方法。