omniture

CSDN:华为昇腾AI全栈知识深入解读,师资培训沙龙深圳场圆满落幕!

2020-08-17 16:12

头图 | 视觉中国

 极度缺乏AI人才,已成为中国人工智能产业发展道路上的瓶颈。在国家政策的支持下,众高校初建AI专业者甚多,但高校教师应掌握哪些知识储备来传道授业,大家都是“摸着石头过河”。

将高校AI人才培养教学大纲与厂商成熟落地实践相结合,无疑是一个合理的教学方式。

华为昇腾学院师资培训沙龙,就为中国产学研相结合提供了一个高校教师和华为专家的交流平台!

8月11-12日,华为昇腾学院在深圳举行了为期两天的师资培训沙龙活动,面向广大高校教师提供昇腾全栈全场景AI技术知识点赋能培训。与会老师学完课程后,可以把学习到的昇腾AI知识融入到高校学生的课程培养体系中。

华为的专家们为高校教师带来了哪些精彩分享呢?我们来总结一下这两天的课程集锦。

Day 1

 

华为云与计算BG高校科研与人才发展部部长 曾伟胜:AI教育者是先行者,是领路人

为了让学生紧跟最新的技术潮流,华为希望能够与高校合作,从教学、科研、学生就业,乃至整个产业落地形成一个完整的闭环。为推进产学研结合,华为将联合教育界广大力量,把实践基地、大赛、慕课等结合在一起,在场的各位教师将会是华为与高校教学合作的第一批实践者。

 

智能是新基建的底座,AI教育从业者就是种子,以星星之火燎原,不断影响其他学科。在座的AI教育者是先行者,是领路人,希望华为能够与教育领域的顶尖人才一起,从事这项有意义和使命感的事。

华为昇腾计算业务CTO周斌:这10年,是计算架构创新的黄金时代

华为昇腾计算业务CTO周斌以主题演讲正式开启了培训课程。他表示,因为其本身也曾是一名高校老师,所以更明确应该如何利用华为昇腾计算产业中提供的资源与高校的教学科研结合起来。

计算产业是一个变化非常快的产业,新的技术层出不穷,尤其是以AI为代表的新计算体系的出现,让以前学习的知识很快落伍。

 

为这10年的计算机体系结构做一个定义,是计算架构创新的黄金时代。原因也很简单,芯片级摩尔定律基本上将走到尽头,物理限制导致单芯片计算性能提升遇到瓶颈。所以,AI计算面临的核心问题,在于如何与教学和产业结合,让计算系统最大化地发挥价值。

全爱科技 王中山:华为&全爱科技机器视觉平台联合解决方案

 

华为&全爱科技机器视觉平台联合解决方案是全爱科技基于Atlas200研发的一款教育平台和半导体AI开发平台。

在AI+云+大数据+5G的快速发展下,机器视觉产业正在经历第四次新物种爆炸,在这个背景下,全爱基于华为昇腾Atlas200和全流程开发工具链MindStudio 2.0创建了全爱机器视觉平台。这是一个国产自主、开源开放、模块化、平台化的产品,华为提供半导体和嵌入式/AI教育开发工具,可实现教育平台自主可控,广泛应用于教学科研、智能硬件、智慧安防、自动驾驶等产业应用。

全爱与华为的联合解决方案展示了昇腾处理器应用的广泛可能性,希望未来会有更多人认识和了解昇腾处理器可以用来做什么,预祝开发者和教育从业者能够与鲲鹏共展翅昇腾九万里!

人工智能课程套件

人工智能课程套件是华为提供的辅助高校人工智能专业多门专业课程教学实践的方案套件。基于华为丰富的人工智能项目实践经验,汇集昇腾AI前沿技术,融合实验环境为高校提供的一站式、多领域的实验案例集和通用参考课件,辅助专业学科建设,携手高校共塑精品课堂。

讲师:王豪聪 华为人工智能高级培训讲师

昇腾课程设计理论与实践相结合,产业落地与高校教学大纲紧密联系,尤其强调实践,共设计了10门课程的知识点,包括人工智能导论、机器学习、深度学习、计算机视觉、自然语言处理、语音识别智能芯片与应用、智能系统与应用等。

昇腾AI处理器之所以厉害,在于其独特的软硬件架构!

下午,培训课程介绍了昇腾AI全栈全场景解决方案、昇腾AI处理器硬件和软件架构、以及昇腾AI处理器产品形态和Mind Studio 2.0 工具链。

讲师:图灵解决方案架构师符秋杰

昇腾AI处理器的硬件架构基于达芬奇AI技术架构。达芬奇架构的独特之处,主要在于它3D cube的三维弹性立方体设计,这样的设计能够极大地提高计算性能。另外,达芬奇架构在端、边、云侧共用一套架构,这意味着软件栈统一,在任意场景下开发的应用都可以很便利地迁移到其他场景。

昇腾AI处理器的软件架构由若干子系统组成:

  • GE子系统

  • FE子系统

  • AICPU子系统

  • HCCL子系统,这是一个集成通信的引擎,包括适配器等部分。

  • TBE子系统,算子层架构,定义图推导算子信息,管理算子信息,算子融合规则等,使应用在各种场景可以运行。

  • Runtime&TS子系统,运行时和任务调度系统,主要为神经网络任务分配提供资源管理通道。

  • DVPP子系统,视觉处理模块,为AI core和AICPU提供服务,作为整个软件流程中的编解码和图像处理模块,为神经网络发挥预处理辅助功能。

  • ACL子系统,接口调用流程,根据应用开发中的典型功能抽象出主要的接口调用流程,宝库ACL初始化、运行管理资源申请、算子调用、模型推理、运行管理资源释放、ACL去初始化。

如今,昇腾AI处理器已广泛应用于Atlas 200、Atlas 300、Atlas  800 AI 服务器等华为AI解决方案中,并在政府、医疗、公共安全和制造等多个领域有成熟的行业应用落地。

昇腾开发环境搭建与工具链Mind Studio 2.0

这一节课程介绍了昇腾的开发&运行环境搭建(基于Atlas200DK或者Ai1)与工具链(昇腾软件栈集成开发工具Mind Studio),并基于具体案例进行应用开发实战,讲解了使用ACL接口进行应用开发的基本流程和实现方法。

讲师:昇腾布道师 毛红朝

在具体开发过程中,高校教学场景用到最多的是基于Atlas 300的Ai1推理弹性云服务和Atlas 200 DK开发者套件。

  • 推理平台Ai1弹性云服务器

讲师在现场展示了基于Ai1推理云服务的昇腾开发环境部署方法,包括安装驱动包、固件、环境依赖、环境验证等。现场与会老师在30分钟左右即可完成整个开发环境部署。

  •  Atlas  200 DK(开发者套件)

Atlas开发者套件 Atlas 200 Developer Kit是一个以Ascend 310处理器为核心的开发者板形态的产品,主要功能是将Ascend310处理器的核心功能通过板上的外围接口开放出来,方便用户快速简捷地接入并使用Ascend 310强大的计算能力。

 

Atlas  200 DK的环境部署流程包括环境准备、系统SD卡制作、Mind Studio 部署等几个步骤。

运行环境即Atlas200DK开发者板环境,此环境系统是基于ubuntu-arm的小型片上系统,运行环境需要通过制作SD卡,将运行代码和系统程序烧写到开发者板上。

开发板制卡并启动成功后,需要将开发板连接到开发环境的ubuntu服务器,然后在ubuntu服务器上通过ssh登录开发者板,进行运行环境配置。

  • Mind Studio工具链

在本周刚刚结束的华为HAI 2020大会上,华为正式发布了最新的MindStudio 2.0版本,宣布了一些重大功能更新与增加。

Mind Studio是一套基于IntelliJ框架的开发工具链平台,提供了应用开发、调试、Profiling工具、模型转换、模型可视化功能,以及对开发者来说至关重要的精度对比、自定义算子开发等重要功能,同时还提供了网络移植、优化和分析功能,方便用户开发应用程序。

讲师在培训中讲到,Mind Studio只能安装在Ubuntu服务器上,开发者可以在Ubuntu服务器上使用原生桌面自带的终端gnome-terminal进行安装,也可以在Windows PC上通过SSH登录到Ubuntu服务器进行安装。另外,因为Mind Studio是一款GUI程序,所以在Windows PC上通过SSH登录到Ubuntu服务器进行安装时,需要使用集成了X schmerver的SSH终端(比如MobaXterm)。

昇腾应用案例实战

最后,毛红朝现场展示并讲解了部分昇腾应用案例,例如黑白电影上色,其实现是在基于昇腾AI处理器在神经网络上进行模型训练和上色处理。

Day 2

 

基于昇腾Ai1推理云服务的ACL开发实践

昇腾AI处理器分为训练和推理两种,其中推理芯片支持将训练好的离线模型通过ACL(Ascend Computing Language)编程框架部署到具体业务场景,并对深度神经网络进行特殊优化。本节课程主要介绍如何基于昇腾Ai1推理云服务的ACL进行开发。

 

讲师:华为海思技术专家 杜鹏

ACL有Python和C++两套接口,主要处理离线模型,与训练是解耦的。

 

ACL开发流程包括模型初始化、申请计算资源、加载模型等步骤。

TBE算子开发实践

对于不支持的算子,华为提供TBE算子开发工具,用户可以用TBE自定义开发算子,嵌入到应用中,帮助开发者高效完成目前主流深度神经网络计算。

TBE基于开源的TVM深度学习编译栈,有两种开发方式可供选择,一是TBE DSL,适用于入门开发者,TBE工具提供自动优化机制,给出较优的调度流程;二是TIK,适用于高级开发者,接口偏底层,用户需要自己控制数据流和算子的硬件调度。

现场还展示了TBE算子开发流程、代码结构、执行环境等,现场教师联网实操和练习。

MindSpore开源AI计算框架

针对业界AI开发者所面临的开发门槛高、运行成本高、部署难度大等挑战,MindSpore提出对应的三点技术创新点:新编程范式、新执行模式、新协同模式,帮助开发者更简单、更高效实现AI应用的开发和部署。

讲师:华为中央软件院技术专家 刘微

MindSpore集成与借鉴了业界主流框架的优势,能够提供全场景统一的API,可进行自动微分、自动并行、自动调优;MindSpore IR计算图表达可以执行深度图优化等。

相比同类产品,MindSpore有三个特点,一是开发态友好,AI算法即代码;运行高效,与昇腾芯片对接;部署灵活,全场景按需协同。

在架构层面,MindSpore由Mind Extend、MindExpress、MindCompiler、MIndRT等部分组成。

 

  • MindExpress是一个Python前端,包含High-Level和Low-Level两层API设计,高级API提供训练推理接口,Low-Level提供基础的Tensor、优化器等API,Executor则提供计算的执行控制。

  • MindCompiler是MindSpore的一个重要的子系统,很多核心系统基于这个系统,提供面向Mind IR的图级即时编译能力。

  • Mind IR是MindSpore的一个核心中间表达,通过嵌套式的表达,很简便地支持不同语言的推导。

  • MindRT 子系统是一个统一的运行时系统,可与昇腾芯片进行深度优化,整图下沉到卡上(on-device执行),减小host-device交互开销,提高深度学习训练的效率。

  • MindData子系统负责高效执行训练数据处理pipeline,与计算形成流水,数据及时导入训练。它的关键功能包括用流水线+并行方式,可提高数据处理吞吐量。数据加载上,MindRecord自带元数据,通过聚合存储让数据检索更快。用户还可以自定义Python算子,进行灵活定制。

  • MindInsight子系统是MindSpore的调试调优子系统,提供训练过程可视化、模型溯源、debugger和性能profiling功能。

  • MindArmour子系统可针对可信AI的各个领域提供全面、有效、易用的评测工具和增强方法

目前,基于MindSpore的华为云训练服务,已服务于华为内部各AI部门,并成为华为数据通信网络平台智能控流的支撑,解决拥塞精准控制的难题。

ModelArts AI开发平台及环境配置

ModelArts是华为的一站式AI开发平台,提供数据预处理、模型训练、自动学习和模型部署等能力,为不同级别开发者提供AI开发方案。MindSpore支持ModelArts和本地硬件平台等多种使用方式,最佳匹配Ascend硬件平台,同时也支持在CPU和GPU硬件平台上安装使用。

讲师:昇腾布道师 董永汉

ModelArts模型训练模块中包含ExeML引擎,可自动学习三步创建AI模型,适合没有基础的小白开发者。另外,ModelArts提供大量预置算法进行迁移学习,所有模型基于开源或行业数据及训练完毕,实现精度和速度优化,一键训练,简化模型创建的过程。

  • MindSpore环境配置

MindSpore开源社区官网有安装指导,目前有多种版本供选择:https://www.mindspore.cn/

MindSpore开发实践

在最后的开发实践课上,讲师介绍了MindSpore实验指导及model_zoo的使用方法,现场教师也在讲师的指导下完成了在本地CPU和ModelArts平台上进行了LeNet、checkpoint、Liner Regression、KNN等模型开发、训练、验证和推理。

至此,为期两天的深圳站华为师资培训沙龙活动正式结束!培训课程中干货满满,理论与实践紧密结合,相信让与会高校教师满载而归!

学无止境,还有5站等你打卡!

还没看过瘾或想了解更多培训详情?没关系,还有机会。接下来,华为还将在杭州、武汉、上海、南京、成都5站继续精彩培训课程!

消息来源:CSDN (注:本文由CSDN授权美通社使用)