北京2020年10月23日 /美通社/ -- 10月14日,OpenStack社区发布了第22个版本 -- Victoria。据悉该新版本共收到了来自45个国家/地区、160个不同组织、近800位开发人员的20,000多个代码更改,并同时聚焦Nova、Cinder、Cyborg、Vitrage、Manila等核心组件进行了大量优化工作。针对以上核心组件的技术贡献,浪潮继U版本后排名再次登顶中国第一,有效推动了OpenStack技术创新与发展。
聚焦Cyborg技术创新 高效释放硬件加速性能
作为OIF基金会黄金会员,浪潮始终以“源于开源,馈于开源”为宗旨,多年来持续投入社区贡献,凭借着强大的技术创新能力和深厚的技术底蕴,在裸机、容器、人工智能和加速设备方面取得了突破性进展。
近年来随着深度学习算法的突破,面对当前计算能力的局限性,硬件加速受到越来越多关注,许多研究机构对硬件加速器进行了广泛而深入的研究。尤其是Cyborg加速设备管理项目活跃于社区,管理GPU、FPGA、ASIC、SSD、NVMe等加速资源,为虚拟机提供计算加速,在人工智能和边缘计算领域都充当着不可或缺的角色。
基于此,浪潮从实际应用场景出发,面向AI和边缘计算开发GPU Tesla V100、FPGA、NVMe等硬件驱动,为AI训练、AI推理、AIStation提供硬件加速支持,为硬件设备在AI、边缘等方面性能加速提供了先决条件。
值得提及的是,在之前U版本完成创建虚拟机支持加载Cyborg管理的加速资源基础上,浪潮持续优化虚拟机的高级功能。在最新V版本中完成了支持通过Cyborg管理的虚拟机的疏散和重建操作,并计划在Wallaby版本支持对通过Cyborg管理的虚拟机的搁置和取消搁置、挂起和恢复、挂载和卸载及迁移操作,增加GPU虚拟化管理、NVME SSD驱动等功能,提高Cyborg对加速资源的管理能力。Cyborg支持虚拟机疏散和重建操作的实现原理及方式如下:
优化Vitrage服务 提升查找预警智能化
此外,针对大规模部署场景,浪潮还在V版本中集成Vitrage项目提供根因分析(Root Cause Analysis)服务,进行平台问题定位分析,建立集群内全量资源拓扑并对告警事件进行推导分析,实现故障问题的根因查找和异常故障的预警。
“在最新V版本中,我们根据实际应用场景在环境部署和完善功能方面对Vitrage服务进行了优化。例如增强环境部署能力,在Kolla和Kolla-ansible项目中增加Vitrage-Persistor容器化配置,完成Vitrage服务容器化自动部署配置。”浪潮研发工程师表示。
众所周知,Vitrage数据源分资源类型和告警类型两类,浪潮根据实际应用场景完善根因服务相关功能,告警事件在场景规则分析时应具备时效性,新增过期告警清理功能,统一为告警类型的数据源添加过期告警删除功能,实现Vitrage Graph中过期告警实体的自动化删除。增强Vitrage的告警事件与资源实体匹配能力方案设计及实现如下:
增强Vitrage资源实体与告警事件匹配能力后可达到的效果如下:
“我们计划在Wallaby版本优化资源类型的数据源,增强资源与告警事件的匹配能力,提高Vitrage对其他监控系统的适配能力;另外持续增加新的数据源,以扩大根因服务的支撑生态圈。”浪潮研发工程师总结道。
完善卷数据拷贝机制 提高拷贝效率
浪潮此前在单集群500节点大规模测试场景中发现了稀疏文件拷贝效率低下的问题,本次经过深入代码分析以及多次场景模拟测试,对Cinder项目中的卷数据拷贝机制也进行了深度优化和技术创新,在卷中稀疏文件占比较大时降低拷贝时间,提高拷贝效率。
当卷中的数据为稀疏文件时,在数据拷贝过程中,能够自动识别稀疏文件的空洞空间;从源卷读取到的chunk数据为空洞数据,则自动跳过向目标卷的写入,而仅仅改目标卷的偏移量,从而加速卷拷贝过程。
作为私有云事实标准,OpenStack吸引了国内外几乎所有一线厂商的参与,浪潮在V版本社区贡献领先得益于对OpenStack长期技术投入与积累,体现出社区积极贡献者的责任担当。