北京2021年6月25日 /美通社/ -- 生物医药产业是全球新一轮科技革命和产业革命的重点领域,算力则成为破解生命秘密的“钥匙”。作为生物医药产业的南方“硅谷”,生物岛实验室选择浪潮AI服务器NF5488A5和高密度服务器i48,构建了生物医学大数据科创平台,将全基因组测序的效率提升20倍,大大加快了科研进度。
生物岛实验室是广东省以培育创建国家实验室、打造国家实验室“预备队”为目标启动建设的首批省级实验室,瞄准干细胞与再生医学理论与技术的前沿研究,致力于建设重大科技基础设施和平台,打造再生医学与健康前沿研究基地、临床应用基地、成果转化及产业化基地和高水平人才基地,推动生物医药与健康产业高质量发展。
为保障再生医学前沿基础研究、临床创新研究、生物信息、生物安全研究、高端生物医疗器械耗材研发等领域的重点科研项目顺利开展,生物岛实验室推动建设生物医学大数据科创平台。该平台一方面将为数据资源获取、数据交易、数据共享、科学研究、成果发布、成果转化落地、生物信息标准规范制定等业务体系提供全周期支撑服务,帮助临床医生提升科研效率,促进科研创新;另一方面支撑保障建立生物医学大数据供需双方及技术支撑方共同参与的产业联盟雏形。
数据量大、计算力要求高是生物医学研究的突出特征。人类基因组包含30亿个碱基对,一次全基因组检测会产生超过100G的海量数据。即使是对人体局部部位进行测序,大样本的批量处理也会带来极高的计算需求。以结直肠癌测序为例,要对2000对4000例(每个患者测一个正常组织和一个癌变组织)的测序数据完成一次全基因组测序(WGS),基于目前医疗机构现有的设施需要耗费长达数年的时间。
除了分析效率较低之外,生物医学研究还给数据存储与传输带来了挑战:数据增长快,存储费用高,维护成本高;传统硬盘寄送方式周期长、效率低,而且难以进行多中心数据共享访问,无法充分发挥医学数据的价值。
提速20倍 算力为生物医学科研插上“翅膀”
生物岛实验室主要涉及基因测序、医疗影像三维重构、医疗图像分析等HPC和AI应用。在详细了解需求后,浪潮为生物岛实验室提供了“HPC+AI”数据中心方案,整合了浪潮AI服务器NF5488A5、高密度服务器i48、基于BeeGFS的并行存储系统,总体算力超千万亿次,可用存储空间大于3PB,充分满足生物医学研究对计算分析、数据存储的需求,助力生物医学大数据科创平台建设。
其中浪潮AI服务器NF5488A5承担了医疗影像分析、AI辅助诊断等相关应用研究工作,NF5488A5具有强大的性能,一台相当于1000台普通服务器,有利地支撑了生物实验室海量的医疗影像数据计算,大幅提升了AI模型的训练效率。浪潮i48在4U空间内可混合部署8台不同类型的双路计算节点,高扩展高可用。基于浪潮i48,生物岛实验室进行了基因测序方面的HPC应用工作,将人和类似哺乳动物的全基因组组装时间缩短到2天以内。除了硬件平台之外,浪潮还为生物岛实验室配置了HPC集群管理平台ClusterEngine,打通硬件运维、业务管理和应用性能分析,大幅提升HPC集群的资源利用率和计算效率。
对比传统方案,浪潮解决方案不仅能够提供强大的计算力支持、更低TCO的大容量存储,而且还能够实现PB级数据共享,充分挖掘医疗数据价值,并能显著提升数据处理的效率。以结直肠癌测序为例,该平台可以在两个月内完成4000样本的一次全基因组测序(WGS),与过去以“年”为单位的计算周期相比,效率提升高达20倍。
生物岛实验室破解生命密码
推出新型冠状病毒核酸现场快检产品“分子检测卡”,把检测时间控制在半小时左右;建成以癌症、癌旁组织为主的类器官生物样本库,推动抗癌药物的研发;推进免疫细胞再生与转化研究,利用干细胞的再生潜能来治疗多种“顽疾”等等,这些都是生物医药产业的鲜活成果,也是生物岛实验室价值的重要体现。
如今,生物岛实验室生物医学大数据科创平台已经全面投入使用。以该平台为基础,生物岛实验室正在搭建临床组学智能分析系统,整合基因组学、代谢组学、蛋白质组学、表观遗传学等多维度组学测序数据,对组学数据进行标准化存储和管理,为开展临床组学研究提供广泛的数据基础支撑,同时通过基因组学数据与临床大数据的融合,拓展科研维度、提升科研水平,巩固学术地位,促进基础医学成果向临床实践转化。