北京2019年10月14日 /美通社/ -- 10月7日,诺贝尔委员会公布了今年首个诺贝尔奖:诺贝尔生理学或医学奖。奖项颁发给三位科学家,以表彰他们对于细胞是怎么感知并适应氧气变化的发现。在生物科学领域,近年来还涌现了屠呦呦等诺贝尔获奖者,可见生物科学在推动人类发展方面的重大意义。现代生物医学研究需建立在大量实验样本、生物样本、科研中间数据的基础之上,如何破解这些“生命科学密码”,为生物研究提供大数据支持,成为学术界以及生物科学行业的关注点。
IT技术与生物医学融合,曙光助力上海生科院破译生命密码
生物技术的发展需要信息技术提供强有力的计算工具,借助先进的IT技术解决方案,完成海量实验数据的存储、读取与挖掘处理。同时,信息技术还有助于加强生物技术领域的各种数据库管理、信息传递、检索和资源共享等。
利用信息技术对生物科学数据应用领域进行深入分析,才能破译生命密码,近期,曙光成功中标上海生科院生物“医学大数据设施-信息系统基础平台”项目,助力上海生科院在生命科学研究、生物医药研发、临床医学研究与应用的发展。
生物医学大数据基础设施深刻体现前沿信息技术与现代生命科学的高度交叉,采用大规模存储为底层架构,以海量生物医学大数据资源的高等级安全保藏为核心,实施生物医学大数据资源的汇聚、管理、共享和挖掘,形成服务于全国的生物医学大数据研究与应用的重大与关键技术条件设施。
满足复杂运算需求,曙光ParaStor为“生物信息”提供高可靠平台
曙光凭借多年在生物基因领域积累的经验,打造生物基因行业云存储解决方案,助力“生命科学”探索。曙光分布式存储系统ParaStor更是凭借先进的应用匹配性与超高性能,赢得了市场的认可。
此次,曙光助力上海生科院生物“医学大数据设施-信息系统基础平台”项目,将建设一个面向生命科学研究、生物医药研发、临床医学研究与应用,推动生物医药技术企业创新发展,以共享式服务为导向的科学技术综合体。
曙光以ParaStor构建的大规模存储系统,以海量生物医学大数据资源的高等级安全保藏为核心,支撑高通量专业云计算服务和大数据人工智能挖掘。实现生物医学大数据资源的汇聚、管理、共享和挖掘,成为面向全社会的生物医学大数据标准化整合、安全管理、高效共享的存储中心。
存储系统作为重要的基础架构,在本次项目中有着极为严苛的要求。生物医学数据的主要类型为文本文件、图像文件、二进制文件等非结构化数据,对存储的要求主要在存储容量的大小和大文件的读写通量的高低,而少量的关键数据库、索引等结构化数据,对存储的要求是较高 IOPS 和稳定的读写能力。对存储系统的需求可总结为:业务系统存储、高性能存储和大容量存储。
曙光ParaStor通过Scale-Out横向扩展、IB+RDMA高速互联、内核态POSIX协议、智能SSD Cache及小文件聚合等技术,消除传统的Scale-up纵向扩展存储架构的性能局限性,解决生物基因应用中对海量大文件存储场景高聚合带宽、小文件存储场景高IOPS的存储需求。
ParaStor分布式存储系统可通过性能与容量的线性增长,满足对存储系统数据处理能力和扩展性的要求。此外,针对业务系统对可靠性、稳定性的需求,ParaStor分布式存储系统通过多种技术手段,从物理底层到逻辑层全方位保证存储系统高可靠性和高可用性。丰富的协议接口,多类型数据融合存储,可以保证多业务共享。
曙光生物基因行业云存储解决方案广泛运用于生命科学领域,也为广大客户的业务提供了有效的性能保障和技术支持。在天坛医院面向高通量基因组学数据处理与智能病理影像识别系统项目中,ParaStor通过超高吞吐性能大幅度提高了面向测序数据及影像数据科研质量、缩短科研周期、降低科研成本。与第二代基因测试仪illumina、主流应用软件长期对接测试与优化是曙光扎根于该领域的基础,ParaStor对于生物信息复杂应用软件的优质适配以及均衡稳定的性能表现给某国家医疗大数据中心客户留下了深刻的印象。