北京2016年6月24日电 /美通社/ -- 英特尔®发布了其全新一代至强融核™处理器。随着数据量继续激增且日益复杂,业界需要新的硬件、软件和架构来推动更深刻的洞察的获取,进而加速新的发现和促进业务创新,以及推动机器学习和人工智能领域数据分析的下一轮演进。
全新一代英特尔®至强融核™处理器正是获取更深刻洞察的关键。作为英特尔® 可扩展系统框架(英特尔®SSF)的基本要素,英特尔®至强融核™产品家族旨在为易于部署的高性能集群整体解决方案带来关键的计算引擎。
借助英特尔® 至强融核™ 处理器家族1更快速地解决较大挑战
英特尔至强融核处理器是英特尔首款专门针对高度并行工作负载而设计的可独立自启动的主处理器,且首次实现了内存与高速互联技术的集成。作为可独立自启动的 x86 CPU,英特尔至强融核处理器可实现高效扩展,而不会像 GPU 加速器等受到 PCIe 总线的限制。通过消除对 PCIe 总线的依赖性,英特尔至强融核处理器与加速器产品相比,可提供更高的可扩展性,能应对更广泛的工作负载和配置。
集成 16GB 高带宽内存,可为内存访问密集型的工作负载2提供高达 500 GB/秒的可持续高内存带宽,此外,双端口英特尔® Omni-Path 架构(英特尔® OPA)还进一步降低了解决方案成本、能耗和空间占用率。英特尔至强融核处理器是基于开放标准构建的通用 CPU,可有效保障用户未来的软件投资。
在广泛的应用和环境中,从机器学习到高性能计算(HPC),英特尔至强融核产品家族助企业更快速地解决最具挑战性的计算问题,同时提供更高的效率和可扩展性3。该产品家族还能帮助企业借助高性能建模以及仿真、可视化和数据分析取得新突破。
英特尔至强融核处理器的特性和优势还包括:
现在公开发布的配有英特尔至强融核处理器家族的系统,有望在今年9月推出更多选择。迄今为止,英特尔已发运了数万台设备,英特尔预计今年能总共售出100,000台以上。该产品家族的广泛生态系统支持包括 50 多家原始设备制造商(OEM)、ISV 和中间件合作伙伴。更多信息敬请登录:www.intel.com/xeonphi/partners。
英特尔® 至强融核™ 处理器让机器学习更深入
机器学习需要强大的计算能力来运行复杂的数学算法并处理海量数据。面对这些挑战,英特尔通过发布全新一代英特尔®至强融核™处理器家族拓展了机器学习的技术范畴。该英特尔®至强融核™处理器 可为机器学习训练模型(training)提供强劲性能,且借助可独立启动主处理器的灵活性,它可运行多种分析工作负载。基于英特尔®可扩展系统框架的集群采用了英特尔至强融核处理器和集成英特尔® Omni-Path 高速互联,可帮助数据科学家大幅降低复杂的神经网络的训练时间。在32 节点的基础设施中,英特尔至强融核家族的扩展性比 GPU 好1.38倍;在128节点的基础设施中,英特尔至强融核家族将构建训练模型的速度加快了50倍。
英特尔至强融核家族是对英特尔®至强™处理器 E5 家族的有力补充,后者则是机器学习领域4部署最广泛的基础设施。英特尔至强处理器 E5 v4 产品家族极其适用于机器学习评分模型(scoring),且可为广泛数据中心工作负载提供强大性能和重要价值。同时,该英特尔至强处理器家族还可为开发人员提供一致的用于训练和评分的编程模型,以及可用于高性能计算、数据分析和机器学习工作负载的通用架构。
全新英特尔® 可扩展系统框架参考架构
英特尔® SSF 覆盖从小型集群到全球较大的超级计算机的工作负载,可为计算密集型应用、数据密集型应用、机器学习和可视化提供可扩展性和平衡性能。英特尔已发布了其首款英特尔® SSF 参考架构,它为经过优化的 HPC 系统提供推荐的基准硬件和软件配置。英特尔 SSF 参考架构由两种参考设计提供支持,这两种设计记录了 HPC 系统的特殊要求,包括硬件和软件元素以及安装和配置说明。该全新的参考架构和设计可帮助系统构建人员简化设计和验证流程,还可为最终用户提供购买指南以便更加全面地获取英特尔® SSF 的价值,保护广泛的软件应用可移植性。该全新参考架构和设计的更多信息,敬请登录:www.intel.com/SSF.
借助英特尔® HPC Orchestrator 简化软件部署
英特尔® HPC Orchestrator 是一种全新的支持产品家族,可通过减少需要的集成、测试和验证工作来简化高性能系统软件堆栈的实施和后续的持续维护。英特尔 HPC Orchestrator 产品预定于2016年第四季度上市,基于 OpenHPC 社区软件,并可提供专业服务和技术支持。作为首款产品,英特尔® HPC Orchestrator - Advanced 是一种模块化软件堆栈,可提供定制特性、出色性能、可扩展性以及易用性。有关英特尔® HPC Orchestrator 特性和优势的更多信息请访问:www.intel.com/hpcorchestrator。
行业快速采用英特尔 Omni-Path 架构
英特尔 Omni-Path 架构(英特尔® OPA)是一款全新的端到端高速互联解决方案,可针对入门级和大规模高性能集群经济高效地提升高性能计算应用的性能。英特尔® OPA 的市场采用率正迅速激增,目前市场上已有超过 80,000 个节点,且众多系统制造商正大规模发运基于英特尔 OPA 的交换机和服务器平台,包括:戴尔*、富士通*、日立*、惠普*、浪潮*、联想*、NEC*、Oracle*、Quanta*、SGI*、美超微*、Colfax* 等。
英特尔 OPA 部署的主要成功案例,包括:
更多材料和多媒体信息请访问:http://www.intel.com/newsroom/isc。
*其他的名称和品牌可能是其他所有者的资产。
1 英特尔® 至强融核™ 处理器可提供超过 3 Teraflop(每秒万亿次浮点运算)的双精度性能,远快于英特尔® 至强融核™ 处理器 x100 家族的 1 Teraflop 以上双精度性能。
2资料来源:英特尔使用 STREAM Triad 性能指标评测测量了英特尔® 至强融核™ 处理器 7250 的性能(以 GB/秒计),截至 2016 年 3 月。
3 相比单节点,128 节点实现了 50 倍的训练速度提升,基于 AlexNet* 拓扑工作负载(批量大小 = 1024),在运行单节点英特尔至强融核处理器 7250(16 GB MCDRAM,1.4 GHz,68 核)的英特尔® 服务器系统 LADMP2312KXXX41 中使用大型图像数据库,96GB DDR4-2400 MHz,四集群模式,MCDRAM 平面内存模式,Red Hat Enterprise Linux* 6.7 (Santiago),1.0 TB SATA 硬盘 WD1003FZEX-00MK2A0 系统磁盘,运行英特尔® Optimized DNN Framework。有关如何获取二进制的更多信息,请联系您的英特尔代表。节点数量为 32 时扩展效率提升多达 38%,基于 GoogLeNet 深度学习图像分类训练拓扑,使用大型图像数据库,将使用上述配置、英特尔® Optimized DNN Framework(87% 的能效)的单节点英特尔至强融核处理器 7250(16 GB MCDRAM,1.4 GHz,68 核)与各自运行 32 节点的 NVIDIA Tesla* K20 GPU(62% 的能效)的未知主机进行了比较。http://arxiv.org/pdf/1511.00175v2.pdf)
4 英特尔估计基于英特尔至强 E5 处理器内部销售数据和客户反馈
在性能检测过程中涉及的软件及其性能只有在英特尔微处理器的架构下方能得到优化。诸如 SYSmark 和 MobileMark 等测试均系基于特定计算机系统、硬件、软件、操作系统及功能,上述任何要素的变动都有可能导致测试结果的变化。请参考其它信息及性能测试(包括结合其它产品使用时的运行性能)以对目标产品进行全面评估。更多信息敬请登录 http://www.intel.com/performance。
英特尔处理器标号不是性能的指标。处理器标号仅用于区分同属一个家族的处理器的特性,而不能够用于区分不同家族的处理器。如欲了解更多信息,请访问 http://www.intel.com/performance 。
英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务。实际性能会因您使用的具体系统配置的不同而有所差异。没有一项计算机系统可以提供所有运行环境下的绝对安全。描述的成本降低方案旨在作为举例,说明指定的英特尔架构产品在特定环境和配置下,可能如何影响未来的成本和提供成本节省。环境将有所不同。英特尔不保证任何成本或成本降低。
所有日期和产品仅用于规划目的,可随时更改,恕不另行通知。
各性能指标评测的相对性能计算规则为:将第一个被测试平台的实际性能指标评测结果赋值为 1.0,作为计算基础,之后将其它性能指标评测结果与其进行比较。其余被测平台的相对性能的计算规则为:用基准平台的实际性能指标评测结果去除其它各平台的具体性能指标评测结果,并赋予它们一个与所报告的性能改进相关的相对性能值。
本文件不构成对任何知识产权的授权,包括明示的、暗示的,也无论是基于禁止反言的原则或其他。
英特尔明确拒绝所有明确或隐含的担保,包括但不限于对于适销性、特定用途适用性和不侵犯任何权利的隐含担保,以及任何对于履约习惯、交易习惯或贸易惯例的担保。
英特尔公司 © 2016 年版权所有。