硬盘太慢英特尔傲腾来补

英特尔

2017-04-14 20:08 8849

2017年3月，英特尔发布的面向台式机的英特尔(R) 傲腾(TM)内存模块（16GB和32GB），将从4月24日起上市。

北京2017年4月14日电 /美通社/ -- 2017年3月，英特尔发布的面向台式机的英特尔® 傲腾™ 内存模块（16GB和32GB），将从4月24日起上市。在半导体技术驱动下，计算机性能沿着摩尔定路突飞猛进，然而，仍旧逃离不开“存储”的瓶颈制约，拖累整个系统性能提升缓慢。使用闪存（NAND）加速的想法一直都在，Wintel都有尝试，今天，傲腾（Optane）将有机会改变这一切。

虽然已经有了数十年的历史，但是冯·诺依曼1946年提出的计算机体系架构，仍是现在乃至可见的未来，计算机所遵循的基本架构体系：存储和计算。CPU是大家所熟悉的计算核心，但是并非冯·诺依曼体系中的计算核心，按照大学计算机原理课老师所说，CPU非常笨，它只会做“1+1”这一件事，而且只会从A、B寄存器取数、结果放到C寄存器，冯·诺依曼体系中的计算是指ALU（数逻运算单元）而存储是寄存器。当然，这是最狭义的冯·诺依曼体系理解，不过也从侧面说出了计算和存储相依相存的特殊关系。

计算和存储的关系相依相存

速度快当然是王道，但是非常遗憾，半导体技术发展到今天，仍然不能解决容量和性能的根本矛盾，考虑到成本和实现因素，最终的产品都是性能向成本的妥协。历史上看，谁能将两者的平衡点向性能或容量任一端推动，定将带来世界的巨大改变。SRAM到DRAM、闪存盘对软盘/光盘、SSD对HDD，以及刚刚面世的Optane。

快慢设备的衔接

“多点润滑、少点摩擦”，这是海湾战争期间的著名润滑油广告。而对于计算机来说，高速和低俗设备之间，对获取数据方面的摩擦一直没有停止过，解决这种数据冲突的方式也在革新。

以速度较快的ALU为例，与之进行数据交换的寄存器有着相同速度的寄存器，除去在相邻周期里循环存取的时间周期不算，两者实际上是同频同步工作的。寄存器有着动辄数GHz的运行速度，只能集成在离ALU最近的地方，但代价是成本高昂、容量以字节为单位精打细算，这就是为什么如AVX 2.0中的256位指令/数据寄存器，英特尔更壕一些，直接放入256位长，而AMD抠门些，旗舰的Ryzen 7 1800X只有128位寄存器，256位数据需要两个周期读入和写出，性能折损极大。当然，处理器厂商们早已注意到这个问题，n年前就大肆引入Cache结构作为从寄存器到内存的梯级缓冲，用数量和逐渐提高的速度解决计算单元从内存获取数据的性能落差。L1、L2、L3 Cache容量通常为数十KB、数百KB和数MB，对应容量提升一个级别，速度也降低一个级别，以匹配慢速的GB级别内存。为了保证速度，Cache通常会采用SRAM（静态内存）制作，而内存虽然用了DRAM速度低了不少，但当年正是DRAM的出现，让配有64KB内存的PC有机会诞生，要知道同容量的SRAM当时价格超过2500美元，而第一台PC的不过1999美元。

类似的情况也出现在“存储”设备上，虽然以硬盘（HDD）为代表的存储设备已经是外设“矬子里面的将军”，但是它和PC系统之间的性能落差仍然很大，其性能包括了带宽和响应延迟等两个维度的速度。于是另一种缓存，Buffer出现了。别看中文都是“缓存”，但是在计算机词汇中，Cache和Buffer是两个不同世界的速度，相比多采用SRAM的Cache，Buffer多使用廉价的DRAM以缓解I/O接口两侧的速度不匹配，最常见的情形是Buffer容量作为HDD的重要参数标识产品档次。无论是哪种缓冲，都能在响应时间和带宽上同时匹配两端性能，两端都认为对方迁就了自己的性能水准，而没有察觉到缓冲的加入，此现象就叫透明。

容量与性能的分歧

经过多级缓冲，DRAM的速度已经远远落后于CPU，但即便如此，它仍远远高于主流的存储设备。更具体点说，单通道DDR4-2400内存带宽已近20GB/s、延迟为30ns左右，而容量已突破10TB的HDD，对应的性能水准只略微增长到150MB/s~200MB/s带宽，延迟则停留在3~4ms（接口）+7~8ms（平均寻道）的10年前水平，明显不能满足当下电脑系统的需求。于是这才有了近几年较有效的升级已经从增加内存变为了更换HDD为SSD。SSD综合性能较HDD已经有了质的飞跃，主流产品接口带宽突破1GB/s水平、延迟下降到μs量级，但与之伴随的就是10倍的价格差异。

无论是容量还是性能，对使用体验的影响都是显而易见的。在预算有限的前提下，考虑到时间可以换取性能而容量不行，更多数消费者都倾向于容量更大而非性能更高，这也就是为何仍有超过85%的台式电脑选择HDD作为唯一存储设备的原因。但凡预算宽裕一些，或者性能的需求稍占上风，双硬盘就成为更为理想的搭配。现实是很残酷的，艰难的预算增加，并不能带来如一的性能体验，频繁使用的数据固然可以手动放置到SSD中，但是相对较小的容量被占满后，越是大量的数据，越会深刻体会到“慢”的熬人，小容量SSD对此无能为力。

能够弥合电脑与HDD性能落差、解决SSD与HDD容量落差的Optane来了。

横空出世

SSD的出现，可谓是近年来存储领域较大的技术革新。以高速旋转的磁碟片为基础的HDD，数十年来维持在温彻斯特架构下几乎没有变化，无论是体积缩小还是容量增加，都不能很好地解决速度问题，哪怕是即将到来的热辅助磁存储技术，也只是帮助容量大幅提升而对性能的提升仍是隔靴搔痒，机械原理限制了HDD性能质的升级。SSD核心的改变正在于以半导体取代机械，ms进入μs、MB/s提升到GB/s。按下葫芦起来瓢，SSD让成本和耐久性问题浮出水面，NAND的存储介质可谓“万恶之源”。

NAND是闪存（Flash）中最主要的类别，具有读写耐久性随制程提升下降、性能随制程提升下降等固有特性，特别是为了在有限的晶圆（成本）上获得更大容量，制程和单元结构升级一直没有停止过，如今NAND已经进入10nm时代、TLC渐成主流，反观其耐久性艰难维持在2000次左右，延迟和介质性能改进缓慢。

2015年，英特尔正式发布了名为3D XPoint的全新非易失性存储技术，这就是横空出世的Optane傲腾；与英特尔合作生产相关产品的美光，则将其命名为QuantX。3D XPoint或者说Optane与NAND/NOR等Flash完全不同，而更接近于内存，延迟、耐擦写性、介质速度等几个关键指标也优于NAND几个数量级，未来发展潜力巨大，英特尔的目标是用其扩大仅有5%左右的SSD市场份额。

Optane的非易失性和性能优势，使其可在计算机系统中扮演多种甚至是任何存储角色：内存、存储和缓存，分别对应Optane DIMM、Optane SSD和Optane Memory，从而改变整个计算机存储发展进程。目前后两类产品已经上市。

为了获得极速的存储，一种名为RAMDisk的产品已经问世多年。它采用单位容量昂贵的DRAM为存储介质，使系统用访问硬盘的方式访问它，性能当然是内存水平的，而容量也是内存水平的数GB。显然，这样的容量水平对PC都不够用，何况这样的“硬盘”还要面临掉电数据丢失（易失性）的问题，使用时先要从硬盘读取数据、关机前人工将数据写回硬盘，可用性不佳。今天，Optane SSD已经具有了RAMDisk的性能却有着数TB的超大容量和非易失性，后者已经没有继续存在的意义。

Optane Memory则是比NAND更为理想的缓存材料，更高的耐久性和ns级的响应速度，比当年英特尔涉足缓存领域的TurboMemory所使用的SLC NAND表现优1~3个数量级，更别提如今漫天的TLC产品了。性能改善之余，32GB的超大容量早已突破系统缓冲的需求，甚至作为超高性能的SSD也不为过（想想Optane SSD的表现），它更大的作用是为Windows以外的更多应用和数据进行缓冲和优化，实用性远超当年512MB的TurboMemory产品。只要用上英特尔200系列的芯片组和7代酷睿处理器，Optane Memory的延迟水平直逼DRAM。想象一下有否体验过内存的延迟水平或速度不足，没有吧？未来“硬盘”也不会再有今天烦人的等待，与内存同速。

消息来源：英特尔