首页 > 半导体 > 正文

【技术】挤牙膏还是强力改进？Intel第七代Core架构全解析

2016-11-01 10:12:00 来源: 互联网

点击

现在，挑战即将来临，AMD准备祭出的Zen架构貌似具有巨幅的性能提升，加上AMD原本具有的图形性能优势，Intel不可避免感受到新一轮大战来临的气息。同时，无论是苹果还是联想、HP、戴尔这些PC厂商，它们的产品线都到了更新换代的关口。Intel第七代Core架构“KabyLake”也因此备受瞩目，它也是我们接下来要分析的对象。

Kaby Lake的14纳米+工艺

我们知道，Intel的Tick-Tock工艺、架构两步走策略已经实施很多年了，过去按照第一年更新架构，次年就同架构升级制造工艺，接下来一年再更新架构，如此交替稳步进行。这种方式很稳妥，保证了工艺良率，产品性能也能够持续地提升。

▲14纳米+的Kaby Lake晶圆

▲Kaby Lake的芯片核心布局图，集成了CPU、图形核心、内存控制器以及I/O功能。

14 纳米 +工艺：更好的晶体管性能

但是到了14纳米阶段，Tick-Tock模式就出现问题了，本来在今年，Intel就应该切换到10纳米阶段，这个过程显然不太顺利。Intel仍然需要依靠成熟的14纳米工艺来解决问题，为此，Intel将产品线更新换代分为工艺、架构、优化三步走的方案，更新周期从过去的24个月延长到36个月，这就意味着性能提升的脚步不可避免变得更慢，Intel也必须在优化工作上下更多的工夫。

CPU架构部分，Kaby Lake继承了Sky Lake核心、也就是第六代Core架构，所以光从IC设计角度来看，Kabylake的CPU性能实际上是止步不前的。唯一不同之处在于，Intel对14纳米工艺进行改良升级、号称14纳米+，新工艺拥有更好的晶体管性能。Kaby Lake的晶体管性能比前代产品提升了将近12%，这给它带来了更出色的能效表现。

▲Kaby Lake与前几代Core架构的能耗对比。

再来看看Intel给出的对比表，如果以2010年的第一代Core架构为参照物，当时能耗最低的移动处理器功耗为18瓦，到了第四代架构时，功耗降低到11.5瓦，能效提升高3.5倍；而到第六代Core，能耗进一步降低到4.5瓦，能效提高了整整八倍！那到了现在的kaby lake，虽然最低能耗保持在4.5瓦，但性能提升显著，能效比的提升幅度达到了10倍！也就是相对于现在的第六代Core，Kaby lake的能源效率提升了20%。

增强的 Speed Shift技术：加快响应速度

在第六代Core架构中，Intel引入了一项名为“Speed Shift”的电源管理技术，它主要改进了系统的突发响应时间。Intel过去一直采用SpeedStep移动电源管理技术，配合操作系统，可以根据工作负载的不同、动态地调节处理器的工作频率和能耗，从而达到节能的目的。但这项技术的缺点是必须经过操作系统，频率的切换速度较慢、最快也得30毫秒。Speed Shift技术很好地解决了这个问题，它绕过了操作系统、让处理器能够直接与电源控制单元沟通，并将所有电源状态都开放给操作系统，三者配合之下，SpeedShift平台最快可以在1毫秒的时间内完成状态切换。

▲Speed Shift带来更快的频率切换响应。

不过，第六代Core架构的SpeedShift只针对原先的节能机制，Intel还有一项睿频（turbo boost ）技术，它的逻辑刚好与SpeedStep相反——睿频可以在CPU面对高负载应用下将运行频率提高数百个MHz，达到加速运行的目的。不过第六代Core的睿频切换延迟需要接近100毫秒，而现在Kaby Lake平台也对此作出改进，新一代SpeedShift技术可以让睿频状态的加速延迟降低到5毫秒。

要说明的是，是否开启Speed Shift，CPU的性能基准都是一样的，它的功能在于能够大大提高不同负载的切换速度，从而将性能效率提升最多20％。

更高频率带来显著性能提升

体现在最终产品上，就是Kaby Lake可以在同等功耗时工作在更高的频率上，比如同样为15W功耗，Kaby Lake核心的Core i7 7500U的频率为2.7GHz，睿频最高到3.5GHz；而现有的Core i7 6500U频率只有2.5GHz，睿频最高只有3.1GHz，差距还是比较明显的。在体现商用性能的Sysmark 2014评测软件中，7500U的性能比6500U高出12%左右；在Web性能的WebXPRT 2015的评测软件中，7500u的性能提升达19%。不过最大幅度的提升还是WinRAR压缩解压应用，7500U的优势扩大到28%，这主要得益于睿频时额外增加的400MHz频率提升。

▲Kaby Lake 核心的Core i7 7500U与上一代6500U的性能对比。

Kaby Lake的GPU部分

kaby Lake的GPU核心同样继承上一代产品，在Intel的体系中仍属于第九代架构，图形核心依然由EU单元构成，内部设计没有什么变动。根据处理器版本不同，Kaby Lake的GPU也分为GT2、GT4等多种配置，性能最高的GT4包括72个EU执行单元，GT2为24个执行单元，数量与第六代Core相同，不同的地方在于Intel提升了eDRAM 四级缓存的配置——比如最高性能版本可以集成256MB的eDRAM四级缓存，而现有第六代核心最高只能到128MB。

在没有明显改动EU单元内部设计、提高EU数量的情况下，指望Kaby Lake的图形性能有大幅度提升是不现实的，这对于用户来说多少会有些遗憾。但Intel的问题在于，如果AMD的Zen架构能够按期在2017年发布，那么Zen架构有望在处理器性能方面赶上Intel，而图形性能又是AMD的强项。所以对Intel来说，Kaby Lake一如既往的图形性能会有一些麻烦，至少用户对它们会很不感冒。

值得庆幸的是，Kaby Lake在视频性能方面获得大幅度的增强，Intel为它加入了增强的视频引擎，它包括MFX（Multi-Format Codex ，多媒体解码器）和VQE（Video Quality Engine ，视频质量引擎）两个部分。

MFX 单元与 VQE引擎

MFX 是一个增强的解码器单元，它增加了10bit HEVC和8/10bit VP9格式的编码器和解码器。其中，HEVC是一套先进的视频格式标准，它可以让1080P视频内容的压缩效率提高50%左右。这项优势让它被认为是H.264、MPEG-4的最佳代替者，能够满足4K、8K视频时代的内容压缩要求。不过，HEVC也因此具备更高的算法复杂度，对硬件要求要比H.264高得多，之前Intel的核显只提供到8bit的HEVC硬加密能力，面对10bit HEVC内容时仍只能依靠CPU低效地完成。而在Kaby Lake架构中，新加入的MFX单元将让观看4K HEVC高清内容变得轻松自如。

VP9 则是Google开发的视频格式，它是一套开放的压缩标准，可以提供比H.264更好的图像质量、同时码率却只有它的一半左右。这次Kaby Lake纳入了VP9的编解码功能，支持8bit的硬编码和8bit/10bit的解码，可以让Kaby Lake平台在在线视频应用中具有显著的性能提升。

除了这两项重要改进外，Kaby Lake的MFX单元还改善了无线显示时的画面质量，也提升了现行H.264/MPEG-4 AVC编解码的性能。

▲MFX、VQE的详细改进点

VQE 引擎则在第四代Core架构时开始引入，现在它有了新功能：具有更宽的色域，并且在高动态范围和标准动态范围下都能获得应用。为了实现这一点，Intel对VQE引擎作了进一步改进，包括反交错、降低噪音、色彩增强、色彩校正等等。同时，新一代VQE还拥有更好的能效表现：在实现宽色域和HDR支持时，它只需要消耗40-50毫瓦的能源，让它在播放4K内容时，能够提供更好的画面观赏效果，同时不需担心设备发热会显著上升。

▲Kaby Lake获得增强的MFX/VQE媒体引擎。

实际性能增强

KabyLake 的上述改进，让它得以胜任4K时代的现实需求。用数据能更直观地看出这一点。

KabyLake 平台，可以支持最多8组4Kp/30（4K逐行、30帧速率）的超高清视频同时播放；或者是流畅地播放4Kp/60（4K逐行、60帧速率）的高质量视频，此时视频的流速达到120Mbps，这意味着Kaby Lake的媒体引擎要在一秒内完成120Mbit数据的实时解码，运算力相当强大。而它的能源效率也非常可观：功耗只有4.5W的Y系列处理器，就可以完成HEVC格式的4Kp/30视频的实时编码，也就是像Macbook这样的超轻薄小本，都可以很好完成这类繁重的视频创建任务。

那么对终端用户来说，换用新平台和沿用现行的第六代平台，又能带来多少实际的好处呢？首先一个最明显的好处就是降低了能耗。Intel采用《钢铁之泪（Tears of Steel）》的开源电影短片来展示两代平台的差异，视频基于10bit HEVC格式、4K清晰度，在现行的Core i7-6500U平台中，视频播放是依靠GPU和CPU一起混合解码的，此时CPU占用率要达到50%左右，而CPU/GPU的整体能耗达到10.2瓦。另一套Kaby Lake架构的对比平台则采用对应的Core i7-7500U处理器，由于它可以完全由CPU进行硬解码，CPU/GPU的功耗只有惊人的0.5瓦—这也意味着足足具有20倍的能源效率提升，而播放本地4K视频时的电池续航时间也因此可以提升2.6倍之多！

▲在4K HEVC 10bit内容解码时，Kaby Lake平台展现出强大的能耗优势。

如果应用的对象换为在线视频、结果会如何呢？对比的上述两个平台都用Chrome浏览器来播放Youtube上的4K VP9格式视频，其中 Core i7-6500U在CPU/GPU部分用了5.8瓦能源，而Core i7-7500U只用了0.8瓦，能耗降低了7倍！换算过来，在播放Youtube的4K视频时，KabyLake平台可以获得1.75倍的额外电池续航时间。目前基于Corei7-6500U的笔记本电脑，在播放这类4K视频时一般具有4小时左右的续航力，那么按此推算、Core i7-7500U平台就能达到7小时左右。不仅如此，Kaby Lake提供的性能冗余也让它为未来做好了准备，比如它可以胜任360度的4K内容、也就是沉浸式的4K VR应用，而当前的第六代Core平台无法满足这一点。

▲Kaby Lake与第六代Core架构在视频方面的功能对比。

Kaby Lake的产品线分布

与前次升级一样，KabyLake拥有一个完备的产品线，包括S系列、H系列、U系列和Y系列，跨越从高性能桌面、工作站到超轻薄笔记本的广阔市场，具体到产品型号上还是划分为i7、i5、i3三个不同等级。

▲面向主流市场的仍然会是i3、i5和i7三个系列。

针对桌面和工作站： S系列

S 系列面向的是高性能市场，它包含许多不同的型号，主要以锁频与否、功耗和GPU配置作为区分。其中性能最高的是K开头的型号，它拥有四个处理器核心，搭载GT2级别的常规图形核心，最大的特点是不锁倍频、允许大家自由超频，功耗达91瓦。这个系列将在2017年初发布。

▲Kaby Lake S系列平台架构。

面向主流桌面的四核处理器则锁了倍频，功耗在35瓦到65瓦之间，它搭载了性能更高的GT4图形核心，内部集成了64MB的四级缓存，它的发布时间比不锁频的K系列稍迟一些。

而针对服务器和工作站的Xeon系列四核处理器，没有整合图形核心的有80瓦、54瓦和25瓦三种能耗配置，主要面向需要与GPU加速卡配合的高性能计算平台。而带GT2图形核心的有25-80瓦能耗配置，主要面向Web服务器、文件服务器、FTP服务器这类常规的商业云环境。

S 系列的芯片平台采用“处理器+PCH”的组合方案。处理器部分，S系列支持双通道DDR3L-1600和DDR4-2400两种方案，OEM厂商可以自行决定要采用哪种内存。此外，它还包括一条PCI Express 3.0X16规格的图形总线、用于外接显卡，接口的带宽达到32GB/s。另外，它还支持三路数字显示接口输出，以及一个eDP嵌入式接口。

PCH 方面，Kaby Lake可以兼容第六代Core的100系列芯片组，不过它配套的应该是改进后的200系列产品，除了USB 3.1支持、HDA高清音频、SATA硬盘总线外，200系列芯片将原本的20路PCIExpress 3.0总线提升到24路，总计提供48GB/s的双向带宽，可以支持Intel的Optane硬盘。它实际上是Intel的3D XPoint闪存技术的正式名称，介于传统内存、固态硬盘之间，可以提供极高的性能和极低的延迟。

针对高性能笔记本电脑： H系列

H 系列是Kaby Lake的移动高性能版，它采用BGA1440封装、TDP功耗在35-45瓦范围内。H系列都拥有四个CPU核心，35瓦功耗版搭载标准版的GT2图形核心，面向主流高性能市场。不过，Intel还为顶级玩家准备了45瓦功耗的顶级型号，它将搭载GT4图形核心，并内建了128MB的eDRAML4高速缓存。不过它还不是最快的，Kaby Lake H家族还包含一款高达256MB L4缓存的顶级型号，没有例外的话，它也将成为Kaby Lake家族中图形性能最出色的处理器。

H 系列同样采用处理器+PCH的解决方案，功能强大、但需要较大尺寸的主板才能容纳。

针对超极本： 15/28瓦的 U系列

U 系列是Kaby Lake的移动低功耗版本，主要针对的是超极本市场。U系列采用BGA1356封装，功耗最低的版本TDP为15瓦，最高的型号是28瓦。U系列都包括两个CPU核心，图形部分有GT2、GT3两个版本，两者的区别主要是内建的eDRAM四级缓存——GT2版本并不包含、只能共享内存作为显存，而GT3内建了64MB的eDRAM，性能会更出色一些。

U 系列有一个很重要的特点就是内建了SOC功能，也就是将PCH芯片与KabyLake CPU芯片集成在一起，这样就在一个处理器封装模块上同时实现包括CPU、图形核心、芯片组等所有的功能，主板的设计尺寸因此可以被大幅度缩小。可以见到，当前搭载第六代Core架构U系列处理器的超极本都可以做到惊人的轻薄尺度，原因也是处理器封装里包括PCH芯片。

▲kaby Lake U系列处理器，处理器和PCH芯片集成在一起。

▲Kaby Lake U系列的逻辑架构，采用双芯片、单模块的SOC集成设计。

内存支持方面。U系列也是双通道DDR3L和DDR4，不过它在I/O方面的功能久相对弱一些，比如只支持两路数字显示输出和一个嵌入式eDP显示接口，更遗憾的是只能支持到USB 3.0，未免有些落伍。此外，对于SSD它准备了SATA和PCIExpress两种接口，可以很好地满足现实需要。

针对平板电脑： 4.5瓦的 Y系列

Y 系列其实就是之前的Core M产品，面向的是平板电脑以及追求极致轻薄的超便携机型。Y系列采用BGA1515封装，它的主要诉求是低至4.5瓦的超低功耗水平，这让它可以保持无风扇运行。Y系列都整合了GT2图形核心、不带eDRAM高速缓存。由于Y系列面向尺寸更小的计算市场，处理器封装也采用SOC设计、同样集成了PCH芯片。I/O功能与U系列完全相同，它也没法原生支持USB 3.1。

▲同样双芯片、更为紧凑的Y系列。

需要换Kaby Lake平台么？

如果你已经在用六代平台或者四五代平台，纯粹因为性能的关系升级到七代平台，我们认为你或多或少会觉得失望，Kaby Lake平台的性能固然得到提升，视频方面的能力也非常强大，但它更多是一种渐进式的改进。

Intel也深知这一点，它采用五年前的PC平台作为参照物加以说明。对比五年前的平台，Kaby Lake在商务应用中可以获得1.7倍的性能提升；此外，Kaby Lake可以很好地胜任4K视频创次建和播放的需要。通俗一点说，我们认为五年前的PC也能够完成大多数日常任务，但如果升级到Kaby lake平台，大家可以直观地感受到运行速度更快、CPU占用率更低、平台的发热量更小、风扇更加安静。假如你要在电脑中运行多个虚拟机，那么就会恨不得榨取每一分的性能，Kaby Lake平台在这些方面就有明显优势。从这些人性化体验的角度来看，我们认为升级到新一代平台还是有着明显的好处。

▲AMD ZEN处理器的各种“泄漏”，相信也给了Intel一定的压力和动力。

只不过，Intel还需要面对的一个潜在问题，就是AMD的Zen架构能具有什么样的表现，假如Zen在处理器性能和效率上赶上Intel的步伐，那么Intel将重新经历久违的市场竞争——毕竟AMD在图形领域具有不对称的优势，它所欠缺的其实就是一个强有力的CPU平台。我相信消费者乐见于此，没有竞争，市场只会一潭死水、厂商缺乏前进的动力，我们也无法看到IT技术所应有的高速演进。