[原创] HOT CHIPS 30周年,产业界都关注什么?

2018-08-27 14:00:04 来源: 半导体行业观察

HOT CHIPS是高性能芯片大会,是每年芯片领域最盛大的峰会之一。与国际固态半导体会议ISSCC不同,HOT CHIPS更偏重于商业芯片而不是学术项目,因此每年都会看到全球的半导体行业巨头展出最尖端的芯片。今年是第三十届HOT CHIPS会议,本文将为大家带来会议上的最新趋势解读。有趣的是,今年的芯片主题集中在高性能计算和IoT,恰好是芯片光谱的两端。在高性能计算领域,我们看到异构计算正在占据主流;在IoT领域,安全则成了关注点。

异构计算:Xilinx、 Intel、AMD、Nvidia纷纷秀肌肉

在详细介绍Xilinx、Intel、AMD、Nvidia等展出的芯片之前,我们先来梳理一下什么是异构计算。事实上,“异构计算”的反面是“通用计算”。通用计算是用一种通用芯片架构处理绝大多数问题,而异构计算则主张使用不同的芯片架构处理不同的应用。如果我们回顾半导体行业快速发展的这几十年,尤其是上世纪九十年代到本世纪第一个十年,我们会发现这是通用计算发展的黄金时代——处理器芯片随着半导体工艺的进步而快速提升性能,因此普遍的看法是只要把处理器做好就行,如果这一代处理器没法解决算力问题,等到半导体工艺进步到了下一代就一定能解决。这种用一种处理器来解决所有问题的思路就是通用计算。

虽然通用计算在摩尔定律快速发展的时代独占鳌头,但是异构计算其实并没有走远。大家熟悉的智能手机SoC就是异构计算的典型例子:在智能手机SoC中,我们除了ARM核处理常用计算以外,还有.H265解码器处理视频解码,ISP执行白平衡等摄像头相关算法,DSP用来处理传感器相关的计算等等。为什么手机SoC要用异构计算而不是用一个处理器解决所有问题?关键的原因在于手机的电池有限,对于SoC能效比的要求很高,因此需要不同的应用使用专用的模块以提升能效比。

这里我们可以看到异构计算的一个特点就是其能效比很高,因为专事专办,把处理任务交给专用模块处理,效率当然高;当然异构计算也是要付出代价的,因为每一块模块单元都要占据芯片面积,这就提高了芯片的成本,同时很多模块在大部分时间事实上是闲置的(比如如果你的手机从来不看视频那么.H265加速模块很有可能就是处于闲置状态),这从某种意义上来说就造成了浪费。

移动SoC是异构计算的典型例子

在摩尔定律快要遇到瓶颈的今天,异构计算又回到了人们的视野中。异构计算的能效比是重要的考量——之前按照摩尔定律发展,芯片的功耗密度每一代都会大幅提高,以至于按照这样的趋势有人预测高性能处理器芯片温度将会在十年内接近火箭喷射口的温度。当然随着设计和工艺的优化,处理器的温度并没有到这么夸张,但是处理器芯片能效比较差却是个不争的事实,目前数据中心的维护成本中有30%以上是用于芯片散热,因此使用能效比较好的异构计算范式也就在情理之中。

事实上,异构计算流行还有一个更重要的原因,就是人们发现处理器芯片性能从半导体工艺特征尺寸缩小中已经难以获得好处——根据高通透露的消息,从10nm工艺到7nm工艺,晶体管虽然集成密度可以提高,但是性能几乎没有改善!但是我们的芯片性能一定还是要随着时间推移而进化的,因此办法就是不再走传统的靠半导体工艺改善芯片性能的老路,而是把更多的精力放在优化芯片设计上。异构计算就是芯片设计架构优化的一个典型思路,使用专用的模块处理专门任务,其性能自然也能获得提升。

异构计算的呈现形式也是多种多样的。一种方法当然就是在一块芯片上集成多个模块成为片上系统SoC。之前我们看到SoC主要是在移动领域,因为如前所述移动市场是较早大规模采用异构计算的领域;如今我们会看到越来越多的高性能计算芯片也开始使用SoC了。此外,另一种方式是使用高级封装异质集成技术把不同模块集成到一个封装(而不是同一块芯片)上。

使用异质集成技术对于异构计算有独特的好处,例如一个异构计算系统中的模拟信号处理部分可以使用成熟工艺降低成本同时也降低漏电流,另一方面数字计算部分则可以用高级制程提高计算速度,最后再用异质集成技术把两部分芯片封装到一起,实现了性能和成本的同时最优化。

回到HOT CHIPS,如前所述,异构计算成了高性能芯片最大的热点。异构计算最积极的提倡者可谓是Xilinx。Xilinx在本次HOT CHIPS上有两个演讲,与异构计算相关的主要是其最新的7nm芯片项目Everest 。

在Everest方面,这个Xilinx的重头芯片不再是单纯的FPGA,而是一款SoC。上面除了IO接口之外,用于处理任务的主要分为三部分:通用处理器,可编程引擎和可编程逻辑FPGA。通用处理器就是CPU,用于处理常规计算部分;可编程逻辑FPGA模块则可以根据用户需求配置成专用处理模块,从而实现相应的计算加速。事实上,通用处理器加FPGA的架构Xilinx在之前的Zynq系列和MPSoC中已经引入并获得了业界的肯定。这次的新要素则是可编程引擎部分。这部分可编程引擎实际上是一组矢量处理器单元组成的处理器阵列,并且通过互联连接到了一起,用于处理高算力应用。因此,在实际应用中,Everest的通用处理器可以用于运行操作系统,并担任控制器的角色;在遇到需要高算力的常规算法(如经典的图像处理算法等)时,可编程引擎可以完成计算;在遇到其他特殊的计算(如神经网络,深度学习)需要定制化逻辑才能满足需求时,可编程逻辑FPGA则可以完成处理。这样的设计,充分体现了异构计算的精神。

半导体巨头Intel也不甘落后,在GPU领域展示了其在半导体工艺领域的深厚积累,使用EMIB异质集成技术在一块封装里集成了两块芯片,从而完成异构计算。EMIB技术即Embedded Muitl-Die Interconnect Bridge (嵌入式多晶片互联桥接)。最传统的异质集成技术在封装的基底上走线来连接两块芯片,但是由于封装的基底走线的密度有限,造成了芯片间互联的总线宽度不能太宽,从而影响了系统的性能。另一个方法是TSMC等使用的2.5D方法(例如InFO),

首先在封装的基底上先做一块硅载片(silicon interposer),然后把芯片再固定在硅载片上,由于硅载片上的走线密度可以很高,因此异质集成系统的性能得到了保障,其缺点是硅载片的成本较高。而Intel的EMIB则是更进一步,不是做一大块硅载片并把芯片放在上面,而只是在两块芯片互联走线的地方把原来的基底部分换成能实现高密度走线的silicon bridge,从而大大降低了成本。

在这次Intel的GPU中,同一个封装里就用EMIB技术封装了两块图像处理芯片,一块高性能芯片用于计算能力需求强较高的场合(如游戏),另一块能效比高用于在常规场景中应用从而达到节能提升电池寿命的目的,这样的设计也很好地体现了异构计算的精神。

AMD和Nvidia则在演讲中宣传了自己的SoC。AMD的SoC是Accelerated Processing Unit(加速处理器,APU),在一块芯片上集成了Zen CPU和Vega GPU,并且使用高速互联Infinity Fabric实现数据互联。Nvidia的SoC则是用于自动驾驶的Xavier,这块SoC上除了基于ARM架构的RISC CPU和基于Volta架构的GPU之外,还包括了用于立体视觉和光流处理的PVA模块,用于深度学习推理加速的DLA模块,用于摄像头图像处理的ISP以及视频编解码模块。这已经远远不止是一块GPU,而是一个典型的异构计算芯片SoC了。

物联网安全:硬件安全必不可少

除了超高性能计算芯片之外,另一个本次HOT CHIPS的热点则是物联网。在物联网时代,人们生活中的绝大部分物体都会通过物联网联入网络,一方面从网络中获取指令从而给社会带来更大的自动化,另一部分通过将收集到的数据传递到数据中心,则可以让数据挖掘算法更好地分析大数据并且为用户提供个性化的服务。

然而,从物联网的两大愿景中,我们同样也可以看到物联网安全的至关重要。一方面,物联网会从远端收集指令,一旦被破解,那么黑客就可以远端操纵我们生活中几乎每一个物件,其破坏力惊人;另一方面,如果物联网传递的数据如果被黑客恶意拦截,那么无论是用户隐私还是关键信息(如重要密码等)被盗都会给用户造成损失。物联网安全问题已经离我们并不遥远,之前MIRAI攻击让黑客得以能够操纵大量的物联网设备实施DDOS攻击,给我们敲响了警钟。

本次HOT CHIPS上,微软和谷歌都带来了基于芯片的物联网安全解决方案。那么,芯片如何实现安全呢?我们不妨来分析一下物联网系统的安全加密过程。举例来说,我们认为官方发布的应用软件是安全的,而来自不明渠道的应用软件可能是危险的,那么如何区分来自官方的软件和来自不明渠道的软件呢?标准的做法就是数字签名,官方的数字签名可以保证其他人无法冒用,所以物联网设备在安装软件的时候只要能验证软件附带的数字签名是否是官方的即可。

然而,黑客还是有可乘之机,因为传统的数字签名验证流程并非完美,如果数字签名验证流程只是在软件层面执行,例如密钥的存储放在软件层面,那么黑客还是有可能能够侵入这个签名验证流程,通过漏洞把存储的密钥或者验证代码改成自己的版本,就能绕过数字签名流程了。这里可以看到,物联网的安全有一层层的依赖性,如同洋葱一样:软件安全性依赖于数字签名,而数字签名的安全性又依赖于数字签名验证流程。一旦最核心的安全层被入侵,那么物联网的安全性就无从谈起了,这个最核心的安全就是所谓的root of security。

现在看来,最安全的root of security是硬件芯片级安全方案,即把关键的安全验证代码和密钥在芯片设计的时候就固化在芯片里,那么黑客目前来看就没有办法可以侵入root of security了。

微软和谷歌带来的方案就是这样。微软的方案是Sphere MCU,是一款为智能物联网终端设备量身打造的MCU。在MCU中,除了处理器和存储器之外,还包含了Pluton Engine。Pluton Engine本身包含了密钥验证加速引擎,硬件随机数生成器以及密钥存储等模块,在实现安全root of trust的同时,也帮助整个系统加速了安全验证的计算流程。

谷歌则为我们带来了Titan。与微软在终端做MCU的安全不同,谷歌则是瞄准了云端的安全。Titan目前的应用场景在云端服务器,在服务器的启动、Firmware等做root of trust。谷歌的Titan是一块单独的芯片,其中也包含了MCU,从而为云端的安全保驾护航。这次的HOT CHIPS,谷歌除了Titan之外还有一个关于终端照片处理加速芯片Pixel Visual Core的演讲,可见谷歌在芯片和硬件领域已经有了大量的布局。

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论