[原创] 后摩尔定律时代的芯片新选择!
很长一段时间以来,摩尔定律和它的最终结局一直就像房间里的大象,不容忽视。英特尔联合创始人戈登·摩尔在1965年的一篇论文中预测,芯片中的晶体管数量每年将翻一番。更多的晶体管意味着更快的速度,而这种稳定的增长推动了几十年的计算机进步。这是CPU制造商提高CPU速度的传统方式。但晶体管的这些进步正显示出放缓的迹象。多伦多大学电气和计算机工程教授Natalie Jerger说:“这已经没了动力。”
图片: Alex Cranz, Gizmodo
不只Jerger一个人这么说。2016年,《麻省理工学院技术评论》宣称,“摩尔定律已死”,今年1月,Register发布了一份摩尔定律的“死亡通知”。如果你在过去几年里买了一台笔记本电脑,你可能也注意到了。CPU看起来比前一年快不了多少。英特尔生产了我们的大多数笔记本电脑、台式机和服务器中CPU,自2014年以来,英特尔很少能够让CPU性能提高15%以上,而AMD,即使采用了一些相当激进的新设计方法,通常也只是与英特尔并驾齐驱。
在英特尔和AMD(直到最近)所采用的典型的“单片(monolithic)”设计风格中,CPU由半导体材料组成——通常都是硅。这就是所谓的芯片(die)。在芯片的顶部是一系列晶体管,因为它们都在同一个芯片上,所以它们可以快速地相互通信。更多的晶体管意味着更快的处理速度,理想情况下,当你缩小芯片的尺寸时,晶体管就会更紧密地组装在一起,并且可以更快地相互通信,从而带来更快的处理速度和更高的能源效率。在1974年,第一个微处理器,英特尔的8080,是建立在一个6微米的芯片上。明年的AMD处理器预计将建立在一个7纳米的芯片上。这几乎缩小了1000倍,而且速度快得多。
AMD的Threadripper比英特尔CPU大很多,因为它实际上将许多AMD CPU组合在一起。(图片:Alex Cranz, Gizmodo)
但AMD最近凭借其听起来荒唐的Threadripper CPU实现了最大的速度提升。这些CPU核心数量从8个到32个不等。核心类似于CPU的引擎。在现代计算中,多核可以并行工作,允许某些利用多核的进程运行得更快。拥有32个内核可以将Blender中3D文件的渲染时间从10分钟缩短到仅一分半钟,PCWorld运行的这个基准测试可以看到这一点。
另外,32核处理器听起来很酷!AMD通过采用chiplet设计实现了这一点。它所有的现代CPU都使用一种叫做Infinity Fabric的东西。今年早些时候在接受Gizmodo采访时,AMD计算和图形业务部门前总经理Jim Anderson称,这是AMD最新的微架构Zen的“秘方”。与此同时,CTO Mark Papermaster称其为“隐藏的宝石”。
Infinity Fabric是一种基于开源的Hyper Transport的新系统总线架构。系统总线完成了你认为它会做的事情——从一个点到另一个点的数据总线。Infinity Fabric的巧妙之处在于它能够非常快地传输数据,并允许用它构建的处理器克服chiplet CPU设计的一个主要障碍:延迟。
图片: Alex Cranz, Gizmodo
chiplet的设计并不新鲜,但它通常很难实现,因为很难在单独的芯片上制造出一堆晶体管,使这些芯片尽可能快地相互通信。但有了AMD的Threadrippers,你就可以在无限的结构上配置许多典型的Ryzen CPU,它们的通信速度就像在一块芯片上一样快。
它运行得非常好,其结果是超高速处理器的制造成本非常低廉,以至于AMD能够以相当于英特尔几分之一的价格出售处理器,而英特尔继续在其高核心数量中使用单片设计。在某种程度上,Infinity Fabric是一种欺骗摩尔定律的方法,因为它不是单个快速CPU,而是通过Infinity Fabric连接的一系列CPU。所以AMD并没有克服摩尔定律的限制,而是绕过了摩尔定律。
Jerger说:“如果你回过头来说,‘好吧,摩尔定律实际上就是关于功能的更大集成。’我确实认为chiplet不会以任何方式帮助整合更多小型晶体管,但它确实帮助我们建立了比上一代人更强大的功能和能力的系统。”
英特尔最新的i9 CPU可能速度很快,但它仍运行在4年前的14纳米的基础上。(图片: Alex Cranz, Gizmodo)
她指出,在某些情况下,这种围绕chiplet设计的对话是对一家公司更显著的失败的一种偏移。她指的是英特尔,在过去几年里,英特尔一直在努力克服晶体管不能永远微缩的局限性。它一直停留在14纳米处理器,而且一年以来一直承诺10纳米处理器,但未能兑现。对于英特尔来说,这是一个可怕的尴尬,当其他芯片制造商绕着这家芯片巨头跑了几圈之后,情况变得更加糟糕。今年,苹果售出了数百万部内置7纳米处理器的手机和iPad,而AMD则在2019年发货了12纳米处理器,并承诺在2019年推出7纳米处理器。AMD今年在台北举行的Computex大会上也公开让英特尔感到难堪:英特尔承诺在今年年底前推出一款28核的CPU(目前还没有出货),几天后,AMD推出了一款32核CPU,自8月份以来一直在出货,价格是英特尔CPU预计价格的一半。相比之下,英特尔最近承诺的2019年向10纳米工艺迁移的拖延已久的计划显得有些可悲。
这就是为什么你不应该把它对chiplet CPU设计的拥抱看作是一个巧合。在某种程度上,这似乎是英特尔在鼓吹很酷的创新,以转移人们对重大创新失败的关注,甚至跟上竞争对手的步伐。
英特尔的带有AMD GPU的G系列CPU就是英特尔采用chiplet设计的一个例子。(图片:Alex Cranz, Gizmodo)
不过,尽管这款chiplet CPU是为了分散英特尔10纳米问题的注意力,但它实际上也相当酷。英特尔在chiplet设计方面的首次尝试是在去年春天相对低调地推出了G系列CPU。G系列CPU实际上是与AMD合作开发的,AMD提供了GPU,英特尔的CPU可以与之通信。英特尔没有依赖AMD的Infinity Fabric之类的东西,而是开发了一种名为嵌入式多模互连桥(EMIB)的东西,它可以让CPU、GPU和4 GB的高带宽内存以接近同一芯片上一系列组件的速度进行通信。它的速度很快,当我们在3月份进行测试时,它给我们留下了深刻的印象。它预示着一个很酷的未来,我们的集成GPU最终会变得像英伟达GTX和RTX系列这样的分立GPU一样快。
但EMIB也像是对英特尔本月早些时候宣布的一款产品进行的一次试水,该产品预计明年上市:它是一款10纳米CPU,带有集成3D堆叠的chiplet设计。与EMIB和Infinity Fabric一样,3D堆叠也是一种chiplet设计工具。但是,Infinity Fabric和EMIB只是让传统CPU部件更快地相互通信的方法,而3D堆叠增加了另一个维度。
使用3D堆叠的CPU布局示例。(图片:英特尔)
通常芯片被放置在一个水平面上,这样芯片的每个部分都可以与散热器接触,保持凉爽。3D堆叠,如果可以正确处理散热,则可以把CPU构建得更高而非更大。有点像高层建筑vs牧场式住宅。
英特尔对3D堆叠技术非常感兴趣,它认为3D堆叠技术比Infinity Fabric或EMIB更能避开摩尔定律。据英特尔工艺与产品集成总监Ramune Nagisetty称,这是摩尔定律的“进化”。她在几周前的谈话中澄清了一些事情:
“如果你花时间去挖掘戈登·摩尔写的那篇论文,你就会明白这一点。这真的很有趣,因为在那篇论文中的一段,他实际上预示了封装集成的使用。他没有使用我们今天使用的语言,但他确实说过,建立一个由小功能组成的大系统是更加经济的,这些小功能是分开封装并相互连接的。”
我不确定我是否完全同意Nagisetty认为这是一种演变的观点,但她和Jerger都承认,摩尔最初的论文中的语言有一些灵活性,而且这些封装集成(或称为chiplet设计)的确让新的CPU设计模式超出了摩尔在1965年设想的模式。
今年,我们还没有确切地看到摩尔定律的死亡,但英特尔和AMD都知道死期在快速逼近,二者选择了稍微不同的想法。这些公司现在正在接受一种允许他们制造许多更小、更定制化的芯片的设计,而不是制造一种速度快得令人难以置信、适用于大多数人的单一芯片。
对于Jerger而言,这种灵活性是令人兴奋的。她说:“在这之前,一切都是关于大批量生产——我必须生产大多数人想要的东西,因为这是我赚钱的唯一途径。现在,你可能会变得更加多样化,我认为这让学术界和初创企业有机会做一些很酷的硬件设计。”
想象一下,CPU是专门为你的计算机的精确需求而构建的。这就是我们正在走向的潜在未来。这一切都是从把单片芯片拆成chiplet开始的。
- 半导体行业观察
- 摩尔芯闻