AMD新专利,引领Chiplet大反攻

2022-07-10 14:00:17 来源: 半导体行业观察

来源:内容由半导体行业观察(ID:icba nk)综合 , 谢谢


AMD最近发布了一项专利,用于将渲染负载分散到多个 GPU 小芯片(Chiplet)上。游戏场景被划分为单独的块并分配给小芯片,以优化游戏中着色器的利用率。为此使用了两级小芯片分箱。

AMD 发布的这项新专利为该公司计划在未来几年内使用下一代 GPU 和 CPU 技术做什么提供了更多见解。在 6 月底,有 54 项专利申请被披露将被发送公开。AMD 的计划中将使用已发布的 50 多项专利中的哪一项尚不得而知。专利中讨论的应用详细介绍了公司在接下来几年的方法。

社区成员 @ETI1120 在ComputerBase网站上注意到的一项应用程序(专利号US20220207827)分两个阶段讨论了关键图像数据,以有效地将来自 GPU 的渲染负载传递到许多小芯片上。CPU 最初于去年底将此提交到美国专利局。

当 GPU 上的图像数据通过标准方式光栅化时,着色器单元(也称为 ALU)执行相同的任务并为各个像素分配颜色名称。反过来,在特定游戏场景中的特定像素处发现的纹理多边形直接映射到像素上。最后,制定的任务将保持非典型原则,并且仅通过位于不同像素的其他纹理而有所不同。这种方法称为 SIMD,或单指令 - 多数据。

对于当前的大多数游戏,着色并不是 GPU 产生的唯一任务。但相反,在初始着色之后包含了几个后处理元素。例如,GPU 将添加的动作将是游戏环境的抗锯齿、阴影和遮挡。然而,光线追踪与着色一起发生,创造了一种新的计算方法。

在谈到当前游戏中的 GPU 控制图形时,计算机产生的负载呈指数增长到数千个计算单元。

在 GPU 上,这种计算负载以某种理想的方式扩展到数千个计算单元。这与处理器的不同之处在于,必须专门编写应用程序才能添加更多内核。CPU 调度程序创建此操作,将来自 GPU 的工作拆分为由计算单元处理的更易消化的任务,也称为分箱(binning)。游戏中的图像被渲染,然后分成包含一定数量像素的单独块。该块由图形处理器的子单元计算,然后在其中同步和创建。在该动作之后,等待计算的像素被包含在一个块中,直到图形卡的子单元最终被使用。考虑了着色器的计算能力、内存带宽和缓存大小。

资料来源:AMD 通过 ComputerBase


AMD 在专利中解释说,分割和合并需要 GPU 的所有元素之间进行彻底和完整的数据连接,这会带来问题。不在裸片上的数据链接具有较高的延迟水平,从而导致过程变慢。

由于能够通过多个内核发送任务,CPU 可以毫不费力地过渡到小芯片,从而使其可供小芯片访问。GPU 不提供同样的灵活性,将它们的调度程序与入门级双核处理器相媲美。


资料来源:AMD 通过 ComputerBase


AMD 认识到需要并尝试通过更改光栅化管道并在多个 GPU 小芯片(类似于 CPU)之间发送任务来解决这些问题。这需要先进的分箱技术,该公司正在引入“两级分箱”,也称为“混合分箱”。


在超分箱中,分割被处理成两个单独的阶段,而不是直接处理成逐像素块。第一步是计算方程,采用 3D 环境并从原始图像创建二维图像。该阶段称为顶点着色,在光栅化之前完成,该过程在 GPU 的第一个小芯片上非常少。完成后,游戏场景开始分箱,发展为粗分箱并处理成单个 GPU 小芯片。然后,可以开始执行光栅化和后处理等日常任务。



目前尚不清楚 AMD 打算何时开始使用这一新工艺或是否会获得批准。然而,它让我们得以一窥更高效的 GPU 处理的未来。



AMD领军围剿Intel 小芯片,吹皱半导体一池春水


小芯片(Chiplet)技术深蹲数十年,在芯片、品牌厂对高速运算(HPC)的迫切需求下,由超微(AMD)领军率先商转,连苹果也用小芯片打造「怪兽芯片」M1 Ultra处理器,引起各界关注。一直以来,英特尔(Intel)x86架构长期主宰伺服器和笔电市场,直到苹果开始自制芯片,让英特尔独霸的局势出现转变;同时,对手AMD紧密与台积电合作,企图靠小芯片加速开发速度并降低成本,反超英特尔的计画如箭在弦,逼得英特尔也不得不投入小芯片设计,巩固市场,吹皱半导体一池春水。


2022年3月,苹果(Apple)于春季发表大会推出号称「全球最强大的怪物型电脑芯片」M1 Ultra,再度引爆半导体对小芯片(Chiplet)的关注。苹果资深硬体技术副总裁 Johny Srouji更指出:「M1 Ultra 是一款开创新局的 Apple 芯片,将再次震撼个人电脑产业。」


业界专家表示,M1 Ultra的小芯片设计,简单来说就是将2颗CPU连在一起,发挥加乘的运算处理效果。其实,早在2020年超微(AMD)就开发了CCD(Core Chiplet Die)小芯片,采用7纳米制程,让小芯片数量可以随市场需求增减,例如用于伺服器的搭配8颗处理器,而桌机则用2颗处理器。


「这种高弹性的设计配置,不仅能加快芯片开发速度,更能大幅降低研发成本。」力成科技执行长谢永达向本刊表示。根据超微官方资料显示,在14纳米的情况下,以小芯片生产的成本,相较于系统单芯片(SoC)设计方式,可节省近50%。


日月光研发副总洪志斌补充,使用小芯片主要目的在提升整体表现(如晶圆良率及成本),将原本单一面积很大的多核心芯片拆分成多个面积较小的芯片,这样的作法不仅可减少单一过大面积的芯片成本,由于小芯片的良率较好,能整合出更经济且高效能的产品。正因如此,IC设计业者对小芯片的兴趣与接受度越来越高,尤其是一线IC设计业者。



举例来说,全球排名前五大的IC设计大厂中,就有超微、高通(Qualcomm)、英伟达(nVIDIA)、联发科四家陆续投入小芯片开发设计,其中,超微更是率先推出商用小芯片的IC设计大厂;法人报告指出,联发科也预告其HPC产品将朝向小芯片架构发展,预计2023年上市。


深入分析,超微用小芯片作为反超老对手英特尔(Intel)的秘密武器,蚕食x86市场,市占率从2018年仅有10%多,一路狂飙到2022第一季的27.7%,创历史新高;不仅如此,苹果、谷歌(Google)、微软(Microsoft)、Meta(前身为脸书Facebook)、亚马逊(Amazon)等不同领域的科技巨擘,也纷纷喊出自研芯片规划,以利产品或服务差异化,此举势必进一步动摇英特尔处理器霸主的地位。



芯片商、终端设备业者相继导入小芯片方案,进攻处理器市场,逼得英特尔不得不抢进小芯片领域。(翻摄Intel官网)


「虽然x86架构预期在笔电处理器中仍将占据主流,但苹果内部自研处理器的转变,标志着此格局将发生重大改变。」外商System Plus Consulting技术与成本分析师Ying-Wu Liu一语道破处理器市场的现况。


据 Transparency Market Research报告指出,2020年全球小芯片市场规模为11.1亿美元,预计2031年市场规模上看472亿美元,年复合成长率(CAGR)上看40.9%;主要成长动能来自全球消费电子产业对小芯片的需求上升,以及HPC运算需求。


眼看芯片、云端及系统厂相继投入小芯片拓展市场, CPU老大哥英特尔也不得不放下身段,跳下来加入小芯片战局,巩固龙头地位。


值得一提的是,即便小芯片拥有成本低、开发快的优势,但在系统开发上,仍得面对芯片间互联互通的挑战。工研院副总暨资深技术专家吴志毅表示,小芯片组合的是各家、各类型的芯片,芯片间就像是说着不同的语言,无法有效沟通,恐间接影响芯片的互联性与效能。


有鉴于此,极力争夺主导权的英特尔,今年3月登高一呼,携手微软、Google、台积电、日月光、高通、联发科、创意电子等国际大厂,共同打造Universal Chiplet Interconnect Express(UCIe)联盟,望借此打造出标准化的小芯片沟通介面。


小芯片蔚为潮流,市场第一个联想到的受益者就是协助超微、苹果等生产芯片的台积电。殊不知, 除了台积电外,小芯片的崛起也引爆载板、封测与IP设计服务等半导体供应链庞大商机,吸引业者争相布局。


洪志斌谈到,从成长机会来看,小芯片的设计主要是把原本在芯片上大量的研发与制造成本,转移到封装上,因此会运用到许多先进封装技术,如2.5D硅中介板(Silicon interposer)、扇出(Fan-Out)重新分布层(RDL)与桥接晶粒(Bridge Die)等等,将各种Chiplet芯片透过先进封装制程精密地连接、整合在一起。


点击下方阅读【 阅读原文 】可查看原文链接。


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3096内容,欢迎关注。

推荐阅读


手机基带芯片往事

3D芯片时代,这个问题要重视

晶圆厂成熟制程之争,前所未有的激烈


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论