Cerebras第二代晶圆级芯片曝光:850000个内核,2.6万亿晶体管

2020-08-19 14:00:35 来源: 半导体行业观察

来源:内容来自 半导体行业观察综合 ,谢谢。


几年前,我们看到研究人员开始讨论一种在上世纪八十年代出现的古老制造思想:晶圆级加工(Wafer-scale processing,简称WSP)。WSP的想法很简单,那就是不要将晶圆切成单个芯片,然后将这些芯片封装以进行转售,而是使用单个芯片的大量(如果不是全部)晶圆来构建单个内核或内核集合。


人工智能/机器学习初创公司Cerebras去年推出的第一代处理器就是采用了这种方法。“旧的” Cerebras晶圆规模引擎(CWSE)是使用16纳米工艺打造的晶圆,具有400,000个AI核,1.2T晶体管,18GB板载内存,9 PB / s的总内存带宽和100Pb / s的总结构带宽。据说CWSE的新版本更大:


如上图所示,新芯片有很多晶体管和核心,功耗也许也不小,尽管其他公司的数据表明从16nmFF到7nm的转换可以节省大量功耗,但WSE也许并不会这样。到目前为止,Cerebras的芯片一直是AI市场的突破宠儿之一。

Cerebras利用宏观方法解决了微观问题。具有讽刺意味的是,小芯片和晶圆级设计都是试图为现代计算的封装和能源效率问题找到解决方案。小芯片专注于优化裸片面积并将处理器分解为功能块,这些功能块最适合于它们所部署到的过程节点。Chiplets驳斥了长期以来摩尔定律的宗旨,即集成永远是最好的,而是专注于在仍然可行的情况下集成组件。晶圆级处理还处理集成。但是从系统作为一个整体平台的角度来看,它绕开了很多集成,并且支持功能块之间的根本不同的关系。

Cerebras晶圆级引擎(已组装)。图片来自Cerebras

传统上,CPU或GPU是连接到安装在PCB上的封装的硅片(如果没有其他限制,则由晶圆厂的最大标线大小限制)。安装4-10个加速器板的单个母板也是一个集成系统,并且其中一个内部效率很低,Cerebras绕开了通常通常会阻止晶圆级处理器可行的制造限制。在这两种情况下,采用不同的集成方法都会产生根本的改进,而相同的旧方法已经使我们失败了。

当然,小芯片和WSE之间有一个主要区别:小芯片已经可以在AMD的消费产品中使用,而晶圆级引擎消耗的功率约为15kW,仅可用于个人安装在服务器甚至月球基地中。

以下为Cerebras在hotchip演讲PPT:



点击文末【阅读原文】,可查看 本文原链接


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第2406期内容,欢迎关注。

推荐阅读


8英寸热潮涌动晶圆江湖

日本的晶圆厂“革命”

国内MEMS企业渐露头角


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

模拟芯片|蓝牙 5G|GaN|台积电|英特尔|封装|晶圆

回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

点阅读原文, 可查看本文原文链接!

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论