来源:内容由半导体行业观察(ID:icbank)
编译自thetechnologyletter
,谢谢。
三年前,在一场名为“固态电路大会”的芯片设计师会议上,我(本文作者)与 Facebook 或
Meta
的人工智能负责人
Yann LeCun
进行了交谈。LeCun 当时正在向芯片设计人员发表主题演讲,讨论他们应该如何考虑让他们的芯片能够更好地处理 AI 程序,特别是 LeCun 帮助开创的深度学习版本。
当 LeCun 完成他的主题演讲并且我们在后台接受ZDNet 采访时,他提出的观点之一是 Meta 和其他所有人都需要一个替代
Nvidia
的公司,因为该公司的芯片已经连续十多年占领机器学习的主导地位。
他说,不管怎样,我们都需要打破这种局面,或者 Meta 将构建自己的芯片,类似于
Alphabet
的谷歌如何构建自己的“TPU”芯片来处理 AI。
“换句话说,我们需要的是目前占主导地位的供应商的竞争对手,”LeCun 说,暗指英伟达。
“可能不是因为他们不擅长,而是因为他们做出了假设,如果有一套不同的硬件做出不同的假设,可以用来补充当前 GPU 擅长的东西,那就太好了,”值得一提,图形处理单元是由英伟达首创。
事实证明,这两种选择都没有实现。LeCun 显然没有制造自己的芯片,而且他仍然没有 Nvidia 的替代供应商。
周一,Meta宣布了其所谓的
AI Research SuperCluster
或“RSC”,这是一款致力于为 LeCun 和他的团队所做研究提供动能的超级计算机。该机器包含 6,080 个 Nvidia 的“A100”GPU 芯片,这是其当前的顶级部件。
Meta 的 AI 负责人、工程先驱 Yann LeCun 一直很清楚需要 Nvidia 的替代品,但显然,他一直找不到任何替代品。
这就是当今人工智能的趋势:越来越大的计算机来处理越来越大的神经网络。LeCun 和他的同事告诉全世界事情就是这样发展的,而 Nvidia告诉全世界他们将成为实现这一目标的最优选择。
显然,这对 Nvidia 来说是一个巨大的胜利,拥有巨大的吹嘘权,因为 Meta 将该系统称为“当今运行的最快的 AI 超级计算机之一”,并承诺“当它完全建成后,它将成为世界上最快的 AI 超级计算机” 2022 年年中。”
这也是
Pure Storage
的一大胜利,它提供了所有基于闪存的存储,价值近 200 PB(1 PB 等于一千万亿字节)。
哦,这也是我本月早些时候采访的一家公司
Smart Global
的一大胜利。Smart 的
Penguin Computing
部门生产高性能计算机,也为 RSC 销售了几台机器。
真的,对于英伟达来说,这不仅仅是一场胜利,它是一个鲜明的例子,说明在一些公司投资的规模上,英伟达根本没有竞争对手。
尽管英伟达唯一的公开 GPU 竞争对手
Advanced Micro Devices
销售内置于许多超级计算机中的出色 GPU 芯片,但事实并非如此。
尽管有许多有价值的竞争对手是初创公司,但这种缺乏有意义的反对也是如此,他们推出了令人惊叹的芯片和致力于人工智能的整个计算机系统,包括
Cerebras Systems
、
SambaNova
和
Graphcore
。在我们说话的时候,还有更多的人正在接受资助。
尽管 Meta 等公司渴望另一种选择,但他们都无法打破这些公司的购买习惯。在某些情况下,这些公司已经签下了知名客户。例如,Cerebras与
GlaxoSmithKline等公司
取得了重大胜利,这些客户正在使用该机器进行强化研究,从而产生了原创性发现。迄今为止,这种孤立的胜利并没有扭转英伟达的局面。他们是证明规则的例外。
尽管 Graphcore 等公司在某些情况下愿意在选择的性能基准测试上与 Nvidia 匹敌,但仍缺乏替代方案。
由于外界对我们任何人都不完全清楚的原因(我最近没有就此事与 LeCun 谈过),像 Meta 这样的公司最好的选择仍然是现任者 Nvidia。
我们可以推测,我建议系统扩展到 6,080 个 GPU 以构建世界上最大的 AI 计算机的能力,目前超过了任何新贵在特定用例中在性能或性能方面所能提供的任何优势。效率。(我假设金钱不是 Meta 的对象,尽管这可能是错误的。)
英伟达的首席执行官黄仁勋(中)放弃了与英特尔的竞争,因为后者显然势不可挡。他现在可能认为其他人应该效仿他,放弃与英伟达的对抗。
正如 LeCun 所指出的,GPU 在 AI 处理方面有其局限性,但如果你想要在一种巨大的计算墙中堆叠最多数量的砖块,它是一块非常有用的砖块。
一个重要的细节是,英伟达在 2020 年收购 Mellanox 时从
Mellanox
那里获得的资产被证明是一种将许多芯片连接在一起的重要方式。Meta 也在其新闻稿中突出提到了连接性。
英伟达的首席执行官黄仁勋
本人可以提供更简洁的解释,他是个直言不讳的人。2015 年,在 Nvidia 于 AI 领域占据主导地位的曙光之际,该公司正在逐渐放弃推翻
英特尔
在服务器
微处理器
业务上的控制权。在那年的 CES 上,我问黄为什么他推翻英特尔的战斗没有成功。他的回答很有启发性。
“我认为
英特尔在提高至强
的性能方面做得非常好,”英特尔的主要服务器芯片,这是黄的回应。“我认为英特尔已经取得了很大进步。”
换句话说,老牌英特尔只是保持足够好,以至于来自挑战者的替代品没有优势。有人想知道英伟达在人工智能大战中是否也是如此。只要领先品牌不断进步,没有什么好到可以推翻领先品牌的。
人工智能领域可能还需要替代品。深度学习的基础可能会发生巨大变化。LeCun 本人曾建议,未来的道路涉及神经网络,这些网络消除了他们今天使用的数十亿“参数”,从而产生了完全不同的东西,他称之为“基于能量的学习”。
目前,主导地位属于英伟达。问题是,世界上有多少其他公司像 Meta 那样认输,与现任者并驾齐驱,而不是寻找替代品。
除了这些其他初创公司获得英伟达之外,还有什么可能改变?我一直认为, Nvidia 面临的主要挑战一直是
RISC-V
开源芯片运动。它仍然可能产生影响。并且也许 AMD 在销售用于 AI 的 GPU 方面会变得更强大,以对抗 Nvidia。
我建议作为一种非常非常外部的可能性,Meta 可以使用所有这些 GPU 来设计下一个伟大的内部芯片,就像谷歌的 TPU 一样。毕竟,谷歌已经展示了使用深度学习设计芯片的方法。就好像 LeCun 只是在使用 Nvidia 来实现他对定制 Meta 芯片的梦想。
这种前景更像是希望外星人到达地球以解决气候变化问题。
目前,Meta 正在计划更多的是 Nvidia。据介绍,RSC 的“第二阶段”将“将 GPU 的数量从 6,080 个增加到 16,000 个,这将使 AI 训练性能提高 2.5 倍以上。”
Nvidia 股价最近为 223.24 美元,自年初以来下跌了 24%,在过去 12 个月中上涨了 60%。
★ 点击文末
【阅读原文】
,可查看本文原文链接!
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2935内容,欢迎关注。
『
半导体第一垂直媒体
』
实时 专业 原创 深度
识别二维码
,回复下方关键词,阅读更多
晶圆|集成电路|设备
|汽车芯片|存储|台积电|AI|封装
回复
投稿
,看《如何成为“半导体行业观察”的一员 》
回复
搜索
,还能轻松找到其他你感兴趣的文章!