小心英伟达黄仁勋
云计算从业者李杰在圣诞节第二天收到了英伟达显卡的一则消息,称英伟达规定,游戏显卡只能打游戏,不能放在数据中心跑深度学习。李杰难得爆了个粗口。“真是霸王条款啊!我买了把刷子,你难道还要管我是刷鞋还是刷马桶?”
这则消息迅速在国内人工智能圈炸了。“影响不小,因为不少人用英伟达游戏显卡跑深度学习。” 李杰对AI财经社说。以后要做深度学习,只能买英伟达的Tesla产品了,最高价格是普通显卡的10多倍。
李杰身边搞AI创业的人几乎全在使用英伟达的GPU和平台。有人对AI财经社算过一笔帐,“一个小型AI创业团队在英伟达芯片上花费几十万元是很正常的。”
这跟美国硅谷类似。“我们投资了一大串各个领域做深度学习的创业公司,每一个都跑在英伟达的平台上。”硅谷明星投资人Andreessen Horowitz 说,“这就像上世纪90年代,人们都基于Windows创业,或者在上个十年人们都在iPhone上创业一样。”
英伟达的高端显卡性能强劲,发热量感人,因此其创始人黄仁勋被冠以“两弹元勋”、“核武狂魔”的称号。图片来源于网络
为什么人们都用显卡(GPU)做深度学习?因为深度学习对计算速度的要求是“暴力”的,英伟达GPU芯片可以让大量处理器并行做运算,这下它的速度比CPU快十倍甚至几十倍,因而成为绝大部分人工智能研究者和开发者的必备”核弹“。有人戏称英伟达创始人黄仁勋为"核武狂魔”。
受益于这波深度学习热潮,英伟达股价从2015年7月的20美元一路飙升到如今的200美元上下,市值已超过IBM和麦当劳,这大大出乎人们的意料。
有业者对AI财经社预计,英伟达数据中心业务2018财年(你没看错,英伟达财年比一般公司提早一年)的销售额会达到20亿美元,增长率在100%以上。更让人眼馋的是它的毛利率高达60%。
不过,在高增长高股价下,英伟达这次的显卡禁令也好像在告诉大家,它的业绩增长遇到了难题。
英伟达的疯狂涨势,推醒了巨头和创业者,AI芯片成了大家争相抢夺的蛋糕。这种争抢甚至让它的客户变成对手。
谷歌是英伟达GPU目前的最大客户,据说占到英伟达1/3的市场。但现在,谷歌成为英伟达最大的潜在对手。
谷歌2016年对外开源了自己的深度学习框架TensorFlow,这个框架跑在芯片之上,就像一套积木,各个组件就是一个个模型或算法的一部分,用户可以使用这些积木去搭自己的深度学习系统,这降低了深度学习的门槛。
TensorFlow开源后大受欢迎,已占据人工智能框架的半壁江山。关键是谷歌还为TensorFlow设计了专用芯片TPU。2017年春天,谷歌发布TPU论文称,“TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍。”
这下,英伟达急了。黄仁勋在博客上回应谷歌的对比数据,称英伟达GPU相关芯片速度是TPU的 2倍。但这似乎已经不重要了。
“用户要跑AI应用,是跑在芯片上,还是跑在人工智能框架上?从谷歌的观点来看,底层跑的是英伟达、英特尔还是TPU都没关系,重要的是用户跑在它的TensorFlow上。”一位资深业者对AI财经社分析,“谷歌说,你不用关心我下面用的是什么芯片,谷歌就这样把英伟达屏蔽掉了。这对英伟达来说是比较可怕的。”
虽然谷歌TPU芯片仅供自己使用,部署在谷歌云环境下,“但也不排除谷歌有一天把TensorFlow和TPU打包,卖给亚马逊、阿里或者微软。对于使用者来说,他们其实不关注深度学习跑在什么上面”。这位资深业者进一步说。
阿尔法狗击败五位中国棋手,背后只用了一颗谷歌研发的的芯片。@视觉中国
除了谷歌,芯片行业老大英特尔也醒悟了,在2015年结束了对AI市场的观望。一位英特尔相关负责人对AI财经社透露,正是由于人工智能技术在过去40年中起起伏伏,始终没有突破性进展,英特尔才疏忽大意了。确实,2012年,当深度学习技术悄然兴起时,英特尔还在与高通扳手腕——争夺移动芯片市场。
在发现AI市场蹿红后,如梦方醒的英特尔启动了全方位的AI战略。首先是设法让自己的X86与英伟达跑得一样快。这样,英伟达不就没戏了吗?然后是并购专用芯片,这些芯片完全为深度学习而生,像神经网络处理器Nervana、计算机视觉Movidius、自动驾驶技术方案Mobileye等。接下来,就是做生态,这是英特尔最擅长的事。
“我们在战略上的广度和深度都超过我们的对手。” 英特尔人工智能产品事业部业务拓展总经理 Fiaz Mohamed对AI财经社强调说。
为了狙击英伟达,英特尔甚至还联合它的老冤家AMD,因为AMD也生产GPU芯片。这是20世纪80年代以来英特尔与AMD的首次合作,AMD的GPU将装入英特尔的系统芯片中,在2018 年第一季度交付给客户。
“实际上,英伟达是在英特尔X86生态沃土里,长出的一颗奇葩,这完全超乎英特尔的想象。”资深业者说。在过去20年中,整个IT基础设施生态完全由英特尔架构起来,它建立了成员的分工合作,离开英特尔,英伟达的GPU也玩不转。英伟达得承认,英特尔是它现实中最大的对手。
新竞争者还在源源不断入场。深度学习分两大场景,先是训练深度学习模型,后是部署到实际生产环境中,这叫AI的推理和识别(AI inference)。过去两年,英伟达在训练市场占据了绝对份额,但随着AI部署到实际生产环境中,另一件让英伟达害怕的事情正在发生。在实际生产中,比拼的不仅是速度,还有性价比、性能功耗比和低延迟。
2014年,微软在自己的云端加入了一张FPGA卡进行计算,在相同算力情况下,成本降低了一倍。FPGA是现场可编程门阵列芯片,此前多用于通信基站等产品。此后,亚马逊AWS也把FPGA应用到了自己的数据中心上。2016年,AWS首席布道者Jeff Barr 在一个开发者预告中公布了AWS 实例,称在基因组排序、地震分析、金融风险分析等应用,采用FPGA解决方案能带来30倍的速度提升。
“FPGA还能这么用。”FPGA第一大厂商赛灵思的数据中心专家王晓群博士对AI财经社说。此后,中国的超大型云企业闻风而动,腾讯云、阿里云、百度云、华为云相继发布基于FPGA的加速云服务。 除了云, 在边缘计算领域,FPGA也应用于人工智能创业公司深鉴科技、旷视,瑞为等的机器学习场景中。
相对GPU,FPGA有低延时、低能耗和架构灵活的特性,这让企业在实际生产中考虑选择它。比如,亚马逊的智能语音助手Alexa与人对话,GPU的反应速度是几十毫秒,消耗75瓦到100瓦功耗,而FPGA的响应时间是几个毫秒,功耗为几十瓦。“对指标有硬性要求时,你会选谁?”
在AWS数据中心里,白天FPGA上可以跑语音识别、图片分类,晚上就能跑Netflix视频文件转码。“FPGA可以实现不同应用的切换,提升数据中心的使用效率。”王晓群说。
在自动驾驶领域,明星公司特斯拉从去年Model S开始一直内置英伟达Drive PX 2自动驾驶芯片,但在2017年11月的NIPS大会,埃隆·马斯克宣布,“特斯拉正在开发专门的人工智能硬件,而且将是全球最好的”。
特斯拉与黄仁勋的亲密关系还能维持多久?图片来源于网络
一些创业公司也加入AI芯片的战争。DeepMind联合创始人哈萨比斯投资的AI芯片公司 Graphcore称,自己的IPU芯片相比同类产品性能提升10~100倍,并且在训练和推理两方面都同样出色。
国内深鉴科技、比特大陆也扎进AI芯片市场。如做比特币矿机起家的比特大陆,去年发布了与谷歌TPU对标的专用芯片,适用于深度学习的训练和推理。
深鉴科技CEO姚颂认为,单从成本来考量就能理解玩家为何前仆后继奔赴AI芯片战场。“GPU行业的毛利率达到60%以上,这是非常恐怖的。但服务器特别讲究性价比,谷歌如果有1000万台服务器,每年一台的运行费用是1万美元,哪怕运营节省10%,100亿美元就能省出来。他们因此特别愿意为之买单。”
巨头和创业公司在轮番轰炸。不过,大家不得不承认,英伟达的地位目前仍难撼动。
英特尔一位员工对AI财经社说,8年前,英特尔曾想收购英伟达,但就收购后英伟达创始人黄仁勋的任职上没有达成一致意见而不了了之。“谁知道深度学习现在会这么火。早知道,把它收购了就好了。”
人们都认为,做游戏显卡起家的英伟达,是被天上掉下来的深度学习大馅饼砸中了。不过,浪潮集团AI与高性能产品总经理刘军认为,这是英伟达在10年前布局生态,遇到深度学习节点水到渠成的事。
浪潮刘军表示,英伟达在AI时代蹿红,不是天上掉馅饼,而是因为早在十年前的布局。受访者供图
AI芯片创业公司深鉴科技CEO姚颂听过一个段子。2007年,英伟达CEO黄仁勋在华尔街看到一些做高频交易和金融量化的人,在用英伟达GPU跑交易,但这些人觉得GPU编程太麻烦了。彼时,英伟达的主业还在游戏市场。黄仁勋意识到市场对通用编程环境的需求,他行动了。
在英伟达发布通用开发环境CUDA之前,GPU编程是个非常痛苦的事。程序员不得不编写大量低级机器代码。英伟达推出CUDA,GPU逐渐从游戏领域扩展到了更为通用的计算场景。在国内,浪潮刘军见证了这个过程,浪潮当时有一个团队专门与英伟达一起将客户的应用迁移到GPU上。
英伟达支持的人工智能系统,能够利用城市里超过十亿个摄像头来帮助管理交通拥堵。图片来源于网络
一些石油、气象和生命科学的客户受益于GPU的计算力。刘军记得,当时中石油在海外找油用勘探软件分析地块数据时经常犯难。要一两周时间,没有国内那么大的机房,数据还传不回来。
“我们和英伟达合作,将应用迁移到GPU上。原来一两百台CPU服务器,后来用十几台GPU服务器就解决了。在委内瑞拉宾馆里租一个房间,就能放下全部机器了。”刘军回忆说。
从无到有做GPU的生态很具挑战性。懂GPU应用开发的人不多,能源、生命等不同项目间的可复制性不强,每个项目都要从头开始。从2008年起,浪潮也开始做GPU开发培训,近10年培训了几千名工程师。
转机发生在2012年,深度学习来了。在ImageNet大赛中,多伦多大学提交了一个名为 AlexNet 的深度卷积神经网络架构,使用了两个 GPU,实现了准确率 10.8% 的大幅提升。这样,到2013年,比赛上所有参赛者都采用深度学习算法,也都跑在英伟达的GPU和CUDA上。
深鉴科技CEO姚颂也是因为这次大赛了解到深度学习和GPU的优势的。“我们很快跟进神经网络的硬件结构设计,当时国内只有我们和社科院计算所在做这个。”姚颂的深鉴科技的芯片明年流片,切入安防的端智能市场。
“英伟达一直在做生态。当开发者越来越大,软件生态越来越成熟,硬件性能不断迭代提升时,就到了这么一个时间点——很多前沿做深度学习的人,就会发现这个生态,会把实验、开发转到GPU上。”刘军补充说。
在原来的云计算环境下,计算的主力是英特尔CPU。现在到了AI计算场景,计算主力变成了GPU和其他专用加速器。英伟达迎来了属于它的时代。
刘军回忆,百度、阿里、科大讯飞、奇虎、搜狗后来也把语音识别、网络安全、搜索这些深度学习算法放到GPU上。“互联网客户看到了GPU的潜力,再结合上深度学习算法,一下子就变成了一个特别大的机会。”浪潮也顺理成章开启了AI服务器市场。
英伟达用十年才建成了护城河,这是竞争对手难以简单模仿和复制的东西,它靠的是时间。
业者说,现在的英伟达有点像20年前的英特尔。
“那时,在著名CEO安迪格鲁夫的带领下,英特尔创造出一个PC市场,又进军服务器市场,把原来IBM、惠普的小型机用X86系统替代掉。英特尔推动的是整个技术架构的进步,包括生态的升级。”业内资深业者对AI财经社说,“现在,英伟达正用GPU技术,去升级AI时代。“
当年,安迪格鲁夫那句著名的话:只有偏执狂才能生存。“15年来我说的差不多是同样的事,所以几乎不怎么改我的Slide。”黄仁勋对《财富》透露。这位华人CEO个性鲜明,喜欢冒险,他的经典装扮黑色皮夹克在硅谷几乎与乔布斯的牛仔T恤一样有名。“他是安迪·格鲁夫所说的那种偏执狂。精力旺盛,侵略性强,非常有个性。”接触黄仁勋的人说。
当英伟达股票涨到100美元时,黄仁勋兑现诺言,去纹了身。图片来源于网络
在抓到人工智能这个潜力市场后,黄仁勋变得更为激进。“过去,整个行业都是依赖摩尔定律来推动,但它太老了,太慢了,GPU才是全新的‘超级摩尔定律’,这也是整个行业一次千载难逢的机遇。” 黄仁勋在2017年全球GTC大会北京站一字一顿地说。
不过,英特尔一位负责人对此不以为然。“我们会用全方位战略,我们有CPU、GPU、FPGA和各种专用芯片,我们有完整的体系。”他对AI财经社分析,“你知道,当年互联网刚起来时,SUN公司CEO也曾宣称,SUN就是.com时代‘com’之前的那个点,哪一家都缺不了它。但是,后来英特尔把不可能的事情做成了。现在在数据中心中,你再也看不到SUN了。”
在2017年底举办的英特尔人工智能会议上,百度、海康威视、科大讯飞以及人工智能AI创业公司展示与英特尔的合作。”我们一直用英特尔和英伟达跑深度学习。英特尔管理团队与我们的老大更熟,技术员工给的支持更大。我们现在用英特尔平台跑应用。“一家AI医疗创业公司对AI财经社说。双方的商战很激烈,另一家创业公司产品手册上因有英伟达几个字,而不能在这次会议上露脸。
黄仁勋被称为“偏执狂”,面对各大厂商的围剿,他显得更加激进。图片来源于网络
FPGA对市场的争夺刚刚开始,它要像10年前的英伟达,培养一个庞大生态。“未来赛灵思会把80%的基础开发做完,让应用开发者们专注于自己那部分定制开发的20%。”
从2017年开始,赛灵思打算每年召开一次开发者大会,期望5年内让FPGA使用者从5万人提升到25万人。
一位不愿具名的AI芯片从业者认为,过往股价涨幅已让黄仁勋在业绩表现上面临极大压力。“游戏卡不能用于数据中心,但在挖矿上却不限制,这条禁令就是压力的表现。” 深度学习训练市场的需求并不会减弱,这是英伟达的优势领域,但在正在发展的推理领域,随着人工智能普及,这个市场难以估量。
深鉴科技姚颂则不确定GPU在训练市场的增速。“前些年加速卡已经卖得很多了,市场可能会增速减缓甚至保持平缓状态。”
变数还存在于技术的突破性变革中。现在不排除有某种革新式硬件出来,完全为深度学习而生。如果新硬件性能的提升超出英伟达很多时,可能会引发整个生态系统的变迁。
“挑战一定会存在,你看时代的变化发生得非常迅速。几年前谁也没料到深度学习会崛起。不能及时跟进或提供最合适的技术选择,很快就落伍。即便是深度学习的发展也不代表英伟达可以高枕无忧。”浪潮刘军分析说。
“大家都不知道未来会发生什么,唯一能做的就是跑得更快,让后面人看不见你。”他说,“这是目前最安全的方法。”
- 半导体行业观察
- 摩尔芯闻
最新新闻
热门文章 本日 七天 本月
- 1 国产EDA突破,关键一步
- 2 思尔芯第八代原型验证S8-100全系已获客户部署,双倍容量加速创新
- 3 汽车大芯片,走向Chiplet:芯原扮演重要角色
- 4 Ampere 年度展望:2025年重塑IT格局的四大关键趋势