微软将未来押在这个FPGA芯片上
本文来自连线,由半导体行业观察根据原文翻译
将时钟回拨到2012年12月,Doug Burger站在当时的微软首席执行官 Steve Ballmer面前,与他畅谈未来。
以脾气暴躁闻名的SteveBallmer坐在Building 99演讲室的地板上,与四年前加入公司的计算机芯片研究员Doug Burger探讨一些芯片技术,这就是Burger口中的Project Catapult。
DougBurger.
Burger表示,技术世界正在跨进一个新的阶段。在未来,一些大型的互联网公司会运营一些跟以往不同的复杂互联网业务,而这些公司就需要打造一些全新的架构去运行这些业务,而这并不是通过软件去升级就可以实现的,当中还需要硬件去配合,当中就包括了服务器和网络设备。而Project Catapult就能解决微软的服务器问题,因为他们都会搭载微软特别定制的芯片,去完成这些特殊任务。
在Burger想向Ballmer介绍其最新的想法的时候,后者吃了一惊,因为他最初招聘Burger来微软,只是希望他能够升级研发中心,而不是来做策略介绍的,但Burger的表现出乎Ballmer的意料。Burger表示,再过去40年里,微软只是聚焦在打造Windows, Word和Excel这类的计算机软件,并不需要更多的硬件。而正是因为这样,微软避开了费事、昂贵且bug众多的硬件产业。而微软做硬件芯片就和可口可乐做鱼翅汤一样怪异。
ProjectCatapult
在演讲室里,Burger娓娓道来,他对Ballmer说,谷歌和亚马逊这样的公司已经开始做出转变,且现在的硬件制造商并不能提供满足微软在线服务所需的硬件服务。如果微软不再做硬件的话,未来一定会落后于其他竞争者,但Ballmer并不认同他的观点。然而一会之后,Bing的运营主管Qi Lu加入了讨论。他表示,他们的团队已经开始了相关的研究。
现在,这个由Berger和Lu打造的FPGA芯片,将会改变这个世界。其实FPGA已经被应用在Bing搜索的支持上,在接下来的数周内,微软将会基于神经网络(模仿人脑结构的人工智能)推动新的搜索算法。借助这个芯片,其执行速度比传统的芯片会快上很多倍,只需要24毫秒就可以实现,规避了以往长达四秒搜索空白的尴尬。
这个全新FPGA同样能够支持微软的云计算服务Azure。在接下来的数年里,微软全球的数百万部的服务器将会装上这个FPGA。“这个给我们带来了很大的灵活性和容量,并带来很大的经济收益”,Burger说。
“这将成为微软的标准,全球的架构”,Breger强调。
Catapult团队成员:Adrian Caulfield,Eric Chung, Doug Burger,和Andrew Putnam
这个项目并不是为了帮助Bing追赶Google,这是对未来全球系统转变的一个信号。由于硅芯片的发展不能满足人工智能的需求,从美国的亚马逊到中国的百度,这些互联网都在其服务器上使用其相关标准的芯片。
从目前的情况看来,为了维持其网上业务运转,微软每年需要在硬件上投入50到60亿美元,因此关于这些芯片的追求要投入到实操阶段,2014年接任微软CEO的SatyaNadella对记者说。我们要将其提到优先位置,纳德拉强调。
一种全新的传统计算机芯片
2010 年圣诞节前的某一天,微软的研究员AndrewPutnam 正在度假,突然就接到他Boss Burger 的电话。Burger 告诉Putnam ,节后他会和Bing 的老大会面,因此他需要一个可以在FPGA 上执行Bing 的机器学习算法的硬件。
Putnam 就立刻驱车前往最近的星巴克,打开电脑开始谋划这个项目。
47 岁的Burger 和39 岁的Putnam 之前都是学者,Burger 之前曾在德克萨斯大学奥斯汀分校担任了九年的计算机学教授,在那里,他专门研究微处理器,并设计了一款叫做EDGE 的芯片;而Putnam 则在华盛顿大学担任了五年的研究员,那五年里他一直和FPGA 打交道。虽然FPGA 存在了很长一段时间,但一直以来业内都是用它来做原型验证。2009 年,Burger 把Putnam 招进微软,他们开始探索一个想法——这类FPGA 芯片实际上可以加速在线服务。
这一想法,最初连他们的老板都不认同。Burger 小组的主管、微软的研究所VP Peter Lee 说,每隔两年,FPGA 的时代将要到来的论断,都会被炒热一次。但这次不一样了,Burger 和他的研究小组坚信,FPGA 大显身手的时代已经到来,而Bing 则是最好的测试对象。
Project Catapult 的第一个版本,Burger 和他的团队在西雅图园区数据中心测试过了这个硬件
微软的搜索引擎Bing 是一个运行在数千台机器上的在线服务,每台机器都是靠CPU 驱动的。虽然Intel 公司一直在推动硬件升级,但是这些硬件跟不上软件的进步是不争的事实。
尤其是在人工智能潮流兴起以后,Intel 处理器的缺点被进一步放大。
而类似Bing 这类的服务的需求已经超过了摩尔定律,大家发现,单纯靠增加CPU 的数量已经不能解决问题了。
但另一方面,如果为每个新难题打造定制化专用芯片又太过昂贵,FPGA 正好填补了其中的鸿沟。他们让工程师打造比流水线型通用CPU 速度更快(因为FPGA 是真并行)、功耗更低的芯片。可定制化让它能够从容面对瞬息万变的技术和商业模式。
在节后会议上,Burger 主张Bing 在FPGA 上的执行能实现低功耗提速,但并不是很明朗。因此在接下来的几个月中,他们就根据Putnam 的草图去做了一个原型,通过这个原型可以验证,新FPGA 可以将Bing 的机器学习算法提速100 倍。正是这个数据吸引了微软对这个项目的兴趣,这也让Burger 的团队进入了艰难的开发阶段。
原型机是一个内有6 个FPGA 的专用盒,由满满一架子服务器共享。当盒子过热到滋滋作响,或者机器学习算法的复杂度增加到需要多于六个FPGA ,整个系统就会奔溃。这让Bing 的工程师无比抓狂。
因此Burger 的团队又花了好几个月去改进,推出了第二个版本的原型,这是一个能被接入每台服务器的电路板,每个电路板只含有一个FPGA ,但每个FPGA 板都可以连接到其余所有服务器。这样就打造了一大批可以让任何Bing 机器接入的可编程芯片组。
正是这个原型,让Bing 的老大Qi Lu 大感兴趣。他给了Burger 一大笔钱,让他可以用FPGA 建立一个拥有1600 台服务器的测试环境。在台湾和中国大陆制造商的帮助下,Burger 的团队还是花了六个月才打造好这个测试环境。他们最初是在微软园区的数据中心进行了相关测试,但碰上了事故,经过了三天的抢修,一切又回到了正常轨迹。
在2013 和2014 年的好几个月里,测试表明Bing 的“决策树”机器学习算法速度在新芯片的支持下有了四十倍的提升。在2014 年夏天,微软声称会将这个项目移植到Bing 的数据中心中,但稍后他们暂停了这一计划。
除Bing 之外,搜索更多应用
在早些年,Bing 承载了微软的在线野心,但到了2015 年。微软又多了两个大型的在线业务,一个是商务应用Office 365 ;另一个是云计算服务Azure 。和他的所有竞争者一样,微软的掌门人意识到,要让其在线帝国高效的运行,那就需要打造一个统一的稳固基础。如果Project Catapult 将会对改变Bing ,那它也应该进入Azure 和Office 365 的“内芯”。
问题是Azure 高管并不在意如何加速机器学习,他们需要的帮助在于网络连接。而Azure 的数据中心在面对大流量时,也逐渐显得力不从心,因为传统的CPU 已经跟不上他们的步伐了。
终于,Azure 的首席架构师Mark Russinovich 将目光头投向了Project Catapult ,因为他们的服务器同样需要FPGA 芯片,只不过这次需要在服务器和网络之间布置FPGA 。
第一个FPGA 架构原型是一个被所有服务器共享的的盒子(版本0 );之后就每个服务器有一个FPGA (版本1 );之后就是在服务器和整体网络之间布置FPGA 。
FPGA 团队需要再次重构硬件。因为在第三个版本的原型中,FPGA 是放置在每个服务器的“边缘”,能够直接和网络连接,FPGA 组依然能让任意机器直接接入,这就让它可以为Office 365 助力。
Project Catapult 终于能够活下去了。
据介绍,这个芯片的重构过程是非常痛苦的,不仅仅是因为要建新的硬件,而且每次都需要重新对FPGA 编程。相对于软件编程来说,这简直就是一个噩梦。不但写程序艰难,正确的写程序更是难上加难。
这是一个极度繁琐的工作,就像在芯片上改一个微小的逻辑门那么繁琐。
既然芯片已经有了,那么对于微软来说,他们每次需要面对的挑战就是重新编程这些芯片。去了解这个世界是很艰难的。Project Catapult 比传统的架构节省了30% 的花费和10% 的功耗,而速度则提高了两倍,这些优点让企业离不开它了。
微软Project Catapult 的首次展示的阵仗非常大,Azure 用它去传送数据,而在占有全球20% 桌面搜索和10% 移动搜索的Bing 上,Project Catapult 能够推动其AI 神经网络更进一步。而Office 365 则表示,使用了新的架构,能够大大提高了其压缩和加密的机器学习能力。Burger 表示,这些芯片将会逐渐走进微软的服务器。
不过,这真的奏效吗?
微软Next 研究所的负责人Peter Lee 表示,Project Catapult 还是让他有些困惑。
在纳德拉担任CEO 以后,他一直推进Next 的创新。他希望可以从中看到未来十年或者二十年的趋势。他希望从现在开始,能够改变微软的轨迹。Project Catapult 是当中的一个先行者,展望未来,他们希望在业内缔造一个更庞大的转变,而这一切来源于一个不需要CPU 的技术。
Peter Lee
包括微软在内的互联网巨头现在是用GPU 去弥补CPU 的不足,在这些巨头的人脸识别等神经网络应用中,GPU 担任很重要的工作。同样,微软这些巨头也使用硅的替代品去执行神经网络操作。甚至是昂贵的定制芯片,他们也会去尝试。
现在看来,谷歌在自制神经网络芯片上面,走得比较远。那就是早前推出的让Intel 闻风丧胆的TPU 。
在TPU 上面,谷歌为了速度牺牲了其长期的灵活性,他这样做是为了消灭手机上发起命令的延迟。问题是一旦谷歌的神经网络模式转变,谷歌就需要重新做一个新芯片。
而微软的FPGA 则具有更高的灵活性,从长远来看,是更具备价值的。虽然这个FPGA 并没有谷歌的定制化芯片那么快。但微软可以随着需求的改变重新定义芯片,以满足全新人工智能模式的需求。
新版本的硬件,版本2 ,能够直接接入微软的服务器和网络。
微软的服务项目是如此庞大,因此对FPGA 的需求也是海量的,一旦成熟的话,就将会改变芯片市场。
去年Intel 耗费巨资收购了FPGA 老二Altera ,英特尔的执行副总裁Diane Bryant 表示,这笔收购的出发点就是Intel 认为到2020 年,三分之一的服务器将由FPGA 提供计算能力。
在技术领域,GPU 、CPU 、TPU 和FPGA 都是一些不同的而定义。在云计算时代,微软、谷歌和亚马逊这些企业推动技术的大踏步发展,它们所推出的那些替代芯片也会让APP 和在线服务的应用范围更广。Peter Lee 认为,到2030 年,微软还能扩大其超级计算机的全球影响力,而在那之后,将会是量子计算的时代。
在最后,纳德拉谈到了微软的量子计算计划,虽然这看起来有点像空中楼阁,但多年前的Project Catapult 又何尝不是这样?
摩尔精英
【关于转载】:转载仅限全文转载并完整保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“ 半导体行业观察icbank”微信公众号。谢谢合作!
【关于投稿】:欢迎半导体精英投稿,一经录用将署名刊登,红包重谢!来稿邮件请在标题标明“投稿”,并在稿件中注明姓名、电话、单位和职务。欢迎添加我的个人微信号MooreRen001或发邮件到 jyzhang@moore.ren
点击阅读原文,查看更多半导体高薪职位
- 半导体行业观察
- 摩尔芯闻
最新新闻
热门文章 本日 七天 本月
- 1 国产EDA突破,关键一步
- 2 思尔芯第八代原型验证S8-100全系已获客户部署,双倍容量加速创新
- 3 在这个平台上,硬件创新跑出了“中国速度”
- 4 Ampere 年度展望:2025年重塑IT格局的四大关键趋势