[原创] Arm服务器芯片如何突围?
10多年来,英特尔几乎是全球服务器市场的唯一CPU供应商。虽然多家芯片开发商尝试进入,但都以失败告终。Arm曾经信誓旦旦地宣称到2021年要拿下这一市场25%的份额,但高通退出,Arm阵营其它合作伙伴进展缓慢,这一目标似乎实现无望了。然而,Arm并没放弃,还专门推出了全新的服务器处理器品牌。最近Amazon和华为也相继发布基于Arm的服务器芯片,似乎给业界打了一针强心剂。服务器市场究竟有多大的诱惑呢?
服务器芯片是一块250亿美元的大肥肉
英特尔 2018年全年营收预计为712亿美元,其中数据中心业务(主要是服务器芯片)约占32%,为230亿美元。在全球服务器芯片市场,英特尔份额超过90%,由此推断市场规模约为250亿美元。重新进入这一市场的AMD 自发布EPYC(霄龙)服务器芯片以来,估计已经抢占了接近10%的市场份额,约为20亿美元,预期未来几年会有超过10%的增长。
据市场分析预测,从2018年到2025年,数据中心处理的数据每年平均增长达到50%。机器学习和其它AI相关的计算每年更是以10倍的速度增长,约占数据中心总计算量的25-30%。相应地,服务器和高端服务器CPU也将以持续增长,预计到2020年服务器芯片市场规模将超过300亿美元。
AMD重新进入服务器市场的成功策略在于主攻微软、百度和腾讯等云服务商,等产品和生态系统已经得到市场检验,然后再做企业客户的工作。这一策略值得Arm阵营借鉴。自2011年以来,多家芯片开发商先后投身到Arm服务器芯片的研发。但到目前为止,几乎全军覆没。其中Applied Micro被Macom收购拆分,英伟达、三星和博通都终止了相关业务。Cavium买下博通的Arm服务器芯片相关IP,继续开发。高通则因为移动芯片业务受阻、收购NXP未遂、官司缠身等多重压力而被迫放弃服务器芯片业务。
Arm需要反思一下,为何在移动市场制胜的策略不能成功移植到服务器市场。Arm的成功秘诀在于利用其处理器IP与授权合作伙伴一起构建强大的生态系统。经过10年的高速发展,智能手机行业的一大特色是前三大手机厂商(苹果、三星和华为)都在自己研发应用处理器(基于Arm架构),以此降低成本和凸显差异化优势。服务器市场是否也会出现类似的情况呢?我们先来了解一下关键客户的需求。
云服务商寻求英特尔替代方案
服务器的最大买家是云平台服务商,包括被Gartner评为Hyperscaler的全球云服务商AWS、微软Azure、谷歌云、阿里云、腾讯云,以及Facebook、百度和中国移动。主打企业云和物联网平台的华为云也成为一个Hyperscaler。这些大买家的数据中心遍布全球,服务器使用和保有量以百万计。服务器采购和运维成本哪怕降低1%,每年节省的开支也高达数百万,甚至上千万美元。x86架构的服务器虽然性能强大,但其功耗(>200W/CPU)也相当吓人,每个数据中心每年的电费也是一个不小的数字,这些最终都会摊在云服务用户头上。Arm服务器也许在性能上还不能与x86相提并论,但在成本和功耗上有明显的优势。对云服务商来说,服务器性能已经不再是唯一的考虑因素,性能/功耗比才是更有价值的参数。
近年火爆的AI和机器学习让很多人有这样的错觉,似乎AI芯片和GPU才是这些云平台服务商最关心的,CPU反而变得无关紧要了。殊不知目前互联网流量的70%是视频,加上搜索、图片、电商、游戏和移动APP等应用,构成了数据中心服务器的主要负载,仍然需要CPU来处理。此外,企业数字化转型和工业物联网也产生了海量的数据。大数据处理和存储需求迫使云平台服务商不断增加更多服务器,即便这样也难以跟上数据增长的速度。
苦于没有选择,这些服务商只能忍受英特尔的高价,也难怪AMD的EYPC服务器会受到众多云服务商的青睐,Arm服务器也早已进入他们的视野。经过多年开发,针对Arm平台的红帽企业级Linux(RHEL)已经准备就绪。就连Windows Server也要有Arm版本了。一旦两大操作系统支持Arm,软件开发商和各种应用也会随着繁荣起来,一个基于Arm架构的服务器生态也就逐渐成型了。但是,这个生态的主角 — Arm服务器芯片在哪里?
尽管高通等独立芯片开发商的Arm服务器业务让人感到失望,但亚马逊和华为的芯片却为我们带来了希望,这是否预示着云服务商才是Arm服务器的救星呢?Arm自己又怎么看?
Arm Neoverse和IoT
平台为小伙伴们指明了方向
善于构建生态系统的Arm已经从“移动”转向下一个目标— IoT。Arm看到的是一个万亿智能设备互联的未来愿景,其Cortex系列处理器已经在支持着每年上百亿的智能设备投入市场,从智能手机、物联网端点,到各种网关和路由网络设备。但是,在服务器CPU这一高端领域,Cortex似乎有点力不从心。虽然像高通和华为这样体量的合作伙伴采用的是Armv8授权架构自主开发服务器芯片,但局限于Cortex的思维毕竟跟x86架构不在一个层级上。于是,Arm在去年的TechCon大会上发布了新的Neoverse品牌,专门为IoT基础设施和服务器芯片制定了明确的未来发展线路图。
按照Arm高级副总裁和基础设施事业部总经理Drew Henry的说法,Arm目前的Neoverse系列是基于A72和A75内核的Cosmos平台,采用16nm工艺,AWS Graviton处理器就是基于这一平台开发的。Arm承诺未来3年内,Neoverse系列处理器每年将有30%的性能提升。今年的主打平台代号为Ares(古希腊神话中的战争之神), 2020年是Zeus(宙斯,众神之王), 2021年则是Poseidon(海王,宙斯之兄)。Neoverse处理器设计最高可以容纳256个内核,具有更快的存储器接口、芯片间互联带宽、安全特性,以及虚拟机等高性能计算所需要的技术。
根据Arm的统计数据,Arm处理器已经在物联网基础设施市场占据超过25%的份额,其中包括无线基站、WAN路由器、边缘计算网关和交换机等设备。虽然服务器不理想,但2018年出货量也达到了100万台。然而,要真正建立起来一个强大的生态,只有硬件设备是不够的,还需要一个强大的IoT平台来支持设备管理、数据管理和连接管理。
Arm Pelion IoT平台给出了答案,不但像Arduino这样的开源硬件加入了这一平台生态,就连英特尔也成了将IoT设备“绑定到云端”的合作伙伴。在这样一个庞大的生态系统中,有Arm授权合作伙伴、EDA工具供应商、HPE和联想等服务器厂商,以及众多的开源软件和硬件开发商和服务商。
IoT将是云计算未来的增长点,这也是Arm服务器芯片可以充分发挥价值的空间。华为云、AWS和微软Azure都看到了这一点,他们也已经行动起来了。
云平台服务商自研自用
30年来,半导体行业逐渐从垂直一体化IDM模式发展到今天的IC设计、EDA/IP和晶圆代工的专业化分工合作格局。然而,系统厂商却有从系统到终端设备,再到芯片的垂直一体化整合趋势,现在芯片设计的技术门槛降低和晶圆代工模式使得系统厂商自己设计芯片成为可能。三星、华为和苹果都在为自己的手机自研芯片,谷歌、百度和阿里等互联网公司也开始自研芯片了。
1. AWS Graviton处理器投入商用
一直以电商和云服务为主业的亚马逊去年11月份突然宣布自家开发的Graviton处理器开始支持新的AWS EC2 A1实例配置,主要面向微服务、Web服务器和开发环境等可扩展应用,成本可以大幅降低45%。这一基于Arm架构的服务器芯片是由位于以色列的初创公司Annapurna Labs开发的。
Annapurna Labs是一家神秘的以色列芯片开发公司,早期投资者包括以色列半导体大佬Avigdor Willenz、Arm,以及华登国际创始人陈立武。亚马逊于2015年以3.7亿美元全资收购该公司,开始为AWS开发服务器芯片。AWS Graviton处理器基于Arm “Cosmos” 平台架构,包括16个A72内核,网络带宽高达10Gbps。在第三方基准测试中,虽然基于Graviton处理器的AWS EC2 a1.4xlarge实例配置在性能上还是赶不上英特尔至强服务器和AMD EYPC,但其性价比要有明显优势。
2. 华为鲲鹏9200处理器和IoT平台
华为最近发布了Arm服务器芯片Kunpeng 920(鲲鹏920),以及基于该处理器的三款TaiShan(泰山)服务器。从性能参数看,鲲鹏920基于ARMv8架构,采用7nm工艺,可以支持64个内核,主频可达2.6GHz,集成8通道DDR4和100G RoCE以太网卡。此外,鲲鹏920还支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。
据华为称,基于鲲鹏920的三款服务器包括均衡型、存储型和高密型三个机型,华为云利用泰山服务器实现了“20%的计算性能提升”。华为首席战略营销官徐文伟在发布会强调,鲲鹏920不是要取代英特尔芯片,其主要应用场景包括快速增长的大数据、分布式存储和Arm原生应用等。华为与英特尔将继续保持长期战略合作伙伴关系,并继续共同创新。日益复杂的计算环境需要异构系统才能满足不同的需求,无论CPU、GPU还是FPGA,都有各自的优缺点。x86和Arm架构额CPU也可以在同一个云平台上实现无缝集成,发挥各自的优势。
从华为公布的测试数据来看,鲲鹏920在Arm原生应用方面的优势最为明显,具有2倍于同类产品的性能。除了安卓APP和移动游戏外,基于Arm的IoT平台应该也是鲲鹏920的主要应用场合。从华为OceanConnect物联网平台的突出表现可以看出其Arm服务器的未来布局。
华为云虽然进入云计算市场较晚,但已经凭借全栈技术能力入选Gartner的中国Cloud IaaS第一梯队,成为一个Hyperscale云服务商。最近IHS发布的全球IoT平台供应商评估报告将华为OceanConnect物联网平台评为行业领导者。该报告从市场表现和市场势头两个方面,对包括微软、亚马逊、阿里云、GE、IBM、思科和SAP等9家全球物联网平台供应商进行综合评估。华为在设备连接数、战略承诺、设备增长率、市场广度、生态发展和技术创新等6个维度上均处于行业领先位置。
由华为自己研发的芯片和服务器来支持自家的云平台,完成从端设备、边缘计算到云端的垂直整合,从而为完整的智能计算平台和生态系统奠定基础。华为自研芯片未来也许跟Arm和英特尔构成一些竞争,但在竞争中合作才是持续发展的不二法宝。
独立芯片开发商是否还有机会?
高调进入服务器市场的高通Centriq处理器以失败告终,这对Arm阵营无疑是一个沉重的打击。现在回头总结一下,可以看出高通Arm服务器芯片业务失败的原因主要有如下三点:
1.服务器芯片市场已经被英特尔垄断多年,相关生态已经比较成熟。 虽然AMD占到一点地盘,但要以牺牲利润为代价。云服务商和企业客户寻求英特尔替代方案的首要动机是降低采购成本,而AMD满足了这一需求。
2.Arm芯片的低功耗可以降低数据中心运营成本的优势还没有得到很好的验证, 再说还需要服务器OEM厂商、操作系统和软件生态的支持才能说服客户大规模采购。
3.高通自身运营策略的原因。 首先,移动业务增长放缓。前面有大客户甩开高通自研芯片,后面有联发科和展讯等步步紧逼。其次,想通过收购NXP拓展汽车市场的梦想破灭,不得不向股东做出削减10亿美元成本的承诺。在这种情况下,前途迷茫的Centriq处理器业务自然就首当其冲。该部门员工从最多时的1000人砍掉只剩50人,现在这块业务如何处理还不得而知。
这是否意味着Arm服务器芯片无法跟x86 CPU抗衡,独立的Arm处理器开发商就没有机会了呢?从高通数据中心业务销售VP职位辞职并加入Ampere担任销售和业务发展高级副总裁的Matt Taylor不这么认为。
Ampere:阵容强大的Arm服务器芯片初创公司
Ampere从原来Applied Micro业务重组而成,由原英特尔总裁Renee James担任董事长和CEO,其首席架构师和CFO等高层大都是原英特尔或苹果干将。Ampere背后的投资者是Carlyle集团,虽然具体投资金额不详,但开发高端服务器芯片的花费应该不会低于5000万美元。有外媒称,Ampere曾试图从高通手中买下Centriq处理器业务,但因为高通与中国华芯通的合作关系而作罢。
Matt Taylor认为云服务商对Arm服务器还是很感兴趣的,高通的失败主要在于自己的原因,不是没有市场需求。Ampere去年9月份发布了eMAG系列芯片,具体性能如下:
-
内置16或32个Armv8-A内核,最高主频为3.3 GHz Turbo
-
8个DDR4-2667存储控制器
-
42线PCIe 3.0高带宽I/O
-
最大功耗125W TDP
-
采用TSMC 16nm FinFET工艺
据Matt Taylor称,Ampere eMAG价格仅为英特尔Xeon Gold芯片的一半,而功耗为AMD RYPC的一半。已经有联想和其它几家ODM合作伙伴基于该CPU开发服务器,联想ThinkSystem HR350A就是其中一个机型。
Marvell/Cavium ThunderX2
要论在Arm服务器芯片市场最有持之以恒拼搏精神的莫过于Marvell及其旗下的Cavium。Marvell虽然终止了自己的Arm服务器芯片研发,但去年却斥资60亿美元买下ThunderX和ThunderX2开发商Cavium。ThunderX2处理器也是采用Armv8架构,集成32个内核,采用16nm FinFET工艺制造。除了Arm虚拟扩展和TrustZone特性外,还具有专用的CCPI2一致性处理器互联,速度高达600Gbps。
HPE Apollo 70系统的CPU就是采用ThunderX2,还有其他一些基于ThunderX2的服务器/工作站已经出货和投入商用。据称微软也在跟Cavium展开合作,为其Azure云平台寻求基于ThunderX2的服务器方案。
结语
服务器芯片市场被一家独断的格局肯定要被打破的,AMD已经证明这一点可以做到。Arm及其生态合作伙伴要想在这一市场分一杯羹,靠单打独斗是注定要失败的。好在Arm Neoverse服务器芯片系列和Pelion IoT平台已经明确了发展线路,这会增强合作伙伴的信心。对Arm 来说,从华为鲲鹏和AWS Graviton处理器的自研自用模式可以得到一些启发,也许推动更多云服务商采用这一模式才是Arm进军服务器市场的捷径。另外,Arm阵营应该改变思维,不要只想着在原有应用上跟英特尔死磕,而应积极寻求AI/ML和IoT等新的应用场景。当然,Arm也不会放弃独立的芯片开发商合作伙伴。无论云服务商,还是独立芯片供应商,基于Arm的服务器CPU都有机会赢得服务器市场的成功,在竞争中合作始终是立于不败之地的策略,就看各家怎么发挥了。