Arm在服务器领域的机会可能取决于这个市场
2019-10-08
16:05:48
来源: 互联网
点击
来源:内容由半导体行业观察翻译自「nextplatform」,作者:Michael Feldman,谢谢。
Arm公司宣布打算进入服务器领域已经有8年了。但如果你看看现在的处理器市场,你就会得出这样的结论:Arm以及得到Arm授权的CPU制造商的工作,到目前为止还没有取得多少成果。Arm曾在2015年预测,到2020年,其芯片将占据服务器市场20%的份额,但现在看来,份额还不到20%。而Arm在一年后将这一比例提高到25%,似乎真的雄心勃勃。
然而,如果说Arm在服务器方面有一个潜在的亮点,那就是高性能计算(HPC)。Arm架构渗透该领域的方式可能会照亮一条通往更广阔服务器市场的道路。
别误会我们。Arm在HPC领域也没有达到临界点。这毫无希望。目前,超级计算机TOP500榜单上正好有一台基于Arm的超级计算机——桑迪亚国家实验室(Sandia National Laboratory)的Astra System,外加一些散布在各处的小型实验机器。在上周的Linaro Connect活动上,Arm公司的Brent Gorda回顾了一些成功案例,并解释了为什么他认为Arm架构在超级计算和其他领域前景光明。
Gorda是Arm公司HPC业务的负责人,他指出HPC实际上是Arm进入服务器领域的一个方便的切入点。他解释说:“当你拥有一项新技术时,HPC是一个非常好的社区。”这个社区对事物的容忍度比几乎其他领域都高,但也并不完全是这样。
这些言论反映了Gorda三十年的HPC经验,其中一些涉及其他非主流技术。其中包括在劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Lab)的长期工作,在那里他用IBM标志性的超级计算机架构领导了BlueGene项目。
从Gorda的角度来看,由于HPC社区的业务是推动计算的边界,他们往往更愿意容忍早期技术的粗糙。当采用像Arm这样全新的处理器时,这可能是一个决定性的优势。
目前,Arm在HPC领域最大的成功就是前面提到的Astra系统,它是由惠普公司制造的,使用了超过5000台Marvell公司的ThunderX2处理器。Gorda指出,10年前它可能是世界上速度最快的超级计算机,但在Linpack基准测试中,它的运算速度为1.7petaflops,目前排在第156位。尽管如此,它还是代表了Arm在HPC领域的一个里程碑。
除了Astra系统之外,也许今天正在运行的第二著名的Arm系统是Isambard,这是一台使用相同的ThunderX2处理器,由Cray建造的机器。Gorda观察到Isambard正在执行实际的代码,包括用于研究帕金森和骨质疏松症等疾病的生物分子模拟。Isambard的另一个项目是与劳斯莱斯公司合作进行的,涉及到喷气发动机设计的流体动力学模拟。
Isambard系统还被用来测试许多HPC应用程序,正如我们去年所报道的那样,在其中两个代码(OpenFOAM和OpenSBLI)上,ThunderX2芯片的性能超过了Skylake CPU,而在其他代码上则存在或多或少的差距。我们的结论是,这些处理器在这些工作负载上绝对是有竞争力的,从性价比的角度来看甚至更有竞争力。
在巴塞罗那超级计算中心运行的Mont-Blanc项目几乎与Arm公司在服务器市场的设计的历史一样长,一直追随者Arm的潮流。BSC的三代pre-exascale原型都使用了各种各样的Arm芯片。第三次迭代是以实际生产机器的形式进行的,在本例中是配备了标准的ThunderX2处理器的Bull Sequana系统。
但Arm在HPC领域的真正行动还在后头。日本第一台exascale超级计算机,现在被称为Fugaku(以前的Post-K),将采用富士通52核A64FX Arm处理器。作为第一个实现可伸缩向量扩展(Scalable Vector Extension,SVE)技术的Arm芯片,A64FX将在64位提供超过2.7万亿次浮点运算,对于32位、16位和8位计算则速度成倍提升。Fugaku计划在2021年投入运行,这可能使它成为世界上第一台达到exascale级别的超级计算机。
中国三个最初的exascale 超级计算机之一据说也是使用的Arm处理器。正如我们过去推测的那样,很可能是天河三号,尽管国防科技大学并没有透露更多的细节。该系统最早可能在2020年投入运行,但是这似乎不太可能,因为到2019年,国防科技大学只报告说建造一个中等规模的原型(512个节点)。
正如Gorda所指出的,欧盟也将依靠Arm制造其首台exascale计算机。与富士通A64FX CPU一样,Arm处理器将作为包含SVE技术的定制SoC来实现。然而,与A64FX不同的是,EPI设计还将在封装中包括一个基于RISC-V的HPC加速器,以及其他一些专用chiplet。
虽然大多数重要的系统软件,如Linux操作系统、C/C++和Fortran编译器、MPI,以及其他运行时库都已经移植到Arm上,但Gorda承认,应用程序代码仍然是最重要的。在他与潜在用户的对话中,用户对在提交转换架构之前在处理器上移植和测试他们的特定应用程序颇感兴趣。Gorda表示,Arm正努力为这类工作“蓄力”,并相信独立软件开发商(ISV)将从其下游机会中受益。
不过,Arm公司更广泛的服务器战略将继续依赖其硬件IP。这里最新的进展是Neoverse系列,这是去年宣布的一个新的Arm处理器家族,将跨越边缘和数据中心。这将使Cortex系列专注于移动设备和嵌入式领域。
据Gorda称,这背后的基本原理是,互联网的本质和更普遍的横向扩展处理正在经历范式转变。尽管互联网传统上被用作向客户端设备传送文本、音频和视频的平台,但不久之后,它将被用于从数万亿个向上端发送数据的设备中获取各种内容。因此Gorda预测:“互联网上的数据流即将发生逆转。”
Gorda认为这里的机会巨大,因为软件将能够在这两个世界的共同指令集之间自由迁移,使用户能够选择运行工作负载的最佳位置。从他的角度来看,在数据中心之外运行在边缘型服务器上的许多工作负载将需要超级计算级别的性能。他解释说:“我们将看到类似HPC的活动逐渐向边缘发展——为了减小延迟,为了数据移动,为了运行能够比你的手机更好地进行预测的算法等等。”
这表明了Arm的真正承诺,即任何人都可以授权它的IP来创建定制的实现。虽然这种模式对于HPC或其他高端服务器所需的适度容量来说可能价值不大,但对于边缘计算环境来说,它是更自然的选择。如果Neoverse IP可以在容量较大的边缘服务器和容量较小的数据中心服务器之间使用,那么这将是一个成功的方案。这实际上完全取决于是否有一个或多个Arm授权厂商实际制造了可批量交付的处理器。
责任编辑:sophie
相关文章
- 半导体行业观察
- 摩尔芯闻