[原创] 赛灵思应对联网危机的新思路
2020-03-11
14:00:14
来源: 半导体行业观察
当下,数据中心在通信方面正面临极大挑战(联网危机),进出数据中心的流量正在迅速增长。云服务器会在CPU和软件中使用很多SDN功能。随着网络数据爆炸式增长,额外的工作涌入云数据中心服务器,这样的工作量会挤占CPU资源,将大量CPU的处理能力耗费在应用之外,而云服务供应商,特别是公有云,则要具备解决这些问题的能力。而边缘的一级云服务提供商,如亚马逊和微软,在很多年以前就已经意识到了这个问题,他们是从服务器上卸载联网的功能,把他们转移到SmartNIC上来解决这个问题。
为此,亚马逊收购了一家初创企业Annapurna,专门开发这样的器件,把服务器联网的这些工作进行卸载。微软也已经公开宣布把FPGA集成到SmartNIC上,从服务器上卸载超级管理功能中的联网,现在已有数以百万计的部署。
然而,有超过80%的云服务供应商还没有SmartNIC,他们只有传统的NIC,并不是这些云服务供应商没有遇到微软和亚马逊所面临的问题,而是很难凭一己之力去采用SmartNIC。亚马逊和微软有非常雄厚的研发资源,而且能够自行去设计测试,并做大规模的部署,但是很多比较小的云服务供应商,尤其是二级和三级服务商并没有强大的研发团队,也没有专门的工程技术和能力去部署自己的解决方案,所以,他们需要现成的、方便的、即插即用的解决方案。
另外,端口速度会以几何级的速度增长,计算却没有办法跟上。由于这种差距的存在,服务器中所有的CPU资源都将遭到挤占,而无暇顾及应用级处理,这是一个日益迫近的问题,也使得越来越多的云服务供应商迫切需要部署SmartNIC。
基于以上挑战和需求,数据中心需要加速卡是一定的。赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)表示:“跟多个客户交流后发现,不同的客户面临的问题不一样,尤其是摩尔定律的终结,数据在呈指数级增长,数据中心对加速卡的需求会越来越大,因为不可能无限制地扩充CPU,也不可能无限制地扩充机房,所以,加速卡的市场需求非常大。至于未来的市场究竟有多大,一定是与产品的推广和市场的接受度息息相关的。”
唐晓蕾(Maria Tang),赛灵思大中华区销售副总裁
谈到未来加速卡的格局分布时,Maria Tang表示:“我觉得要从几个角度去看,一是计算,特别在云端,计算加速是要努力做的,在网络方面,怎样实现网络的可扩展性、网络管理的可视化,使整个网络智能化,这是一个角度。另外就是存储,不管是带宽的占用,还是成本,都是很有挑战的。未来,加速卡在这些领域都会有很大的潜力去发掘。”
针对数据中心的需求,赛灵思推出了一款新产品,名为Alveo U25。这是一款“一体化SmartNIC平台”。这也是该公司近几年战略转型的延续。
不同于传统数据中心里的CPU和GPU,Alveo既可以做串行,又可以做并行计算。
Alveo U25是SmartNIC平台首个硬件,它融合了网络存储,还有计算加速功能,这是首个在一张卡上实现网络存储和计算卸载的加速平台。
U25基于FPGA技术,是全可编程的,对于用户来说,这张卡能够无缝地卸载并且加速服务器的联网、存储,或者是计算,而不需要做任何额外的编程。据悉,赛灵思会推出一站式的应用来支持虚拟交换、卸载加速,这个会基于OVS标准,而且还会在未来推出更多一站式的应用,比如IPSEC、加密卸载、SSL和其他应用。
如果从服务器上把工作卸载下来,并且在SmartNIC平台上运行,就意味着在给定服务器的情况下,可以完成更多的工作量。换句话说,完成同样工作量,所需要的服务器数量更少。所以,硬件的节约能够大大降低云服务提供商的支出成本。此外,数据中心功耗也能够降低很多,就能够节约运营成本。
SmartNIC是基于FPGA的,所以能够处理非常广泛的工作负载。FPGA在机器学习、推断数据库、加速视频转码等方面表现十分突出,在联网方面表现也非常优异,能够迅速地进行信息包的处理和查询,能够支持压缩、加密和重复数据的删除等各种工作。GPU在计算功能方面是不错的,联网的处理器在联网方面做的不错,但是没有哪一项技术可以像FPGA这样兼顾三个领域。
云服务供应商需要在瞬息万变的世界做运营,开发一些新的功能,并且要在短短几周的时间内部署这些功能,采用基于ASIC的方案是做不到的。FPGA可以支持这样的模式,非常容易开发新的功能,并且对FPGA进行重新编程,非常灵活。
性能是FPGA的另一个关键优势,尤其是与基于SoC的SmartNIC进行比较的话,SoC的SmartNIC需要用通用目的处理路径,比如ARM,虽然它们非常灵活,但是性能非常低,这是因为一定数量CPU功率电路只能容纳一定数量CPU的核,如果计算一下已知每一个数据包所需要的时钟周期,以及核的数量,就很容易计算出大概是2000万到3000万数据包/秒,已经是这种模式的极限了。
这个数字对于当今的速度来说可能是够用的,比如端口速度是25G,但是如果是100G、200G、400G的话,显然就不够了,所以,需要能够更好地去扩展的解决方案。从另一个方面来讲,FPGA则不受这些问题的影响,因为它对于数据包的处理是通过通道的形式来实现的,这个通道就是去处理净通量,大概是每个时钟周期一个数据包,时钟周期的频率是300Hz,这对于FPGA来说不费吹灰之力,所以它的净产出大概每秒3亿个数据包,这对于200G以太网来说已经绰绰有余了。
如果想进一步扩展性能,就可以使用多个通道。对于云服务提供商来说,真正重要的是它的功耗性能,也就是每瓦功耗能够达到的性能。赛灵思数据中心事业部产品及平台营销副总裁Donna Yasay表示:“在同样的功耗水平上,FPGA所能处理的数据包的数量是SoC的四倍,单位功耗性能比SoC优越十倍。再有,FPGA是动态可重配置的,无需重置卡上的FPGA就可以升级现有的功能或者动态地增加新功能。”
Donna Yasay,赛灵思数据中心事业部产品及平台营销副总裁
Alveo U25 SmartNIC适配器可以支持两个25G以太网的端口,它的封装尺寸非常紧凑,可以完美地适配任何云服务供应商,并支持PCle Gen3。这个SmartNIC还支持所有的即卸开箱即用的特性,比如隧道卸载、校验、TCP片断卸载、RSS、SR-IOV等等,所有这些功能都被装载到平台上,相关驱动也是一应俱全。
除了标准驱动以外,Alveo U25 SmartNIC也支持Onload技术,这是由Solarflare通讯公司开发的技术,这家公司也是赛灵思新进收购的一家企业。Onload技术可以不经过内核直接把数据包送到用户空间,这种传输方式可以降低时延,与经过内核的方案相比,时延可以减低80%。另外,它还支持时间戳、存储处理,FPGA有ZYNQ级的器件,有超过50万个LUT,另外还有一个嵌入式内核——A53处理器单元,可以做控制层处理,还搭载了6G DDR4 SDRAM,可用于表的查询和其他功能。另外,这张卡还支持所有标准的操作系统。
Alveo U25所面对的最终用户非常广泛,但赛灵思真正要关注的是那些云服务提供商。
软件对于FPGA来说非常重要,此外,更重要的是生态系统,目前,赛灵思正在多个维度做这些事情。包括OEM、ISV。Alveo系列刚问世的时候,赛灵思就希望能够多维度地帮助客户,包括提升计算能力,提供存储加速能力,提供网络加速能力,在不同加速和计算能力上,包括带宽在内,都有一些不同的产品发布。
目前,赛灵思已经在向一些关键客户发送样片了,量产预计在今年的第三季度。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2245期内容,欢迎关注。
『
半导体第一垂直媒体
』
实时 专业 原创 深度
识别二维码
,回复下方关键词,阅读更多
“芯”系疫情
|ISSCC 2020
|国产芯片
|半导体股价
|
存储
|
Chiplet|氮化镓|高通|华为
回复
投稿
,看《如何成为“半导体行业观察”的一员 》
回复
搜索
,还能轻松找到其他你感兴趣的文章!
责任编辑:Sophie