深入讲解Spectrum-4以太网平台如何构成Omniverse数字孪生骨干网络
2022-07-18
11:58:17
来源: 互联网
点击
现在数据中心数据流量呈现指数级增长,并且要求数据中心的基础设施提供极致的性能、高级安全、强大功能来实现大规模的高性能、虚拟化和模拟仿真。“数字孪生”成为当下炙手可热的焦点话题,在这样的背景下,英伟达在今年的GTC大会上发布了Spectrum-4网络平台,来应对基于Omniverse数字孪生应用场景的需求,本文将重点讲述Spectrum-4以太网网络平台是如何构成Omniverse数字孪生骨干网络的。
什么是数字孪生?
在讲解Spectrum-4平台之前,首先让我们来了解下,什么是数字孪生?真正的数字孪生实际上是一个实物世界的现实翻版,从更大规模的角度看,数字孪生是与物理世界相连的一个虚拟世界,真正的数字孪生必须满足四大特征:
1.物理上有准确性和真实性,必须遵循物理的定律;
2.不间断的与物理世界进行同步,基本上实现即见即所得的同步体验;
3.精准的运行时间,在多个计算节点上实现同步;
4.包括多种多个自制系统,各种各样的系统来支撑数字孪生技术。
虚拟世界对下一代人工智能起着至关重要的作用。NVIDIA从创建之初就致力于虚拟世界的模拟,包括游戏与计算机图形方面的技术。多年来,随着互连的虚拟世界的持续推动下一代人工智能工作负载的持续发展,NVIDIA从工业和工程的角度来重新审视虚拟世界,从而构建了Omniverse,创建和模拟与现实世界无法区分的虚拟世界平台,为实现数字孪生模型铺平了道路,并广泛应用于机器人仿真、数据科学建模、5G应用、自动驾驶汽车、智能工厂和气候研究等等新的应用领域。
Omniverse数字孪生是对工业资产、流程或环境的大规模精确模拟,具有多个与现实世界数据流完美同步的自治系统,Omniverse可以支持多个同步自制系统。例如宝马集团借助Omniverse构建未来工厂时,在没有开工建设,没有真正机器设备安装调试的情况下,通过在数字孪生环境中构建整条生产线,包括生产流程、机器臂自动化的配置等功能,就可以在虚拟环境里预先实现工厂所有的设计和匹配,在虚拟化的数字孪生环境中发现一些流程上的问题和风险,使得产线最终达到优化的状态。
但是要实现宝马未来工厂这种比较完美的数字孪生的应用场景,就需要利用NVIDIA加速计算的全部力量。这其中包括OVX服务器,NVIDIA OVX是为了支持数据中心规模、物理精确的工业数字孪生的模拟而设计。第一代的OVX服务器由8颗NVIDIA A40 RTX GPU和3块 ConnectX-6 Dx 200Gbps网卡组成,其中还包括两个至强CPU、1TB系统内存和16T NVMe存储,这使得NVIDIA OVX的SuperPOD能够在工厂、城市或世界范围构建实时性的数字孪生系统。而OVX服务器的背后离不开Spectrum网络平台的支持。
Spectrum-4是数字孪生的骨干网络
在今年春季GTC大会上发布的Spectrum-4以太网网络平台,其实不仅仅是一个交换机产品,它在第二代的OVX SuperPOD中,将会在云和边缘数据中心更全面的支持Omniverse数字孪生,成为Omniverse计算系统的骨干网络。
整体来看,Spectrum-4网络平台,实际上是一个完整的体系,它是以Spectrum-4以太网交换机为核心,可以通过ConnectX-7智能网卡和NVIDIA BlueField DPU,以及相关软件构成一个计算系统,有效将NVIDIA DGX、EGX、HGX、OVX计算系统进行连接,并提供网络和基础设施上的支持。在Spectrum-4交换机上会有一个强大的交换芯片,这是NVIDIA自研的Spectrum ASIC,它可以提供强大的高性能交换能力,在这个交换能力上有NVIDIA CUMULUS或SONIC网络操作系统来支持交换机的管理和配置,提供更好的开放的平台。还提供了NVIDIA NetQ和NVIDIA AIR网络管理工具以及一些运维部署的工具,方便客户在上面构建自己的网络平台。
所以Spectrum-4网络平台能提供四大方面的功能:一是加速,它提供了一流的硬件性能和云规模的软件效率;二是创新,在交换芯片设计上优化了云、人工智能、存储工作负载;三是优化,能以更低的TC O和更高的ROI来更快部署网络;四是可靠,实现公平性、可预测性和可见性的功能。
Spectrum-4网络平台的价值是,它可以和NVIDIA推出的OVX、EGX、HGX这些计算系统形成很好的整体加速计算系统解决方案,通过以太网的方式进行连接,提供现代数据中心工作负载所需的精确定时、强大的安全性、低延时、自适应路由和复杂的拥塞控制机制,来满足相关的计算系统对网络的要求。
Spectrum-4网络平台的四大支柱
接下来让我们细分来看下Spectrum-4网络平台内部究竟是怎么支持数字孪生的。
首先从硬件上来看,Spectrum-4交换机是一个400Gbps交换机,可以提供51.2Tbps交换带宽,12.8Tbps线速加密,37.6Bpps包转发速率。这是非常先进的交换ASIC芯片,里面有千亿晶体管集成,采用台积电4N芯片制程。这台交换机提供64个800Gbps端口,一般做网络连接时会把端口一分为二,所以它可以提供高达128个400Gbps端口,在Spectrum S5000系列交换机上可以提供非常高的端口密度。
与上一代的Spectrum交换机产品相比,Spectrum-4交换机的网络带宽提升4倍,安全加密性能提升3倍,由于Spectrum-4的端口密度比较高,另外它提供的端口数量比较多,一台交换机可以替代上一代大概12台的交换机组成的网络。在这种替代关系下,以及它自身的ASIC芯片制程,会使其在能源消耗上减少40%。
所以,Spectrum-4 400Gbps交换机,除了提供更高的吞吐量、更好的服务质量、更高安全性、更低功耗和成本外,还能实现纳秒级的计时精度,将带来5-6个数量级的提升,它的时间精准度会大幅提升,对整个在OVX SuperPOD或多个SuperPOD组成的数字孪生计算系统架构提供一个更精准的、实时性更高的数字孪生基础设施。
该交换机还有三大特性:一是由传统的等价路由转变成了自适应路由,使用自适应路由后,可以使整体网络性能提升15%;二是高效网络大规模加速Omniverse,使用Spectrum-4简化128节点OVX SuperPOD连接,1台Spectrum-4实现了过去12台交换机的网络,使用的交换机更少,更加节省空间,也更易于管理,更绿色节能,还能实现3倍的低延迟;三是Spectrum一流的加密功能,在Spectrum的交换机中,可以实现VXLANSec基于MACsec技术的加密技术。
除了Spectrum-4交换机之外,另一个很重要的部分是ConnectX-7智能网卡,它是从10G到400G多种速率的以太网网卡。ConnectX-7上的ASAP2技术,可以在不消耗主机CPU的条件下提供线速性能;还可提供TLS、IPsec和MACsec在线加密/解密功能来硬件加速安全;同时,可以通过RoCE和GPUDirect存储实现高性能存储和数据访问来加速NVMe-oF;并为未来数据中心应用程序和时间敏感型基础设施提供极其准确的时间同步。
再然后是NVIDIA BlueField-3 DPU,BlueField-3是业内首款400G DPU,与上一代产品比较它的带宽增加了2倍,ARM CPU核的算力提升4倍,IPSec加密性能提升4倍,存储读写性能提升2倍,所以它是一套很完善的片上系统,集成了全新的ConnectX-7智能网卡和一个16核的ARM A78内核,同时,在这颗芯片里还集成DDR5内存控制器和PCIe第五代交换机,有二层到四层网络加密以及专用的加速引擎。所以,这些专用的加速引擎可以用于网络、存储、安全和管理服务,为机器学习、人工智能、高性能计算这些负载提供硬件加速。
在这三大硬件组件基础上还有NVIDIA Cumulus Linux,SONiC网络操作系统,以及DOCA软件框架,这些硬件和软件共同组成了Spectrum-4端到端400Gbps以太网网络平台。NVIDIA收购了Mellanox和CUMULUS Networks之后,组成了NVIDIA网络的新平台。从底层芯片、底层系统、网络操作系统、网络协议、再到网络服务,NVIDIA将基于开放的标准赋能用户。此外,DOCA可以作为数据中心基础设施加速应用程序开发的平台,让客户和合作伙伴在上面做大规模云原生应用程序的开发,进一步发挥BlueField DPU在数据中心基础设施上的巨大作用。
写在最后
当前Spectrum-4网络平台的售卖对象,主要是大规模云计算的客户,或者是企业有人工智能应用部署的客户,还有要用模拟仿真、数字孪生等相关的客户。NVIDIA OVX计算系统会在今年晚些时候通过浪潮、联想、SUPERMICR来提供,这是英伟达在春季GTC上发布的第一代的OVX计算系统。
Spectrum-4以太网网络平台作为Omniverse数字孪生的骨干网络,将在虚拟世界中发挥出巨大的作用。英伟达也正在开启一个区别于传统以太网的新的网络时代。
责任编辑:sophie
- 半导体行业观察
- 摩尔芯闻