RISC-V在数据中心的机会

2023-08-28 15:16:10 来源: 互联网
苏州库瀚信息科技有限公司系统工程副总裁刘亚南先生在今年天举办的滴水湖论坛中直言,据其观察,目前很多从业者对于RISC-V的印象还是停留在MCU或者是比较终端的这种产品领域。
 
但在他对整个数据中心领域的需求和趋势以及RISC-V的发展现状分析以后,可以看到RISC-V在数据中心领域有了需求。据他所说,这与目前整个数据中心的趋势是在一切以CPU为核心朝DSA领域方向去进化的趋势有着莫大的关系。
 

苏州库瀚信息科技有限公司系统工程副总裁刘亚南
 
刘亚南表示,以AIGC代表的新型数字经济,点燃了数据中心新一轮军备竞赛。同时摩尔定律放缓,内存墙、IO墙、功耗墙,短期内行无法彻底解决。这就驱使数据中心从一切以CPU为核心,逐步走向DSA异构化。
 
“换而言之,未来的服务器架构理念是Less Is More。”刘亚南说。他进一步指出,微服务和云原生带来了Serverless;高性能和低CPU开销网络,则带来了Diskless;SoC片内总线和DC网络融合,让MemLess成为可能(如:CHL Fabric),DC as a Computer也更近一步。
 
基于这样的见解,库瀚用RISC-V打造了三种不同的产品,搭建了公司的系统,以应对未来的发展需求。
 
据介绍,库瀚科技是一家AI智算中心数据密集型芯片及解决方案提供商,聚焦于存储和网络关键数据路径。从企业级SSD主控(Aurora)、存储和网络IO聚合芯片(eSPU)、到基础固软件平台(Kstor)。公司致力于国产全RISC-V架构的芯片和软硬件融合新,打造低碳、高效能数据中心IaaS基础设施。公司的核心团队源于芯片和云计算头部厂商,深耕数据中心基础设施多年,在存储和网络方向、具备从架构、芯片到软件解决方案的全建制班底和产业经验,这让公司拥有了打造了极具竞争力产品和系统的底气。
 
刘亚南接着说,在公司系统的“控制面”,会提供一些拥有大核和小核的Hybrid产品,这主要是为了支持在这个部分跑类似FDX(软件定义存储)这样的软件栈;在“数据面”,则首先会在前端网络提供400G总带宽,做一些Packet Buffer和Protocol Engine处理。
 
除了上述的“控制面”和“数据面”以外,库瀚科技还提供了NoC,公司同时还提供了一些加速引擎和一些外设。其中,加速引擎有针对存储的一些EC的卸载引擎和加载面相关的引擎,外设则包括:SSD、GPU、DDR5和一些国产的AI。
 
刘亚南总结说,从产品层面看,库瀚科技布局了存储服务器、Diskless和AI Hub。其中,在SDS存储服务器形态方面,通过公司设计的一颗eSPU芯片,可以替代CPU(x86 / ARM)、PCIe Switch、RDMA网卡,网络与存储数据面直通,大幅度降低TCO、提升能效比;来到Diskless方面,公司提供的无缝对接开源框架(DPDK)和分布式存储生态(DAOS / Ceph / 伙伴SDS)能够实现迁移最小化、效益最大化。“无状态x86节点,负责存储协议解析(块/文件/对象等)、数据服务、空间和Cache管理等。eSPU存储节点,则承载全局FTL、硬化EC、数据缩减等数据面功能。”刘亚南接着说。
 
至于AI Hub方面,刘亚南表示,公司的eSPU AI服务器形态,能够以一颗eSPU芯片,替代PCIe Switch、高性能网卡,大幅度降低国产AI服务器的IO成本(网络和存储)。同时,PCIe Switch和RDMA高性能网络,通过eSPU片上Non Blocking网络,实现Data Plane数据直通,避免CPU参与的DMA两次搬运,提升有效数据带宽和能效比。
 
刘亚南透露,公司目前第一阶段Aurora企业级SSD已经流片了,该产品采用了RISC-V,PCle Gen5,Journel方案和ZNS引擎设计。eSPU1.0里面则则集成了存储+网络。至于公司的第三颗芯片则是eSPU2.0,会升级到支持PCle Gen6。
 
“除此之外,库瀚科技还有一些AI Hub方案落地,国产新型存储和DB存储引擎。”刘亚南说。
 
 
 
 

责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论