CCF 2022:DPU评测技术白皮书发布【附白皮书下载】
由中国计算机学会(CCF)主办的首届“2022年中国计算机学会芯片大会”于2022年7月29日至31日在南京盛大举行。其中在7月30日下午,国内DPU设计研发领军企业中科驭数牵头组织了主题为“DPU技术趋势和应用”的分论坛,在本分论坛上,中科驭数联合多家企业和机构隆重发布了DPU评测技术白皮书,旨在为行业建立一个公平的DPU的评价体系。
DPU技术评测白皮书重磅发布
中科驭数作为国内DPU研发的领军企业,此前已经牵头完成了行业第一部DPU技术白皮书,并牵头了新一代计算标准工作委员会的DPU专题工作组,为DPU的标准化做出了重要贡献。此次发布DPU评测白皮书将对行业的评估体系带来了深远的意义。
我们知道,芯片评测通行的评价维度是PPA,即性能(Performance)、功耗(Power)、面积(Area),这三个维度可以用于比较同类芯片产品的优劣。然而,这个评价维度适用的前提是芯片要“同类”,例如,基于X86或ARM 指令集的服务器级CPU;或者即便不属于同一类指令集,但至少是级别相近的CPU,并且可以运行同类操作系统。对于不同类别的芯片,PPA的比较没有实际意义。
DPU(Data Processing Unit)是最近几年新发展起来的一种专用处理器,以数据为中心,采用软件定义技术路线支撑基础设施层资源虚拟化、存储、安全、服务质量管理等基础设施层服务,被称之为数据中心继CPU和GPU之后的“第三颗主力芯片”。
DPU的出现是异构计算的一个阶段性标志,与GPU的发展类似,DPU是应用驱动的体系结构设计的又一典型案例,但与GPU不同的是,DPU面向的应用更加底层,类型也更多样。DPU要解决的核心问题在于计算、网络、存储的解耦,为“专用化”创造了条件,进而提升整个计算系统的效率、降低整体系统的总体拥有成本(TCO)。DPU的出现是体系结构朝着专用化的路线发展的又一个里程碑。
因此,DPU这几年的发展欣欣向荣,诞生了不少发力在DPU芯片领域的初创企业。但现有不同厂商的DPU从功能角度来看,存在较大差异。虽然都笼统属于DPU大类,但是否属于“同类”仍有待商榷。这必然导致性能评价的维度各有侧重,呈现多元化,给建立一个公平的DPU的评价体系带来了较大的挑战。
面对这样的评估挑战,由中科院计算所、中科驭数联合主编,处理器芯片全国重点实验室、CCF集成电路设计专委、中国计量测试学会集成电路测试专委联合编写发布了 《专用数据处理器(DPU)性能基准评测方法与实现》 技术白皮书。
DPU评测技术白皮书内容主要包括七大目录:
一、DPU性能评测导论
二、DPU性能评测系统框架与测试流程
三、面向网络的基准评测
四、面向存储的基准评测
五、面向计算的基准评测
六、面向安全的基准评测
七、总结
本白皮书针对现阶段DPU产品的功能定义,充分考虑DPU使用环境等的差异性,试图为未来DPU产品建立一套公平、开放、全面、客观的DPU评测体系。一方面为DPU用户提供参考,一方面也为未来DPU产品的标准化提供引导。
行业专家对DPU技术趋势的探讨
本次论坛邀请了中科院计算所计算机体系结构国重实验室常务副主任李晓维、浪潮异构加速前沿创新团队负责人阚宏伟、NVIDIA网络亚太区高级总监宋庆春、天翼云弹性计算产品总监孙晓宁、天翼云资深研发专家刘禄仁、百度基础架构部杰出架构师、太行DPU研发负责人王富、中国移动研究院基础所未来网络室主任李志强、中国移动研究院网络与IT技术研究所研究员班有容、华泰证券信息技术部自营技术平台架构团队负责人佘鹏飞等近10余位嘉宾,共同探讨DPU技术趋势和产业应用。
浪潮异构加速前沿创新团队负责人阚宏伟表示,下一代处理器及其计算架构变革己成共识,“第三块主力芯片”势如破竹。以DPU为代表的各种xPU芯片,在网络/存储侧布局各种计算引擎卸载分流系统负载,把其纳入计算架构的基本I/O范畴研究布局,摆脱了以CPU为中心的传统模式,使计算通路更加畅通高效。分布式xPU芯片及其高密度池化服务器是平衡系统芯片制程依赖、功耗、算力、效能,让数据每一跳都产生更多价值的有效途径。并希望能看到更多的基于开源定制的xPU FPGA软硬件全栈平台来搭起学术界-产业界的桥梁,共同探索“互连+池化+多擎独立〞 的下一代并行XPU计算架构。
天翼云科技的孙晓宁和刘禄仁发表了《DPU在天翼云的过去、现在和未来》的主题演讲。天翼云是全球公有云市场排名前十的唯一央企。目前,天翼云位居全球运营商云业务规模榜首,中国政务(公有云)市场第一、混合云市场第一。2021年,天翼云业务收入279亿,在网客户数量超过200万。目前天翼云已经推出了基于DPU 1.0的弹性裸金属产品。
中科院计算所博士研究生、RDMA技术专家、中科驭数的廖云坤介绍了DPU诞生的契机,以及中科驭数在DPU方面的进展。他介绍到,中科驭数提出了以“软件定义加速器”为核心技术路线的SDA计算架构KPU,解决了专用处理器设计碎片化的问题,KPU架构具有软件定义可配置、低设计成本、计算高效的优势。还推出了DPU软件开发平台HADOS,HADOS是支撑DPU硬件平台的专用软件框架,具有良好的生态兼容能力和丰富的开发维护工具,所支持的业务类型丰富,能大幅降低应用软件开发难度。此外,还自主研发了网络卸载引擎NOE和数据计算卸载引擎DOE。
中国移动研究院基础所未来网络室主任李志强作了《面向算网一体的未来网络发展展望》的主题演讲。李志强指出,当下经济社会加速进入数智化时代,在数智化时代就需要强大算力支撑,通过网络基础设施和算力基础设施的深度融合,实现新型算网协同调度。算网一体作为算力网络的目标阶段,将引发计算和网络学科交叉融合,可能会产生大量原始创新技术,促进两大领域创新突破以及一体化发展,他接着指出,这其中更多的创新是IP未来网络的创新,并期待业界共同探索,合力推进。
英伟达网络亚太区高级总监宋庆春讲述了《利用DPU打造云原生超级计算架构》的主题。他首先指出,传统的计算平台计算在CPU和GPU上,CPU运行业务并管理基础设施操作。而基于云原生超级计算架构的计算平台的原理是,数据在哪里,计算就在哪里,网络成为计算单元,由DPU卸载基础设施操作,存储成为了新的计算单元。云原生超级计算架构实现了计算和通信平台的统一,并能利用网络计算技术解决了通信的一些瓶颈,如时延、网络拥塞等。他强调到,DPU将在云原生超级计算技术中起到很大的加速作用,并介绍了利用英伟达DPU加速HPC和AI业务性能。
百度杰出研发架构师、太行DPU研发负责人王富接着进行了《面向云原生时代下的太行DPU架构思考》的主题分享。他认为,云之于芯片来说,云计算半封闭是条芯片发展的高速路;而DPU对于云而言,DPU已经成为云计算的核心组件,头部CSP自研DPU的目的主要是解决数据中心管理以及虚拟化的局限性,并保持其产品的优势。百度在DPU上的研发已有2-3年,其产品是太行DPU,太行DPU的发展和规划路径包括1.0、2.0和3.0。太行DPU产品的特点主要是,自研引擎、软硬一体化架构、虚拟化全卸载降低损耗、前后端一体化发展。最后,总结DPU的发展历程,从Standard NIC-SmartNIC-CloudNIC,到未来可能的CNIOE概念(Cloud Native IO Engine);同时也提了未来DPU几种可能表现形态:ASIC/异构芯片、eAISC/FPGA、AISC+FPGA。
中国移动研究院网络所项目经理班有容作了《DPU在算力网络中的研究与探索》的演讲,演讲中指出DPU是算力网络算力基础设施关键技术,针对DPU技术体系不完善的问题,提出了软硬件标准化的初步建议。在DPU软件方面,建议从管理、网络、存储、计算、安全五大系统展开功能和接口标准化定义。在DPU服务器硬件方面,针对服务器引入DPU需要定制设计的关键点进行标准化,引导服务器完成超前设计,突破新技术规模应用瓶颈。
2022年CCF大会相关介绍
本次大会由中科院计算所孙凝晖院士、中科院微电子所刘明院士担任大会主席,CCF容错专委主任韩银和、CCF信息存储专委主任舒继武、CCF体系结构专委主任武成岗担任程序主席,CCF集成电路设计专委秘书长李华伟、东南大学时龙兴担任组委会主席。
大会还邀请到中国工程院院士吴汉明、中国科学院院士崔铁军、中国工程院院士廖湘科、清华/北大双聘教授魏少军、北京华大九天科技股份有限公司董事长刘伟平、中芯国际联合首席执行官及执行董事赵海军、中科院计算所研究员及龙芯公司董事长胡伟武等重磅嘉宾出席并发表主旨演讲。
大会集结全国计算机、微电子、电子信息等学科领域从事芯片相关的研究与技术开发的专家学者、研究人员,分享技术研发经验与合作需求,促进产学研合作,为国内外科研机构、高校、企业搭建最广阔、最深入的学术交流平台。
附:
后台回复 “DPU评测技术白皮书” 可下载《专用数据处理器(DPU)性能基准评测方法与实现》技术白皮书。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3117内容,欢迎关注。
推荐阅读
半导体行业观察
『 半导体第一垂直媒体 』
实时 专业 原创 深度
识别二维码 ,回复下方关键词,阅读更多
晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装
回复
投稿
,看《如何成为“半导体行业观察”的一员 》
回复 搜索 ,还能轻松找到其他你感兴趣的文章!
- 半导体行业观察
- 摩尔芯闻