[原创] 国产GPU奋起直追,芯动科技一马当先
全球GPU市场长期被英特尔、英伟达、AMD等国外三巨头垄断,国产高性能GPU一直未见起色。
在自主可控需求及国产替代浪潮之下,近年来有不少公司开始涉足GPU领域,也吸引着越来越多资本的涌入。然而,只听雷声响,未见雨下来,阵阵喧闹过后,市场上仍未见可与国际巨头对标的量产产品。
谁能横枪勒马,打破格局,人们翘首以盼……
国产GPU涌动
当前,在5G数据中心、云游戏,以及云宇宙等热门应用的推动下,GPU领域的市场空间正在快速增长,市场潜力巨大。结合市场趋势、行业格局以及不稳定的国际贸易关系等多重因素,国内越来越多的企业开始在GPU市场布局。
国产GPU突破
对于“风华1号”GPU性能,芯动科技云计算总裁敖海进行了介绍:
芯动科技云计算总裁敖海
-
“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS; -
3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体,AI性能为25TOPS(INT8); -
芯片支持32路SR-IOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全; -
显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps。显存带宽最高可达304GB/s,显存容量最大可扩展至16GB; -
主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8,支持OpenGL4.0; -
视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。
-
Innolink Chiplet技术
值得关注的是,“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术。芯动科技GDDR6X研发负责人高专表示,Innolink Chiplet技术是芯动科技推出的国产标准封装技术,将不同功能不同工艺制造的小芯片进行模块化封装,成为一个异构集成芯片。
简单来说,Chiplet技术就是像搭积木一样,把一些预先生产好的能实现特定功能的芯片裸片(die)通过先进的集成技术集成封装在一起,形成一个系统芯片(SoC)。从这个意义上来说,Chiplet就是一个新的IP复用模式。
芯动科技可以为多种场景的Chiplet提供接口解决方案,Innolink A/B/C三种互连选项满足不同芯片的需求,具有高度可编程性和灵活性,可实现高达1.5Tbps以上的带宽,同时保持信号完整性和低延迟。
芯动科技Innolink IP(图源:现场拍摄)
在风华GPU里面用的是InnolinkB的技术,InnolinkB基于GDDR6技术,可以兼容一些传统封装,实现芯片到芯片间的互联,可以做到低延时、小面积。通过Innolink Chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍,渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。
基于Chiplet的模块化设计方法,用先进封装的方式将不同功能“芯片模块”封装在一起,可以跳过流片快速定制出一个符合应用需求的芯片,芯片的交付过程也被进一步加快。
据了解,Innolink方案不只是用在GPU上,芯动科技也授权给了合作伙伴和客户,通过复用芯动科技的国产Innolink Chiplet技术,能够快速便捷地实现多die、多芯片之间的互连,有效简化了设计流程。作为中国半导体IP和芯片定制的一站式生态赋能型领军企业,芯动科技希望将该技术推广出去,让它为中国的集成电路、芯片产业的崛起做出贡献。
-
业界最先进显存GDDR6X
此外,“风华1号”搭载的GDDR6X也是目前最为先进的显存,英伟达的RTX3090和RTX3080搭载的显存就是美光独家供货的GDDR6X显存,目前全球只有英伟达和芯动科技两家拥有。
芯动科技GDDR6X研发负责人高专
据介绍,GDDR6/6X速度是DRR4/LPDDR4最高速度的5倍,这在GPU领域意味着内存带宽性能的碾压。新显存的优势体现在两个方面,一是显存容量可扩展至16GB,二是速度高达21Gbps。
“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比。” 高专强调,“GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来; 而芯动团队是全球唯一一家仅凭有限的远程技术支持,只用一年时间就做出来了的公司,这一点连AMD都还没有做到,所以美光的架构师都不禁感叹我们的研发实力之强”。
-
GPU虚拟化技术
除了采用全球顶尖的GDDR6X高带宽显存技术和Chiplet等前沿技术之外,虚拟化技术也是“风华1号”GPU的一大亮点。
据介绍,虚拟化方面,“风华1号”是一个支持虚拟化云服务的GPU,能支持32路的720P,并且目前采用的是超低功耗的设计,在现有架构上还有非常多的创新空间,更进一步地扩大算力。硬件虚拟化和可延展性给用户在未来进行类似于对安全性很高的应用场景,通过加密并且不断地延展在特定场所的计算能力和渲染能力方面,提供非常大的优势。
虚拟化技术能够把GPU虚拟成多个可以独立工作的GPU,支持多路计算的场景,同时给多个用户使用。 芯动科技SoC体系架构师何颖表示:“该技术适用于云服务领域,因为在云服务里面很可能是很多客户一起在一个服务器上跑,这个时候如果是一个GPU服务一个客户的话,实际上满足不了需求。因为GPU本身的性能比较强,用来满足一个客户的需求的话性能会有冗余,这个时候虚拟化就是把这个GPU变成多个虚拟的GPU,每个虚拟GPU服务每个客户。当然这里面涉及到很多东西,要做到每个客户之间采用的资源是互相隔离的,包括他们用的显存、计算资源、编解码资源等全部都要虚拟化起来,使得每个客户能够用得很流畅。”
芯动科技SoC体系架构师何颖
英伟达和AMD在GPU虚拟化的路上走的比较慢,即使提供虚拟化的方案,好像它不太支持灵活的虚拟化。对此,芯动科技工程副总毛鸣明指出, 虚拟化除了技术方面有很大的瓶颈,它还有一个商业的原因。 GPU虚拟化是一个类似于内卷的技术,因为GPU虚拟化之后,卖的显卡数量就会减少,因此对于显卡巨头来说没有太大的动力去支持其快速推进虚拟化技术,或者哪怕支持也会收取特别昂贵的费用。因此,这也属于芯动科技的一个差异化优势,国产GPU本身也是一个要走向国际市场的产品,面对巨头竞争要走差异化路线。
国产GPU生态如何突围?
风华GPU芯片的发布才是刚刚开始,后面更重要的问题是产品要如何实现规模化商用,国产GPU生态又该如何突围?
写在最后
“风华1号”目前正在跟合作伙伴进行适配调优,今年年底之前开始进行商业化的试用和适配,在这个过程中不断地总结和提升产品的核心竞争优势。
必须正视的是,现在的GPU市场已经略显浮躁,很多初创公司通过竞相融资来“秀肌肉”,像极了通过比拼烧钱来争胜负的互联网公司。其实优秀的硬件产品本身是有利润的,像英伟达和AMD的利润都非常高。每一个硬件公司、芯片公司,只有保持良性正循环,不断通过一个胜利来赢得下一个胜利,这才是真正优秀公司的特质。通过烧钱,迟早会烧出越来越大的窟窿。
记者在采访中了解到,芯动多年来一直是持续盈利的企业。虽然在不断投入重大新项目,但是财务管理非常健康,不仅不需要通过融资来烧钱,反而可以通过自身强大造血能力确保供应链安全。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第2880内容,欢迎关注。
推荐阅读
半导体行业观察
『 半导体第一垂直媒体 』
实时 专业 原创 深度
识别二维码 ,回复下方关键词,阅读更多
晶圆|集成电路|设备 |汽车芯片|存储|台积电|AI|封装
回复
投稿
,看《如何成为“半导体行业观察”的一员 》
回复 搜索 ,还能轻松找到其他你感兴趣的文章!
- 半导体行业观察
- 摩尔芯闻
最新新闻
热门文章 本日 七天 本月
- 1 复杂SoC芯片设计中有哪些挑战?
- 2 进迭时空完成A+轮数亿元融资 加速RISC-V AI CPU产品迭代
- 3 探索智慧实践,洞见AI未来!星宸科技2024开发者大会暨产品发布会成功举办
- 4 MediaTek 发布天玑 8400 移动芯片,开启高阶智能手机全大核计算时代