高生态壁垒下,RISC-V+AI是必然趋势

2024-08-19 11:22:32 来源: 互联网
8月19日,第四届滴水湖中国RISC-V产业论坛(简称“滴水湖论坛”)在上海滴水湖洲际酒店盛大召开。

北京大学讲席教授;RISC-V国际基金会人工智能与机器学习专委会主席谢涛在“万物智联时代的RISC-V+AI之路”的主题分享中表示,在国外AI算力软件生态壁垒高筑的背景下,相比于英伟达,国产AI芯片除性能差距外,软件生态差距更大。英伟达的成功不仅仅在于其芯片,更在于其软件栈 CUDA的成功。英伟达已累计为CUDA生态投入120亿美元。自2020年以来,CUDA开发者数量从180万激增至450万,增长了150%。


除CUDA外,其他AI算力软件生态呈小、散、弱局面。其中,国产AI芯片软件生态投入严重不足、碎片化,不具备核心竞争力。谢涛表示,国内高端AI芯片企业达40余家,软件栈层面各自为战,无法形成合力,整体市场份额不足10%。


在此形势下,建立高水平自立自强的计算技术新体系,借鉴Android震撼iOS生态的模式来震撼CUDA生态,成为业内努力的关键方向。

针对如何建立高水平自立自强的计算技术新体系,谢涛指出了三种模式:
  • A体系(“高铁模式”):我国信息化的主流平台被X86、ARM生态所占领,海光、海思等国产处理器的道路强调“全兼容”——“离了你,我不行”
  • B体系(“北斗模式”):强调“全自主”,以龙芯和申威为代表,因为不跟市场主流兼容,所以生态弱——“离了你,我勉强行”
  • C体系(“5G模式” ):走“全开放”的道路,全世界一起来建生态,谁也不控制谁,谁也不能卡谁,比如RISC-V—— “你中有我、我中有你”

简单理解,A体系就是加入CUDA阵营,研发永远处于“跟随”状态,被人牵着鼻子走,难以绕过的大量专利,只能靠开源的编译器规避诉讼,虽然容易获得客户,但是反而加强了CUDA生态。

B体系属于自定义编程语言(华为昇腾/寒武纪等),成本高昂:各公司需维护一整套软件工程团队,积累数十年研发投入;人才稀缺:系统软件、编程语言、编译器人才稀缺;力量分散:各公司各自为战,难以形成有效合力与CUDA抗衡。

谢涛强调,基于RISC-V构建AI算力是必然趋势,也是全球共识。并指出了RISC-V AI芯片的两种主要模式:
  • Integrated模式(紧耦合)适合低功耗领域(RISC-V + AI):以 CPU主干为骨架,集成在CPU内部,共享PC(program counter)、寄存器堆等 流水线单元;只是在执行单元部分增加了矩阵或向量单元。
  • Attached 模式(松耦合)适合大算力领域(AI + RISC-V):外挂在 CPU上的,会有自己独立的流水线、寄存器堆、缓存等。它是“协处理器”,它可以接收来自一个或多个CPU的指令;异步地执行不同CPU提交过来的任务。

据介绍,基于RISC-V构建AI算力存在诸多优势:
  • 开放与灵活性:AI工作负载变化快,需要特定的优化才能达到最佳性能;RISC-V开放免费的特性为芯片设计者提供了极大的灵活性,可以根据具体需求定制AI加速器。
  • 高度可扩展性:RISC-V的指令集精简且高度可扩展;设计者可以根据需要添加自定义指令集扩展,以增强AI计算的性能和效率。例如,可以增加向量扩展或其他专用于AI的指令集,从而提升计算速度和能效。
  • 功耗和效率优势:RISC-V架构通过简洁设计和定制化扩展,可实现高效的能量使用;RISC-V架构能够通过小型且高效的处理单元,减少等待数据传输的时间,提升整体计算效率。
  • 生态系统和社区支持:RISC-V生态的多样性和开放性吸引了全球大量开发者和企业加入,为RISC-V的发展提供了强大的推动力和丰富的软 件及IP资源,在RISC-V+AI领域具备了良好的发展前景。

同时,谢涛还指出了我国RISC-V+AI生态机遇与挑战并存:


应对挑战,需要自下而上、从端到云、工具创新等整体思路方面的布局:
  • 自上而下:以RISC-V AI指令集扩展(推动成RISC-V国际基金会标准)+ 开源系统软件栈为公共开源根去利用国际开放/开源社区去长叶(基于开源根的商业软件/芯片),形成“根技术开源”与“叶技术竞争”的技术生态布局。
  • 从端到云:聚焦边缘/终端侧(多样性、碎片化且大数量算力场景,比如智能终端、AI PC等)来推动软件生态的发展与应用,以带动云上的软件生态。
  • 工具创新:依托日益强大的RISC-V软硬件生态去聚焦全球开源工具创新。

同时,还要聚焦“国际标准+开源社区”两手抓的策略。

以推动RISC-V国际标准为抓手到国际借力

把握“根技术”,从我国领军企业共识出发,快速布局新时代的新市场(智能终端、AI PC等), 以推动国际基金会标准来依托上游国际开源社区来贡献系统软件栈。推动RISC-V+AI国际标准是手段,最终目的是系统软件栈。

以共建国际开源软件生态为抓手到国际借力

贡献到方兴未艾的国际开源软件生态(Triton/SYCL),发展处中国强技术;国际标准:RISC-V AI扩展指令 + 开源软件/芯片:Triton,SYCL,RISC-V AI芯片IP

谢涛表示,为应对这些挑战,未来的整体思路应是自下而上推进技术标准和开源系统软件栈的建设,以形成“根技术开源”与“叶技术竞争”的生态布局。同时,应聚焦边缘计算与终端侧的应用场景,推动软件生态的发展,并通过工具创新,依托RISC-V软硬件生态,积极参与国际开源工具的开发。

在国际舞台上,通过推动RISC-V国际标准的制定,依托上游国际开源社区,中国企业可以迅速布局新时代的新市场,特别是在智能终端和AI PC等领域。此外,共建国际开源软件生态,探索和制定新的标准,如Triton和SYCL,这些新兴技术将为RISC-V生态的发展提供坚实的基础。

Triton和SYCL作为替代CUDA的潜在解决方案,展示了RISC-V在全球范围内构建AI系统的潜力。Triton作为硬件无关的中间层表示,允许各硬件厂商基于Triton进行硬件相关的算子优化,实现对上层AI框架的高效支持。SYCL则作为开放架构的代表,通过社区驱动的发展模式,避免了授权问题,使得技术发展不再被少数公司垄断。

在未来的发展中,RISC-V+AI的生态系统将通过推动国际标准和共建开源社区的双重手段,逐步壮大并与现有的AI计算生态形成有力的竞争。在这一过程中,中国将发挥关键作用,通过共建、共创,推动RISC-V在全球AI计算领域的广泛应用,助力全球科技的可持续发展。

谢涛表示,RISC-V+AI算力生态委员会(RISC-V+AI Computility Ecosystem, RACE)正在通过执行委员会、秘书处和产业咨询委员会共同推进其工作。秘书处(开芯院)由邵恩和高明晋担任正、副秘书长,负责协助执行委员会的落实施工。产业咨询委员会则在孟建熠的领导下,为决策提供建议。RACE的组织架构还包括专项工作组和项目协调组,两者协同工作推动各项任务的开展。目前,RACE的工作组已有28家企业和16家高校科研院所参与,涵盖了Matrix、Tensor、GPGPU、存算一体、系统软件栈等领域。RACE委员会欢迎更多机构的加入,共同建设RISC-V+AI生态。
责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论