芯原戴伟进:大模型时代,边缘计算的机遇与挑战

2024-06-13 19:03:20 来源: 互联网
6月13日,在2024上海嵌入式展embedded world China期间,芯原同期举办AI专题技术研讨会。
 
大会现场,芯原执行副总裁、IP事业部总经理戴伟进带来主题演讲:《大模型推动边缘计算变革的机遇与挑战》。他指出,在AGI大模型时代,大模型正在来到边缘设备,随着模型工具&自主化的需求,一系列突破性的技术正在涌现。
 

芯原执行副总裁、IP事业部总经理戴伟进
 
在将大模型人工智能模型引入嵌入式系统的过程中,大模型将率先在手机、AIPC、汽车等边缘设备上实现规模化落地。
 
近年来,随着OpenAI发布具有突破性的Sora视频生成模型、谷歌宣布推出视频生成模型 Veo、Google 推出全新的 Project Astra 项目,AIPC、AI手机等最新技术的呈现,以及具身智能机器人、AR等技术的涌现,AGI正在迎来蓬勃发展。
 
在此趋势下,由于生成式人工智能在全球各行各业的重要性日益提高,在全球企业纷纷布局生成式AI大趋势刺激下,AI芯片成为重中之重。AI芯片的发展为硬件终端提供算力支撑,从而更好的运行端侧AI大模型。
 
芯原一家依托自主半导体IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业,布局已久。
 
在芯原独有的芯片设计平台即服务(SiPaaS)经营模式下,通过基于公司自主半导体IP搭建的技术平台,芯原可在短时间内打造出从定义到测试封装完成的半导体产品,为包含Fabless、IDM、系统厂商、大型互联网公司和云服务提供商在内的各种客户提供高效经济的半导体产品替代解决方案。
 
戴伟进介绍,芯原神经网络处理器 (NPU) 已在全球累积出货超过1亿颗,广泛应用于AIoT/智慧家居、AR/VR、自动驾驶、PC、智能手机、监控、数据中心、可穿戴设备、智慧医疗、机器人等诸多领域,已被72家客户用于其128款人工智能芯片中。
 
据介绍,芯原的NPU IP拥有全球领先的性能,从测试中看到,可以在2秒以下处理20步Stable diffusion 1.5,LLaMA2 7B则达到了20 Tokens/s。
 
据悉,芯原的NPU IP是高性能的AI处理器IP,采用了低功耗、可编程和可扩展的架构设计。它可以灵活配置,以满足客户对芯片尺寸和功耗的不同要求,使之成为具有成本效益的神经网络加速引擎。该IP还配备了广泛且成熟的软件开发工具包(SDK),支持所有主流的深度学习框架,以确保客户产品能够快速投放市场。
 
在GPU领域,芯原耕耘嵌入式市场近20年,拥有70项国内外专利,已成功与NXP、TI、ST等芯片巨头建立紧密合作关系,应用在头部车企的近千万辆汽车。截至目前,芯原GPU已在全球累积出货近20亿颗。
 

芯原GPU应用于发展历程
 
芯原GPU得到了各种广泛的应用,其核心技术在于图形运算及渲染、 3D 建模、2D或 3D图形加速等图形处理,适用于大型并行运算应用,以及云游戏、大型桌面游戏。
 
在视频处理器(VPU)方面,芯原已经达到全球领先水平,该产品能够利用AI赋能智能视频处理,实现预测性视频质量优化,专用视频处理单元,可以实现高密度、超低时延流媒体,同时具备成本效益规模,帮助视频协作、云游戏以及交互式流媒体不断加速。
 
从每种芯片来看,2023年全年,在芯原IP授权业务收入中 (包括知识产权授权使用费、特许权使用费) ,图形处理器GPU IP,神经网络处理器NPU IP和视频处理器VPU IP收入合计占比约72%。
 
综合来看,芯原拥有多种芯片定制解决方案,包括高清视频、高清音频及语音、车载娱乐系统处理器、视频监控、物联网连接、智慧可穿戴、高端应用处理器、视频转码加速、智能像素处理等;此外,芯原还拥有6类自主可控的处理器IP,分别为图形处理器IP、神经网络处理器IP、视频处理器IP、数字信号处理器IP、图像信号处理器IP和显示处理器IP,以及1500多个数模混合IP和射频IP。
 
其中值得关注的是,芯原AI-Computing IP产品覆盖数据中心、边缘服务器、嵌入式设备三个场景,包括VIP9X00 NPU IP、CC8X00 GPGPU IP、GC9X00AI NPU+GPU IP、CCTC-MP Tensor Core GPU IP。
 

 
戴伟进表示,芯原AI计算软件框架针对图形、通用GPU、AI三大方向进行了优化,结合芯原的Acuity工具包,这款强大的IP支持含PyTorch、ONNX和TensorFlow在内的所有主流框架。
 

芯原 AI-Computing软件框架
 
回顾芯原公司发展历程,2001年芯原在上海成立,总部位于中国上海,在中国和美国设有7个设计研发中心,全球共有11个销售和客户支持办事处,目前员工已超过1800人。
 
芯原创始人、董事长兼总裁戴伟民在2024上海嵌入式展embedded world China的开幕式上表示,目前芯原的半导体IP授权业务销售收入达到全球第七,在中国则达到第一,知识产权授权使用费收入全球第五,IP种类全球第二。
 
随着AI技术的快速演进,我们已经达到了类似人类的推理水平,为智能助手的发展提供了坚实的技术基础。芯原正利用自有的高效AI计算能力,以及在超过数亿颗AI类芯片中的部署经验,为嵌入式设备和边缘设备带来服务器级别的AIGC功能,为AI时代助力赋能。

责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论