[原创] 为了帮助客户与高通和英伟达竞争,GPU大厂出新招

2018-12-12 14:00:11 来源: 半导体行业观察

一年前,Canyon Bridge收购了Imagination,这使得该公司在财务上稳健了很多,Imagination销售和市场营销执行副总裁David McBrien表示,我们的母公司Canyon Bridge会持续推高我们的研发水平,对一家IP公司来说,要想在市场竞争中领先,持续的投入是非常重要的。因此,我们很开心Canyon Bridge收购我们,此外,未来我们在中国的投入也会非常大。

关于竞争,David McBrien表示,移动应用是我们的主要市场,我们的目标是帮助客户跟高通在GPU上竞争,因此,要确保合作伙伴得到SoC的最佳性能,要想实现这一点,除了GPU IP之外,软件和固件也要有绝佳的性能,因此,我们在研发人员数量上会持续投入,包括我们的现场应用工程师,从而实现以最专业的态度服务我们的客户。

图:Imagination销售和市场营销执行副总裁David McBrien

Imagination最强的产品线是PowerVR GPU,其在手机市场呼风唤雨了多年。随着应用的发展和市场的变化,特别是手机市场的疲软,以及汽车电子和AI的兴起,使得IP厂商必须调整发展策略,以应对各种挑战。目前来看,该公司的PowerVR IP系列主要分为两部分:PowerVR GPU和PowerVR视觉和AI。

近期,Imagination推出了新的GPU、视觉和AI IP,分别是神经网络加速器PowerVR Series3NX,以及第九代(Series9)GPU系列。

神经网络加速器PowerVR Series 3NX

面向人工智能(AI)应用的神经网络加速器(NNA)PowerVR Series3NX,是在该公司去年推出的2NX基础上更新的产品。据悉,新版Series3NX提供了更强的可扩展性,使SoC制造商能够针对汽车、移动设备、智能视频监控和物联网边缘设备等一系列嵌入式市场去优化计算能力和性能。

据Imagination视觉和人工智能产品管理高级总监Neal Forse介绍,2NX是该公司第一代神经网络加速器,已有两个中国手机厂商和其签了约,国内一家主营汽车芯片厂商也选择了该公司的NNA产品。在国际厂商方面,瑞萨电子和德州仪器是Imagination的长期合作伙伴,特别是在汽车电子应用领域,还在不断加强、加深合作。手机和汽车行业是该公司重点关注的两个市场,3NX可以进一步加强和巩固其在移动和汽车行业的市场地位,进一步提升市场份额。

图:Imagination视觉和人工智能产品管理高级总监Neal Forse

据悉,单个Series 3NX内核的性能涵盖0.6~10万亿次操作/秒(TOPS),同时其多核实现可扩展到160TOPS以上。得益于包括无损压缩等在内的技术,Series3NX的性能可在相同的芯片面积上较上一代产品提升40%,使SoC制造商可在性能效率方面提高近60%,且带宽需求降低了35%。

作为Series3NX架构的一部分,Imagination还发布了PowerVR Series3NX-F(Flexible),以提供功能性和灵活性平衡,采用Series3NX-F的客户可以通过OpenCL来实现差异化设计。

为了迎合快速发展的市场,新的PowerVR工具也进行了多项扩展,从而能够最优化地去映射新兴的网络模型、提供灵活性和性能优化。通过使用该公司的专用深度神经网络(DNN)API,开发人员可以针对Series3NX架构以及现有PowerVR GPU编写人工智能应用程序。该API可以在多种SoC配置上工作,以便在现有设备上完成原型设计。

据Neal Forse介绍,之前2NX有两个IP核,现在的3NX有5个新的NNA核。最高达4K MAC/clk,算力可达10TOPS/s,这是单核的能力。这样的能力是通过功耗和性能方面的改进实现的,和上一代相比,它的每秒推理次数提升了70%,每平方毫米每秒的推理次数提升了40%,和上一版相比是非常大的提升。同时,每平方毫米带宽降低了35%的,系统带宽降低35%的幅度是非常大的。新特性还包括无损压缩,先进的安全使能,还有很重要的一点,就是可编程的扩展性,这让客户可以进行差异化设计。

内核方面,3NX系列是基于之前2NX的,2NX的系列里面有AX2145(1TOPS的算力)和AX2185(4.1TOPS),而3NX增加了AX3145内核,算力是1.2TOPS,还增加了一个AX3385,是5TOPS的,这两个新核在面积和性能两个维度都进行了改善,通过核的架构优化实现。此外,还有新的内核补充,一共有5个,用于低端的核算力是0.6TOPS,非常适用于功率和性能有局限的设计,这是非常重要的。中档的核是AX3365,算力是2.4TOPS,在高端部分有单核AX3595,算力可以达到10TOPS,这些算力都是单核提供的能力,通过组合还能提供更高的算力。

该公司也提供多核方案,把10TOPS算力的单核AX3595采取多核重用的方式,最高算力达到160TOPS,Neal Forse介绍,我们很多客户要求有这样的能力,要求有这样的密度。我们挑战的是160TOPS,不光是算力,还要管理和优化核之间的带宽。

与2NX相比,3NX在安全方面也有提升,客户能够在半导体层面建立原生的安全性。

3NX-F中的F代表灵活性。3NX-F把高效运算NNA的网络结合在一起,其内嵌了NNPU神经网络处理单元。这个单元是基于GPU的,但又不仅仅是GPU,通过在功耗和面积方面进行优化,利用该公司在这个领域20多年的经验积累,针对NNA加速器对GPU进行了优化。

增加可编程的扩展性可以优化硬件。当然这不是免费的。Neal Forse表示,我们要增加可编程的可扩展性,有两方面的原因:一是让客户做差异化设计,在单核上做差异化,利用IP核构建NNA,而不是把第三方的GPU整合在一起。在竞争激烈的市场,差异化是非常重要的,我们客户可以用他们喜欢的内核构建SoC。二是现在神经网络发展渐入佳境,PowerVR过去几年进入了该市场,也有些新的技术、新的神经网络、新的框架不断进入该市场。可编程的扩展性可以让客户面向未来设计SoC,可以构建一个Open CL的内核,允许将来把现在还不知道的东西结合在一起,这是非常好的架构设计,和这个行业的发展趋势是密切相关的。

目前,市场上有多种不同架构的神经网络产品,开始进入竞争阶段,对此,Neal Forse表示,每家厂商的起点不同,大家有不同的历史传承,有些竞争对手可能用可编程架构、DSP做神经网络方案,再加上指令级。我们的想法是考虑现在和未来业务的发展方向,我们的做法是通过计算优化的方案实现,通过最优的计算引擎来把神经网络映射到硬件上。所以我们的优化是来自线下的编译,而不是在线的执行。

在客户拓展方面,Imagination副总裁兼中国区总经理刘国军(James Liu)表示,大概有10个客户计划采用我们的NNA,目前正处于评估阶段。这些客户有的做监控、移动手机、物联网,有的应用很有趣,如在健身仪器上可能会用到一些对人体的测试和监控,大部分和图像相关。我们NNA的下一步要延展生态线,特别是汽车电子应用这块,原来的汽车电子大部分是后装的,而今后的发展会有所不同,本地的汽车芯片要进入前装市场,进入车厂的车规里面,因此,我们正在筹划本地汽车电子的生态建设工作,把我们的GPU和NNA放到车规的生态里。

图:Imagination副总裁兼中国区总经理刘国军(James Liu)

更新三款GPU

除了用于AI的NNA之外,Imagination还推出了其第九代(Series9)GPU系列新品PowerVR 9XEP、9XMP和9XTP。这三款Series9 GPU覆盖了从入门级到高端市场,并结合了效率的改进和新功能。

PowerVR Series9XEP基于Rogue架构,该内核延续了这一类别PowerVR GPU的单位面积填充率优势。具有PVRIC4视觉无损压缩功能,以便确保带宽和内存占用的降低,从而以最低的系统成本为用户提供GUI、人机界面(HMI)和休闲游戏方面的最佳用户体验。其目标系统产品包括机顶盒、数字电视、低成本移动设备、中档汽车仪表盘和车载信息娱乐系统(IVI)。

9XMP计算密度(GFLOPS/mm2)比9XEP显著提高,主要针对中端移动设备、机顶盒和数字电视应用,可提供很好的计算和游戏体验,并为在 GPU上实现人工智能和神经网络处理提供了基础。

9XTP基于Furian架构开发,属于该系列的高端产品,显著提高了游戏/计算密度,并在整体设计上有更全面的功耗/性能/面积(PPA)的优化,使其成为高端移动设备和高端车载信息娱乐系统,以及跨计算/服务器细分市场应用的理想选择。

PowerVR Series9采用了PVRIC4技术,这是Imagination的新一代图像压缩技术,可实现随机访问视觉无损图像压缩,确保了带宽和内存占用率至少节省50%,并使系统能够克服性能带宽限制。与上一代GPU相比,新的GPU系列提供了更强的PPA和时序优化。

PowerVR Series9可以与PowerVR Series3NX神经网络加速器配对使用,利用GPU来管理经典的视觉和预处理算法,并使用Series3NX来实现高度优化的定点神经网络处理。另外,在最近发布的PowerVR汽车技术包中的多项优化可以应用于所有PowerVR Series9内核。

在软件工具方面,Imagination为开发人员提供了免费获得跨平台PowerVR SDK的服务,该SDK可支持3D图形应用开发的所有方面,并提供了可简化3D图形和GPU计算应用开发的工具和实用程序。

用于新GPU的Physical Design Optimisation Kits(DOKs)设计优化工具包括优化的参考设计流程、来自于合作伙伴经过调整优化的逻辑库、特性标定数据和文档,这些灵活的优化工具能优化客户设计的PPA。

帮助客户应对高通和英伟达

目前,市场上做GPU IP的公司并不多,除了Imagination之外,就是高通和Arm了,而高通的业务模式又与Imagination、Arm有所不同,它既向Arm购买IP,也自行研发GPU的IP,主要用于自家的手机处理器SoC。Imagination公司PowerVR图形处理商务运营副总裁Graham Deacon表示,我们在这个行业是做得最好的,我们就是要帮助客户和高通竞争。

在汽车芯片方面,英伟达利用其强大的GPU性能,占据了市场先机。对此,Neal Forse表示,英伟达机器学习做得很好,他们是开源的,我们的模式跟他们不一样,在客户支持方面我们做得更好。关于机器学习,我们的相关技术和产品公开发布情况还未确定。总体来讲,英伟达强在机器学习上,我们强在推算能力上。

Imagination公司PowerVR产品管理和技术营销高级总监Kristof Beets补充说:“英伟达是一家很成功的GPU公司,在汽车行业他们做的都是高端应用,但是往中低端走的并不顺利,特别是在芯片的面积和功耗方面,降下来比较难。我们一直在跟德州仪器和瑞萨合作,可以提供比较全的方案,从低端、中端到高端,有不同的填充率,在GPU方面和英伟达差不多,加上我们的神经网络加速器,我们的解决方案可以覆盖得更全面。”

责任编辑:Sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论