[原创] 从提供IP到量产芯片,这家AI新贵策略转变背后的逻辑
业内知名媒体EE Times每年都会举办“Silicon 60”评选活动,选出全球最值得关注的60家半导体新创公司。统计显示,今年选出来的“Silicon 60”企业以机器学习为主流,共有15家相关企业入选,与去年七月相比大幅提升,这从侧面反映了近年来AI产业的流行。
值得一提的是,总部设在美国加利福尼亚州的企业出现在榜单中的频率越来越高,今年更是有29家之多,当中大多与人工智能芯片有关,其中有一家企业更是首次入选——那就是由加州大学洛杉矶分校电子工程系博士刘峻诚创立的耐能(Kneron)。
耐能科技的创始人兼CEO刘峻诚
资料显示,该公司2015年创立于美国圣地亚哥,是终端人工智能解决方案的领导厂商,提供软硬件整合的解决方案,包括终端设备专用的神经网络处理器(Neural Processing Unit,NPU)以及各种图像识别软件。依赖于其高能耗的产品,耐能已经也与格力和搜狗等多家大厂达成了长期合作。公司更是在推出了两代IP产品之后,谋划于明年推出ASIC芯片,进一步深耕人工智能应用市场。
为了让大家对这家人工智能新贵有更深入的了解,半导体行业观察记者日前采访了耐能的创始人兼CEO刘峻诚,给大家带来他对公司和行业的最新见解。
实力雄厚团队缔造的人工智能IP新贵
过去几年深度学习算法准确率的提升,推动了整个人工智能应用的兴旺,巨大的市场容量吸引了大量的创业者投身其中。尤其是在边缘终端AI芯片方面,更是百花齐放,百家争鸣。但这些企业做边缘端AI芯片,只有两个途径可供选择,那就是自研人工智能IP,或者授权第三方的NPU IP,而耐能在创业初期就是从NPU IP切入,也是当中的一个佼佼者。
今年年初,该公司推出的第一代NPU IP在市场获得了高度认可。但锐意创新的耐能马不停蹄,在短短的半年之后,就带来了其第二代终端人工智能处理器系列NPU IP ——KDP Series。当中包括了超低功耗版KDP 320、标准版KDP 520、高效能版KDP 720等三大产品,全系列产品的功耗低于0.5瓦(W),采用新的架构设计让计算更具弹性,整体效能相较于上一代产品大幅提升达3倍,峰值吞吐量(Peak Throughput)最高更是可以达到5.8TOPS(每秒万亿次计算)。
耐能的第二代NPU核心技术
刘峻诚表示,耐能新一代NPU产品在诸多方面取得显著的突破,基于第一代产品的优势,改善数据计算流程、提升整体计算效能与储存资源使用率,同时针对不同的神经网络模型进行优化,让NPU可以更广泛地应用在各种终端设备,并满足更复杂的计算需求。新的IP的出现,也让耐能在11月初正式推出支付等级3D AI软硬件一体化解决方案,进入新一个高增长的市场。
耐能的NPU产品线
在问到如何在群雄并立的AI芯片市场站稳脚跟,并且在短短半年间就可以做到产品更新的时候,刘峻诚告诉半导体行业观察的记者,这首先依赖于其实力雄厚的技术团队。
“耐能的核心团队成员都有很强的技术背景,来自加州大学洛杉矶分校、圣地亚哥分校以及普渡大学、北京清华大学、台湾大学、新竹清华大学等名校,而且长期任职于高通、英特尔、三星、博通、IBM、贝尔实验室等国际大厂,在AI、计算机视觉和图像处理领域的工作经验平均超过10年。同时,公司在自主原创的人工智能算法、神经网络软件、硬件核心设计等领域,已在4个国家共申请了近20项专利。”,刘峻诚说。
其次,耐能在圣地亚哥、台北、深圳、珠海都设有办公室,布局两大洲四个城市。这也加速了他们的崛起。刘峻诚指出,美国和中国大陆的AI技术更新迅速、市场庞大,台湾能提供从设计、封装到测试都很齐全的供应链,这就使耐能的产品可以快速落地并交付给客户。
第三,耐能起步早,和不少大厂都有长期合作,从中获取了大量训练数据,加上耐能自主开发的算法,可以针对不同需求调整功能。
在团队和产品的双重影响下,耐能于2017年11月完成A轮融资,包含阿里巴巴创业者基金、中华开发资本国际、奇景光电、高通、中科创达、红杉资本的子基金Cloudatlas以及创业邦。2018年5月31日,耐能又获得了由李嘉诚旗下维港投资领投的A+轮融资,累计融资金额超过3300万美元。
“现在,耐能正在进行新一轮融资,近期便将向外界公布。”,刘峻诚强调。相信其聚焦市场的容量,对耐能吸引投资产生了重要的推动作用。
聚焦三大市场让AI无处不在
刘峻诚告诉半导体行业观察的记者,耐能产品主要应用于智能手机、智能家居与智能安防等三大领域。当中的应用场景包括了智能手机、智能门锁、智能家电、智能监控摄像机、门禁系统、无人机、新零售、智能玩具等。公司的客户、合作伙伴也包括了格力、搜狗、奇景光电等厂商。
能同时覆盖这三个市场巨大的市场,耐能各具特性的的超低功耗、标准和高效能的三大产品线布局是根本:
首先看其低功耗版的KDP 320。从刘峻诚的介绍我们得知的,这个包含计算与静态随机存取内存(SRAM)的处理器功耗不到5mW,能够应用到低功耗智能终端和手机等领域,而手机3D面部识别应用就是其一个重要的应用方向。据了解,依靠于耐能的这个方案,可进行3D结构光与来自双镜头的立体图像识别分析,让真人面部识别更快速精准;
其次,再看标准版的KDP 520,这个处理器的计算能力可达481GOPS (500MHz) (每秒十亿次计算),功耗也是仅有100mW。可进行快速实时、大规模的面部、手势、身体识别与分析以及深度学习,是智能家居和安防市场的不二选择。
第三,高效能版的KDP 700信息吞吐量可高达5.8TOPS(1GHz) (每秒万亿次计算),功耗为300~500mW。这样优异的计算能力,让它能处理更进阶与复杂的人工智能计算,以及深度学习推理应用,能够满足高端智能手机、机器人、无人机和更高端的安防需求。
在这三大系列IP的加持下,耐能于今年11月举办的2018腾讯全球合作伙伴大会上带来了支付等级的3D AI软硬件一体化解决方案。
众所周知,近年来,由于智能手机和安防等应用的推动,人脸识别的应用越来越广泛。国际权威市场洞察报告gen market insights在其名为《全球人脸识别设备市场研究报告》的报告中指出,全球的人脸识别市场将从2017的10.7亿美元上升到2025年的71.1亿美元,并在此期间以每年26.8%的增量不断提升。耐能的方案就是为了解决这个问题而来的。
据介绍,这套方案能够采用商业化等级的CNN(Convolutional Neural Network , 卷积神经网络)模型,适配于主流的CNN网络,以及2D、3D视觉应用与音频应用。同时,拥有领先的模型压缩技术,支持无损、有损压缩,并与硬件设计协同工作,可减少模型尺寸和计算成本。能够满足结构光、ToF和双目视觉等多种硬件方案下的多种识别需求。
“依托超低功耗、拥有全球领先算力的耐能KDP系列AI芯片IP加持,耐能3D AI软硬件一体化解决方案在智能手机、智能安防、智能家居、新零售、工业智联网等领域均有不俗表现。我们现在也已经与多家国际大厂展开合作,预计将在2019年 Q2 大规模量产。”刘俊诚强调,并进一步指出,“耐能将持续专注终端AI领域,提供客制化的、软硬件整合的解决方案,以AI赋能终端设备,让AI无处不在。在产品形态上,近期将对NPU产品进行持续升级,推出更高算力、更低功耗、更小体积的产品,以降低AI应用门槛与客户开发成本。长期来看,则将从视觉识别延伸至语音识别、人脑模拟等领域,在更长的产品线上为客户创造价值。”
在10月的北京安博会上,奇景光电推出了基于结构光技术的3D传感解决方案,该方案采用的便是耐能的人脸识别算法。而在12月中旬,据台湾媒体报道,钰创科技、钰立微电子宣布推出基于耐能NPU IP的ToF方案。至于双目视觉方案,据悉在2018腾讯全球合作伙伴大会上也已展出,不过相关厂商的名称尚未公开,对此,刘峻诚的回复是“基于保密义务,暂不便说明。”
携手业内领先IP供应商探索未来的无限可能
除了持续推出领先的人工智能IP外,耐能还联手业内领先处理器IP和机器视觉IP供应商,探索更多的可能。
今年12月初,耐能宣布,将结合耐能针对终端设备所设计的神经网络处理器(Neural Processing Unit , NPU)与新思科技(Synopsys )ARC®处理器,推出低功耗AI IP解决方案。双方将共同展开进一步的合作推广计划,携手拓展市场,以加速终端人工智能的开发与应用。
行内的人都知道,除了其领先的EDA工具好之外,新思科技在IP方面的表现也非常出色。而ARC®处理器IP则是其中的一个代表。从他们的官网我们可以看到,新思科技的 DesignWare® ARC® 处理器是 32 位 CPU,经 SoC 设计人员的优化,可满足各种不同用途的需求,从各类细分市场深度嵌入式应用到高性能主机应用,不一而足。设计人员可利用可综合来定制各个 ARC 核实例,使产品各不相同,以满足特定性能、功耗和面积的要求。ARC®处理器还具有可延展性,可让设计人员添加自己的定制指令,从而大大提高性能。 全球已有超过 225 家客户使用新思科技ARC®处理器,这些客户每年总共产出 19 多亿块基于 ARC®处理器IP的芯片。双方的强强联合必能给终端应用带来无限可能。
刘峻诚也表示:“结合耐能NPU 低功耗、体积小的特性与新思科技ARC®处理器的优异性能,协助客户采用终端人工智能解决方案的进度。低功耗AI IP解决方案可应用于智能家居、3D人脸解锁以及对能耗和空间有高度要求的物联网设备,且能满足复杂的计算需求。”
与另一家IP供应商Cadence(楷登电子)的合作,进一步拓展了耐能产品的应用范围。在谈双方搞的合作之前,我们要先介绍一下Cadence的可定制处理器(Xtensa)。
业内知名专家唐杉曾在其一篇文章中提到,Cadence Tensilica的可定制处理器(Xtensa)主要有两方面的定制性:第一、可配置性(Configurability):从指令集,微结构,接口等方面都提供一些可配置的选项。你可以通过菜单选择的方式定制适合你自己应用的处理器;第二、可扩展性(Extensibility):使用Tensilica Instruction Extension (TIE)的方法,增加你自己的指令,寄存器,寄存器堆等等。你可以使用和verilog类似的TIE语言来描述自己的datapath单元的功能,而相应的RTL代码和工具链则自动生成。Cadence的Tensilica Vision P6 DSP则是双方这次合作的一个重点。
据介绍,这个DSP是以Cadence Tensilica Xtensa架构为基础,结合灵活硬件选项与丰富图像、视觉DSP功能,以及众多来自既有生态系统合作伙伴的图像、视觉应用程序,该软件环境提供包括对1700多个基于OpenCV的视觉和OpenVX™1.1库函数的完整与优化的支持,并全面支持Tensilica广大的其他应用软件、模拟、晶圆与服务等合作伙伴生态系统。
在刘峻诚看来,这个DSP结合耐能低能耗、高计算力的人工智能处理器NPU IP KDP 720,可以满足他们创新图像应用的需求。通过采用此整合性方案,芯片厂商能够轻松地与主机处理器整合,加速SoC的开发进度,为新兴的智能设备开发更丰富的视觉功能。
而在此前,耐能还与智原科技(Faraday)、晶心科技(Andes)、创意电子(GUC)等头部IP厂商达成合作,从而构建起汇聚国际一众头部IP厂商的供应链。在业内诸多NPU厂商中,这样的供应商阵容已足够亮眼。
对于系统厂做终端AI芯片的看法
由于芯片的开发越来越简单,终端客户的客制化需求也越来越高,这就驱使很多终端系统厂走上自研AI芯片之路,甚至有些厂商连人工智能NPU IP也都自主研发,这就从某种程度上压逼了IP供应商和芯片供应商的生存空间。华为在今年10月举办华为2018全联接大会上推出了其两款采用自主研发加速器IP的AI芯片Ascend 910和Ascend 310,就引发了媒体对其相关供应商的生存大讨论。
在问到这个问题的时候,刘峻诚告诉半导体行业观察的记者:“各界厂商争相涌入,表明AI的发展成果和前景正得到日益广泛的认可。耐能乐见AI芯片市场持续壮大,并期待和友商一起推动产业进步。同时,不同厂商的产品方向与应用领域各异,彼此形成既竞争又合作的关系。在AI产业从野蛮生长向精细发展过渡的阶段,这种竞合关系将加速产业洗牌,投机者将被淘汰,深耕细分市场的企业则有望异军突起。”
“耐能专注终端AI领域,面向智能手机、智能家居与职能安防等市场提供软硬件整合的方案,包括终端设备专用的NPU、IP、算法等,并与多家国际大厂展开业务层面的合作。相信只要找准并坚守自身的方向,不仅可在未来的AI芯片市场占据一席之地,与这些科技巨头或互联网公司也有合作空间。”,刘峻诚进一步指出。
为了满足客户的多样化需求,除了持续推出高能效的NPU IP和软件算法外,耐能将触角伸到了芯片侧。整体的宗旨就是奉行“客制化”策略,根据客户需求提供定制化的产品与解决方案。其间,除了客户的公司实力与供应链整合能力,其主导产品与行业特点无疑也是驱动耐能提供何种产品或解决方案的重要因素。
“具体来看,针对智能手机、智能安防领域,由于下游市场已高度成熟、品牌集中度较高,芯片厂商到终端厂商均具有很强的供应链整合能力,客户的需求主要是IP,因此耐能也定位为IP提供方。而在智能家居市场,竞争格局比较开放,客户对IP和芯片的需求都大量存在,单一的IP或芯片并不能满足,耐能便决定IP和芯片并举”,刘峻诚说。
微软全球执行副总裁、全球电脑视觉和图形学研究领域的专家沈向洋在早前接受《彭博商业周刊》采访的时候说到,人工智能的寒冬一定会再来。在这种环境下,如何能适应市场需求推出更多的产品,如何更方便地解决用户真正的需求,是现在遍地开花的AI芯片创业公司需要考虑的问题。
而耐能已经看到了这点,并跨出了重要一步。