解读英特尔人工智能战略

2022-07-20 17:27:40 来源: 李寿鹏
芯片巨头英特尔发力人工智能这已经不是什么秘闻了,但和大多数人工智能公司只专注于一种硬件不一样,英特尔正在凭借其天生优势,探索一条不同寻常的道路。
 
正如该公司执行副总裁,数据中心与人工智能事业部总经理Sandra Rivera所说:“英特尔的战略与众不同。我们充分利用自身广泛的硬件产品组合,将其与我们的开放式软件生态系统相结合,为任何客户和任何负载提供解决方案。”
 
据了解,除了一贯领先的至强处理器以外,包括GPU、FPGA、eASIC、Habana Gaudi2以及IPU在内的硬件是英特尔面向人工智能的基础,将其与统一的软件堆栈搭配,便使得芯片老牌巨头成为了新兴市场不容忽视的重要角色。
 
 
在与媒体交流的时候,Sandra Rivera首先指出,AI的发展日新月异,但就AI的采用情况而言,这个行业仍处于起步阶段。“就在前些年,AI只是尝试去识别一些照片中的猫和狗。现在,它正处于彻底改变各行各业的风口浪尖。然而,AI既困难又复杂。这正是英特尔AI软件关注的焦点。”Sandra Rivera告诉记者。在他看来,AI更是一个多角度、多层次的工作负载。
 
从AI工作原理上看,其一开始的流程是数据导入,在这个阶段,开发者往往采取的是至强CPU;之后就进入训练环节,在这个过程当中有几个选择,不仅可以使用具备AI功能的CPU,如果需要图形方面的能力和一定的AI能力,也可以使用GPU。除此之外,还可以选择AI加速器, 因为AI加速器可以充分利用深度学习上的强大性能;到了最后的阶段是进行推理以及部署,而市场上2/3的人工智能推理是在至强平台上进行的。
 
基于这样的行业现状,英特尔选择了上述的广泛硬件和统一软件的人工智能战略。为了更好地服务客户,英特尔也一如既往地升级其软硬件。
 
首先在CPU方面,英特尔带来了最新的第四代至强可扩展处理器平台—Sapphire Rapids,这是一个高度创新的平台,有着多种的创新,能通过DDR5、PCIe 5.0和全新Compute Express Link高速互连的标准技术引领整个行业向下一代内存和接口标准过渡。
 
Sandra Rivera指出,“除了内存和IO方面的全新进展之外,我们还在其上建立了大量的集成加速器,当中包括为AI优化、加密优化以及为数据处理等进行优化的加速器,这也是全球的OEM、ODM以及CSP都愿意应用Sapphire Rapids的原因。” 
 
其次,英特尔旗下的Habana Gaudi 2深度学习处理器也在最近测评中展现了其杰出的能力。这是公司于2019年收购的以色列半导体公司Habana Labs所推出的产品。
 
据AI行业公认的MLPerf基准测试最近披露的数据显示,较之竞争对手,英特尔在今年发布的Gaudi2处理器在视觉(ResNet-50)和语言(BERT)模型上的训练时间都呈现出了不小的优势。其在缩短训练时间(TTT)方面相较第一代Gaudi也有了显著提升。
 
如图所示,Habana Labs于2022年5月提交的Gaudi2处理器在视觉和语言模型训练时间上已超越英伟达A100-80G的MLPerf测试结果。其中,针对视觉模型ResNet-50,Gaudi2处理器的TTT结果相较英伟达A100-80GB缩短了36%,相较戴尔提交的同样针对ResNet-50和BERT模型、采用8个加速器的A100-40GB服务器,Gaudi2的TTT测试结果则缩短了45%。
 
 
 
英特尔进一步指出,相比于第一代Gaudi处理器,Gaudi2在ResNet-50模型的训练吞吐量提高了3倍,BERT模型的训练吞吐量提高了4.7倍。这些归因于制程工艺从16纳米提升至7纳米、Tensor处理器内核数量增加了三倍、增加GEMM引擎算力、封装的高带宽存储容量提升了三倍、SRAM带宽提升以及容量增加一倍。对于视觉处理模型的训练,Gaudi2处理器集成了媒体处理引擎,能够独立完成包括AI训练所需的数据增强和压缩图像的预处理。

 
在CPU和加速器以外,前文提到的FPGA、IPU和GPU也是英特尔AI“武器库”的重要组成。Sandra Rivera也指出,这些覆盖广泛的硬件,是英特尔和客户合作的底气。这与英特尔的软件结合后,就给AI应用提供了一个难以拒绝的选择。
 
“硬件只是英特尔解决方案的一部分,软件更是我们AI战略的关键组成部分,因此我们在AI策略上始终秉持‘软件优先’的理念面向AI开发者打造开放的软件堆栈。我们的AI软件战略也能为当前和未来几年的人工智能注入活力。”Sandra Rivera强调。
 
据介绍,英特尔的“软件优先”包括安全的AI软件组件,即让用户能够利用至强处理器的独特软件和安全功能。如通过英特尔软件防护扩展(英特尔 SGX)进行机密计算,可以保护使用中的关键数据和软件。此外,英特尔还花费数年时间为CPU优化最流行的开源框架和函数库,并开发了BigDL 2.0和OpenVino。
 
值得注意的是,现阶段面对海量数据,金融机构需要采用更加安全和高效的隐私计算方案。基于此,英特尔与中国银联携手,通过英特尔 SGX 和BigDL,验证了基于 TEE 的联邦学习与实时预测方案。该方案在保障多方端到端数据安全的前提下,进一步扩展了AI模型训练与推理的数据规模,大幅提升联邦学习的训练和推理速度,有助于更多类型的数据集在AI场景中更安全地释放其潜能。
 
Sandra Rivera也表示,英特尔始终认为相比封闭、专有的解决方案,开放的生态系统能释放创新能力,因此,他们一致致力于打造成熟的生态系统吸引更多客户。
 
“在AI工作负载上,Sapphire Rapids的性能提升,这其中很大一部分是来自于软件的,我们将会继续充分利用制程、技术以及架构的优势,在此基础上叠加软件,未来将会有很多通过软件来实现10倍、20倍、30倍的性能扩展和提升。”Sandra Rivera举例说。
 
她同时指出,对于客户来说,他们更关注的是如何将技术整合到一起从而形成合力,以实现更快的AI部署和更高效的业务。这其中的关键不在于寻找单一的解决方案,而是对AI技术进行有机结合,从而帮助企业实现商业目标。而英特尔则是那个最能为客户提供完整解决方案的公司。
 
在与媒体的交流中Sandra Rivera也直言,虽然AI芯片在当前整个芯片市场中相对份额较小,但增长十分迅猛。面对更快、更高效的AI计算需求正在不断增长的趋势,英特尔一方面重整AI战略,更加强调软件在计算架构体系内的重要作用,并在软件和开源生态社区方面进行了大规模投入(例如,它将为客户提供软件包,使客户既能够使用通用AI芯片处理工作,也可以将部分任务交给擅长图像识别或其他工作的专业芯片);同时,英特尔更加强调执行力和推出产品的节奏,为客户提供具有吸引力的产品。
 
“从整个人工智能流程来看,无论是数据的导入、训练、推理,到最后的部署都存在着大量的市场机会,而英特尔拥有完全的能力,已经做好了充分准备去利用这些机会。”Sandra Rivera说。
 
责任编辑:sophie
半导体行业观察
摩尔芯闻

热门评论