英特尔的AI战略:算力很重要,但不是全部
2023-12-07
14:16:02
来源: 互联网
点击
尽管近一年来大模型的热度居高不下,但AI并不是一项全新的概念。在过去,我们关注的是图片识别、语音识别、推荐引擎等,但现在我们认识到,从扫描共享单车到浏览推荐的短视频,日常生活中几乎所有的技术负载都与AI相关。从智能终端到边缘计算,再到数据中心,AI的应用无处不在,且在计算能力的各个层面上发挥着越来越关键的作用。
正因为此,算力需求年年在增加。作为驱动算力提升背后的底层基石,过去几年,不管是CPU、GPU还是IPU每年都有不同火的点。例如去年整个行业面临大缺货的难题,今年庞大的智算算力需求之下,芯片供给端仍然不足。英特尔的技术专家指出,在技术趋势中,CPU和GPU主要扮演通用与专用计算能力的角色,而IPU则被视为一种技术堆栈架构的计算资源。每种处理器都有其独特的价值和优点。
然而,观察长期发展趋势,我们可以看到计算需求的动态性:很多计算需求可能最初被视为专用计算能力,但随着其应用的广泛化,它们逐渐转变成通用的资源。以人工智能为例,英特尔在其CPU中集成了AVX、AMX等计算引擎,这是基于对AI应用日益普及的观察,并非仅仅针对专用CPU设计。此外,针对大型公共云环境中的任务卸载,IPU提供了特定的功能,而英特尔DSA等引擎也被集成到CPU中,以便执行通用数据传输任务。英特尔一直在通用计算能力和专用计算能力之间,根据市场的动态变化进行的平衡和调整。
不是每个智算中心都需要海量的GPU算力
英特尔数据中心与人工智能集团兼副总裁兼中国区总经理陈葆立表示,目前十分火爆的大模型是一个新的技术演进,但它绝不是一个最终的形态,极可能仍在继续演进。但是模型的存在推动了数据化和数字化进程,促使企业重新考虑如何高效运作,这无疑是正面的。
AI所需要的算力是非常大的,这给我们带来了更高的要求,不管是突破硬件的极限,还是创新软件编程的方式。这种对算力的渴求甚至促使我们重新审视网络架构,以支撑AI算力节点间日益增长的数据传输需求。
陈葆立强调,尽管智算中心和GPU在当前市场中受到热捧,但不是所有数据中心都必须转型为智算中心,也不是每个智算中心都需要海量的GPU算力。实际上,许多企业使用最新的至强处理器就能满足他们的需求。
CPU如何赢得AI市场?
传统上,在AI市场中,主要以GPU芯片为主导。英特尔CPU想要打AI市场,需要进行哪些工作?对此,英特尔技术专家表示需要做的主要有两方面:一是需要借助oneAPI这类中间层进行底层硬件适配;二是针对通用的一些接口,如TensorFlow和PyTorch,英特尔提供了一系列量化工具来更精确的进行精度调整。量化又分为两种情况,一种是训练和推理阶段都做,这样的效果最好,另一种是只在推理阶段做,这在实际应用时更加方便。因此,英特尔的工作重点是提供合适的平台和支持上层数据适配。
在整个AI市场当中,除了ChatGPT的火爆之外,英特尔所观察到的另外一大风向是数据中心的节能减碳。算力的持续增加,对电量的使用也异常巨大。据统计,在没有大模型之前,中国3%的供电都在数据中心,如果继续下去,会达到4%、5%,而AI大模型算力大爆发下,增速进一步提高。因此,绿色的数据中心显得尤为重要。英特尔也正在这个领域不断投入,如液冷方案和智能调度。
其实不仅仅是在数据中心,现在就连PC领域,如联想,也开始推AI PC的概念。英特尔CEO帕特·基辛格此前曾提到,看好AI PC的原因主要是它解决了两个问题:一是数据隐私性,个人的数据在小范围内做小模型训练会比上传到大的地方训练隐私性更好;另一个是网络持续性,虽然在中国,4G和5G已经非常普遍,但仍会出现网络卡顿的情况。而当我们在需要这个服务的时候,希望即使在离线的状态也可以稳定执行,这就是AI PC的作用。
陈葆立表示:“无论是数据中心还是PC,至强可扩展处理器都是一个非常全能的CPU,可以运行包括AI和大模型推理等在内的各种工作负载。但除了芯片本身之外,英特尔更加看重整个数据中心硬件和软件生态的发展。算力很重要,而更大的内存如HBM,能显著提高大模型的训练和推理性能。此外,网络质量、多卡之间的互连速度和传输率也是关键的比较点。因此,从这些不同的维度和层面来看,竞争和发展的空间是巨大的。”
陈葆立进一步谈到:“我们不希望有一个点是不平衡的,比如某一个地方的算力增加了,但是相匹配的内存、散热或者软件跟不上,这对于用户来说,并没有很好的应用到整体数据中心该有的性能发挥,所以我们在系统上有多点的投入和投资。”英特尔的愿望一直以来都是想给开发者提供一个完整的体验,所以在软件方面,希望不管是至强以及未来的产品上所有的AI软件栈和软件工具都能无缝衔接。
在AI市场实际应用的业务方面,陈葆立指出,传统的互联网客户与英特尔的合作非常紧密,例如美团,今年采用了第四代英特尔至强可扩展处理器在一些简单的AI推理工作上,包括目标识别(Object recognition)或者是计算机视觉(Computer vision)等工作负载,也收获了不错的成绩。其他的互联网公司等亦是如此。通过与头部互联网的试炼,再将比较好的应用解决方案更好地推广到更大范围的企业,如跟横向或是行业中的软件商、方案商合作。
“四年五个节点”,下一代至强呼之欲出
英特尔正处于“四年五个制程节点”的飞速进程中,明年是比较重要的至强路线图升级的一年。下一代至强第一次采用了“双核并进”的路线图设计,分别是性能核(P-core)和能效核(E-core),对应的就是Granite Rapids和Sierra Forest这两个产品,以更好地满足不同数据中心需求。“我们非常有信心,整个至强处理器的路线图发展能够更好地全方位覆盖客户需求。”陈葆立表示。
放眼国内的数据中心市场,英特尔观察到,呈现出“从无到有,从少到多”的发展趋势。随着国内数据中心服务器装机量越来越多,已经从原来单纯满足业务需求转变为更多的精细化运营,开始关注产品的稳定性、产品的故障率。
英特尔技术专家指出:“目前来说,数据中心故障率最大的来源与内存有关。了解了这一痛点之后,英特尔正在与客户进行内存故障预测方面的技术创新,通过预先布置好的运维措施和内存技术。以此来尽早的预知故障风险,避免潜在的内存颗粒故障导致系统出错,最终来增强整个服务器系统的稳定性。”
据英特尔技术专家透露,目前英特尔的这两款产品在内部的执行、测试、样品方面都进展的非常顺利。国内包括OEM等厂商的通用渠道产品,以及一些大型CSP也都已经开始做定制化产品,而且也陆续有平台开始应用。
总结
随着AI技术的不断成熟和大模型的热潮不减,英特尔的技术专家和业界领导者们一致认识到,AI的未来不仅在于算力的增长,更在于技术的全面融合与创新。英特尔的前瞻性布局,尤其在“双轨并进”的产品路线图设计中体现得淋漓尽致,展示了对不同数据中心需求的深刻理解和高度适应性。此外,英特尔在推动AI市场进步的同时,也在积极响应节能减碳的全球趋势,投入液冷方案和智能调度等绿色数据中心技术。这不仅符合可持续发展的目标,也体现了企业的社会责任感。
总之,随着AI技术的日益普及,我们可以预见,英特尔将继续在这个充满挑战和机遇的市场中扮演关键角色,引领创新,同时为全球的数字化转型贡献力量。
责任编辑:sophie
相关文章
- 半导体行业观察
- 摩尔芯闻
最新新闻
热门文章 本日 七天 本月
- 1 国产EDA突破,关键一步
- 2 思尔芯第八代原型验证S8-100全系已获客户部署,双倍容量加速创新
- 3 汽车大芯片,走向Chiplet:芯原扮演重要角色
- 4 Ampere 年度展望:2025年重塑IT格局的四大关键趋势