新紫光集团联席总裁陈杰:守正创新,迎接AI时代的机遇与挑战

2024-11-18 21:12:35 来源: 杜芹

2024年11月18日,第二十一届中国国际半导体博览会在北京盛大开幕。本届ICCHINA2024的主题为“集合全行业资源·成就大产业对接”。会上,新紫光集团联席总裁陈杰发表了主题演讲,探讨了AI时代下,国产芯片厂商的机遇与挑战。
 
生成式AI为通用人工智能的实现带来了曙光
 
人工智能不是新鲜事物。早在1956年John McCarthy在达特茅斯会议上,首次提出了人工智能(Al,Artificial Intelligence)概念,经历了四十多年的符号智能、近二十年的专用智能的发展,现已进入通用智能的研发阶段。
 
近几年,在大模型算法、大算力芯片、高质量大数据的驱动下,生成式AI技术发展迅速,取得了系列重大成果。GPT-4已成功通过图灵测试,为通用人工智能(AGI,Artificial General Intelligence)的实现带来了曙光。
 
AI正在引发新一轮科技革命。从语言模型、多模态模型的单体智能,到能够使用思维链(CoT,Chain of Thinking)进行推理的OpenAl o1,再到使用工具完成复杂任务的智能体(AlAgent),Al基础能力正在快速演进AI将成为智能时代的基础设施,融入生产和生活的每个环节,重塑千行百业,引发新一轮科技和产业革命。
 
AI引领下,全球半导体市场规模创新高,24Q2达1621亿美元。如果扣除英伟达及AI带来的HBM需求,市场并未回到高点,行业整体仅仅是刚走出周期谷底。
 
当前AI发展遇到的三大挑战
 
陈杰指出了当前AI发展所遇到的三大挑战:
 
挑战一:商业模式
 
当前大量资源投入到云端通用大模型领域,但其商业模式能否走通仍然未知。据硅谷媒体The Information 测算,2024年OpenAl营收40亿美元,但亏损额高达55亿美元,预计2026年亏损140亿美元;另据OpenAl高管创立的通用大模型公司Anthropic预计2024年底营收达10亿美元,但亏损约20亿美元,正在进行数十亿美元规模的新一轮融资。
 
挑战二:能源供应
 
如同黄仁勋所说,没有任何物理定律可以阻止AI数据中心扩展到一百万芯片,但其能源供应可能需要核电站。
 
能源供应已经成为制约AI发展的一大挑战。举例来说,人类大脑的功耗不超过25W,而英伟达8卡DGX B200功耗达14.3kW。如果考虑冷却系统耗电量,百万卡智算中心能耗将高达3GW(三峡装机容量22.5GW)。因而,微软、谷歌、亚马逊、甲骨文等已纷纷投资核电站建设。
 
挑战三:技术路线
 
图灵奖得主、深度学习先驱、Meta首席人工智能科学家Yann LeCun曾指出:“仅通过文本训练,永远不会达到接近人类水平的智能”。这变相指出了大模型所存在的一些掣肘:1)大语言模型缺乏智能的基本特征:GPT系列LLM并不真正了解物理世界,无法真正推理
;2)大模型只有语言直觉:LLM本质是基于概率统计,将语言知识压缩存储在模型中。但只是根据概率预测下一个单词,它不会真的去思考答案;3)大模型适用范围有限:只适用于以离散对象、符号、标记、单词等形式出现的数据,这些仅仅是现实世界的特殊简化。
 
如何应对AI时代的挑战?守正创新!
 
面对AI时代的挑战,陈杰指出,必须密切跟踪AI领域的国际技术发展趋势,并集中力量攻克已被验证有效的技术瓶颈。减少重复性投资,集中资源建设几个人工智能算力中心,确保在关键技术领域拥有强大的“孙悟空”。同时,要重视开拓AI新技术路线,推动架构创新、系统创新、端侧创新和应用创新。充分发挥我国在应用端创新多、市场大的优势,积极打造全球AI应用的领先高地。
 
同时,陈杰很关键的指出了应对AI时代挑战的策略是“守正创新”。具体该如何理解呢?
 
守正是指:在算法模型(Transfomer架构通用LLM)、算力(GPGPU、Nvlink)、工艺(FinFET、GAA等先进工艺)、存储(HBM3e、HBM4..)、应用(文本、代码、图像的生成)等领域守正。
 
与之相对应的创新则是:在算法模型(RWKV、JEPA等新架构,端侧小模型、具身智能..)、算力(DSA、存算一体、晶圆级芯片)、工艺(二维材料、3D晶体管、硅光)、存储(3D堆叠、新型存储)、应用(垂直领域模型、AlAgent应用)等领域积极探索和突破,推动新技术和新模式的出现。
 
具体而言,在创新之路上,应重视系统和芯片架构创新,缩小技术差距。当前大算力芯片的性能提升,严重依赖先进工艺和HBM3/4存储器。我们可以积极开展芯片架构创新,如采用3D堆叠/Chiplet/存算一体等新架构,努力缩小大算力芯片的技术代差。另外,积极开展异构大算力集群系统的架构和任务调配等方面的优化工作,努力缩小大算力集群系统的性能差距。
 
再一个是,重视端侧AI技术创新,建立端侧AI技术优势。这是因为端侧AI的商业模式更明确、更容易落地。而且端侧AI芯片对算力(数TOPS/s~数百TOPS/s)和制造工艺(7nm以上也可)的要求相对较低。通常端侧AI的应用需求多种多样,需要众多企业参与。端侧AI算力架构、软件栈、推理框架、应用解决方案等各领域,均有待加强研究和突破。
 
此外很重要的一点是,减少重复投资和内卷,集中力量办大事。当前模型大战、芯片大战等投资热火朝天,半导体和AI产业链重复投资严重。建议加强政策、投资、产业等统筹,杜绝恶性竞争,提高资源配置效率。
 
结语
 
半导体产业链既长且复杂,产业链的全球化是历史实践中形成的最佳选择。区域化的供应链不仅浪费社会资源,还可能阻碍技术的快速进步。在面对通用人工智能时代,尤其是算力、数据、能源和应用场景等方面前所未有的挑战时,我们应当坚持产业链的开放与合作,共同迎接AI时代的各种挑战。
 
责任编辑:sophie

相关文章

半导体行业观察
摩尔芯闻

热门评论