但在2026年COMPUTEX国际电脑展的核心舞台上,英伟达创始人黄仁勋的重磅演讲,正式宣告了这场单一算力垄断格局的终结。英伟达不再局限于GPU赛道的深耕,同步抛出两大颠覆性产品,改写了AI基础设施的发展逻辑:面向个人AI智能体的RTX Spark处理器,彻底重构PC终端的交互逻辑,将传统“打开应用、手动操作”的设备模式,升级为“用户提需求、AI自主执行”的智能模式;与此同时,英伟达首款自研数据中心CPU Vera正式公开亮相,被官方定义为企业未来核心增长引擎,剑指规模高达2000亿美元的全球CPU市场。

智能体重构算力需求,CPU从辅助工具变性能瓶颈
CPU的价值回归,本质是AI应用形态迭代的必然结果。在生成式AI发展初期,行业重心高度集中于大模型预训练环节。这一阶段的核心工作是海量、并行的矩阵计算,完美适配GPU的算力优势,因此GPU成为绝对核心。而CPU仅承担系统初始化、数据搬运、基础任务管理等辅助性工作,处于算力体系的边缘位置,“重GPU、轻CPU”也成为行业默认的标配逻辑。但随着AI产业从模型训练红利期,全面转向大规模落地推理,再进阶到智能体规模化应用时代,AI算力的工作负载结构发生了根本性变革。传统对话式AI是简单的线性交互,一问一答、流程固定;而AI智能体是复合型自主运行系统,能够自主拆解复杂任务、并行调用各类外部工具、读写数据库、执行搜索与代码运算、校验操作权限、维护上下文缓存,还能自主判断执行结果、迭代后续行动方案。
图片由 AI 生成,仅供参考
汇丰证券的行业报告进一步补充了这一结论:现代AI智能体工作流中,约44%的底层计算任务高度依赖CPU算力支撑,这一占比是传统文本生成大模型的3至4倍。算力需求结构的巨变,直接颠覆了传统服务器的硬件配比逻辑。过去AI服务器普遍采用“1至2颗CPU搭配8颗顶级GPU”的1:8配比模式,而当前行业配比正快速向1:4迭代,未来随着智能体场景持续深化,CPU与GPU配比或将达到1:1甚至更高,CPU的算力权重持续抬升。
巨头集体重仓布局,AI CPU开启高速增长周期
AI智能体催生的CPU刚需,让全球芯片巨头纷纷调整战略,全力加码AI CPU赛道。AMD董事长兼CEO苏姿丰多次公开表态,行业长期低估了CPU在AI时代的核心价值。她预判,未来三至四年,全球数据中心芯片市场规模将突破1万亿美元,且这片蓝海市场绝非GPU独占,而是CPU、GPU、ASIC等多类芯片协同共存的格局。市场走势也印证了巨头的判断。短短半年时间,CPU从无人关注的边缘品类,变成AI算力竞争的核心标的。苏姿丰预测,未来五年全球数据中心CPU市场年复合增长率将突破35%,彻底摆脱过去几年个位数的低速增长,迈入爆发式增长阶段。
在产品端,AMD将核心产能与研发资源倾斜至第六代EPYC处理器(代号Venice)。这款芯片是行业首款基于台积电2纳米工艺、实现量产爬坡的高性能计算芯片,后续迭代型号Verano还将搭载LPDDR内存集成技术,精准适配AI智能体场景的大容量、高吞吐内存需求。凭借前代第五代EPYC处理器的高核心密度与极致能效比,AMD已率先抢占市场红利,2025年第四季度数据中心业务营收创下54亿美元的历史新高,同比增幅达39%。
与AMD深耕通用AI服务器CPU的思路不同,英伟达的CPU布局更聚焦自身算力生态闭环。英伟达的核心诉求并非与英特尔、AMD争夺通用CPU市场份额,而是彻底解决外部CPU、PCIe总线、低速网络带来的算力损耗,消除高端GPU的性能瓶颈,将CPU打造为自有AI算力平台的核心拼图。
基于这一逻辑诞生的Vera CPU,是英伟达专为AI智能体的任务编排、工具调用、长上下文管理量身打造的定制化芯片。黄仁勋直接将其定位为英伟达下一个数十亿美元级核心业务,将助力企业切入2000亿美元规模的CPU蓝海市场。目前,英伟达已完成首批Vera CPU系统交付,合作客户涵盖Anthropic、OpenAI、甲骨文云、SpaceX AI等全球顶级AI企业与云厂商。
硬件参数上,Vera CPU搭载88颗英伟达自研Olympus核心,兼容Armv9.2指令集,原生支持FP8精度运算,适配AI推理计算需求。同时摒弃传统超线程技术的弊端,采用空间多线程架构,通过物理层级的核心资源硬分区,实现176个稳定硬件线程,大幅降低智能体复杂逻辑运算的尾部延迟,完美适配高频、并发的AI智能体工作负载。

全产业链产能告急,AI热度倒逼终端涨价
随着全球巨头全力加码AI CPU,一场围绕先进制程产能的争夺战全面爆发。亚马逊、微软等超大规模云厂商,以及英伟达、AMD、苹果等芯片设计企业,纷纷争抢台积电等代工厂的稀缺产能窗口。在产能有限的前提下,利润率更高、芯片面积更大的数据中心GPU订单,持续挤压通用CPU的生产配额,让本就紧张的CPU产能雪上加霜。行业产能分配的优先级,直接引发了连锁供需危机。芯片厂商优先保障利润更高的高端服务器CPU订单,导致服务器CPU率先出现供给紧缺、交期拉长、价格上涨的问题。目前英特尔已向中国客户发出预警,部分型号服务器CPU交付周期长达6个月;AMD多款主流服务器CPU交期延长至8至10周。同时,英特尔中国市场服务器芯片价格涨幅超10%,而中国市场贡献其超两成营收,成为受影响最显著的区域市场之一。
全球内存芯片的持续短缺,进一步放大了CPU的供需矛盾。为锁定整机采购成本、规避后续涨价风险,各大企业与云厂商开启大规模囤货模式,提前批量采购服务器CPU,进一步透支了现有产能,加剧市场供给紧张局势。
服务器端产能被全面抢占后,压力最终传导至消费端。个人PC、普通企业级设备的CPU生产优先级被大幅下调,消费级CPU供给持续收紧、终端价格稳步上行。行业呈现出明显的马太效应:资金雄厚的大型云厂商、科技巨头凭借高出价优先锁定产能,中小采购方、个人消费者只能排队等待。这也意味着,AI行业热度越高,普通用户的个人电脑、终端设备采购成本就越高。
纵观整条AI算力产业链,GPU、CPU、内存、DPU、高速网络交换机、先进封装、液冷散热、整机柜供电等每一个环节,都不再是独立个体。AI算力的整体交付能力,取决于全产业链的协同匹配度,任意一个环节的产能、技术短板,都会成为AGI落地的桎梏。
归根结底,AGI的落地从不是单纯的算法与模型竞赛,终究逃不开基础设施的底层桎梏。行业绕过高耸的算法红利,最终回归最朴素的产业真相:充足的能源供给、完善精密的硬件体系、稳定成熟的算力基建,才是通用人工智能真正诞生的前置基础。
