2026 年 6 月初的 Computex 台北电脑展,可能是近年来信息密度最高的一届。一周之内,Intel 亮出代号 Crescent Island 的 AI 数据中心 GPU、发布 288 核的 Xeon 6+ 处理器并展示与 SambaNova 合作的 rackscale 推理方案;Nvidia 推出 RTX Spark PC 芯片进军消费端、同时将 DSX OS 软件栈从芯片管到电网;Marvell 交付业界首款 102.4 Tbps 交换机;Broadcom 与韩国 FuriosaAI 签约定制 AI 加速器……这些看似分散的发布,共同指向一个清晰的信号:AI 算力产业正在经历一场从"训练为王"到"推理驱动"的结构性转折。
推理上位:Agentic AI 正在改写数据中心算力方程
过去两年,AI 数据中心的叙事几乎被 GPU 垄断。训练一个千亿参数的大模型,需要成千上万颗 H100/B200 级别的 GPU 协同工作数月。但 2026 年,产业重心正在从"训练模型"转向"使用模型"——即推理(inference),尤其是 Agentic AI 所代表的多步骤、自主决策型推理。
Deloitte 在其 2026 年 TMT 预测报告中指出,尽管 pre-training 的增长正在放缓,但 post-training scaling 和 test-time scaling 带来的推理算力需求,使得全球 AI 数据中心资本支出预计在 2026 年达到 4000 亿至 4500 亿美元,其中芯片支出占 2500 亿至 3000 亿美元。到 2028 年,这一数字可能攀升至 1 万亿美元。
Creative Strategies 首席分析师 Ben Bajarin 给出了一个更直观的判断:在训练时代,数据中心的 CPU 与 GPU 比例大约是 1:4;但在 Agentic 推理时代,这个比例将变为 1:1 甚至更高。原因很简单:大模型推理本身仍然依赖 GPU,但 Agent 软件在模型周围执行的大量协调工作——调用 API、查询数据库、运行代码解释器——全部落在通用 CPU 核心上。当组织从单次提示词转向多步骤自主 Agent 时,CPU 的协调工作量呈指数级增长。
这解释了为什么 Computex 2026 上,CPU 重新站到了舞台中央。
Intel 亮剑:Crescent Island 与 Xeon 6+ 的双线出击
Intel 在 Computex 2026 上做出了近年来最清晰的战略声明:AI 数据中心不再是 GPU 的独角戏。CEO 陈立武(Lip-Bu Tan)在主题演讲中明确表示:"随着推理、Agentic 和 Physical AI 的兴起,Intel 有能力从芯片到系统层面为世界带来新的创新。"
Intel 的武器是双线作战:
GPU 线:Crescent Island。 这款基于 Xe3P 架构的数据中心 GPU 支持高达 480GB 的 LPDDR5X 内存(基础参考架构为 160GB),瞄准 Agentic 推理场景。与依赖昂贵 HBM 的高端 GPU 不同,Crescent Island 以更低成本提供 FP4 到 FP64 的完整精度支持,预计 2026 年下半年向客户送样。Intel 试图用它切割出一个"够用、便宜、省电"的推理加速器市场。
CPU 线:Xeon 6+(Clearwater Forest)。 这是 Intel 首款基于 18A 制程的数据中心处理器,最高 288 个效率核心,热设计功耗 330–450W。Intel 宣称单台 Clearwater 系统可替代 9 台上一代 Xeon 服务器。在与 Foxconn 合作的 rackscale 参考设计中,一台 100kW 的液冷机架可塞入 128 个处理器插槽,提供 36,864 个核心和 384TB 内存——这在一年前是不可想象的密度。
更值得关注的是 Intel 与 SambaNova、Foxconn 的三方合作,以及 Vista Equity Partners 和 Cambium Capital 联合成立的 Vector Core Compute 推理云。在 Computex 现场,他们演示了业界首个完全解耦的推理系统:Intel Xeon 6 负责编排和执行,SambaNova SN40 RDU 负责 decode,Nvidia Blackwell GPU 负责 prefill——三者协同运行在洛杉矶的数据中心,为 Together.ai 的 MiniMax 2.5 模型提供了当时最快的企业推理速度。Vista 旗下 90 多家投资组合公司、服务超过 25 亿用户和 7.5 亿企业客户,已获得该推理云的早期使用权。
这种"解耦推理"(disaggregated inference)架构,将不同的推理阶段分配给不同的硬件,是 AI 基础设施从"一刀切"走向"精细化分工"的关键一步。
Nvidia 的"套娃"战略:DSX OS 从芯片管到电网
如果说 Intel 的策略是"把 Agent 需要的 CPU 基础设施做到极致",那么 Nvidia 的策略则是"把整个 AI 数据中心变成一台 Apple 式的整机"。
Nvidia 在 Computex 2026 上发布的 DSX OS 软件栈,是理解其战略野心的核心。DSX OS 包含四个模块:
- DSX Sim:数据中心的数字孪生,用于设计和模拟兆瓦级乃至吉瓦级 AI 工厂;
- DSX Exchange:API 中枢,让基础设施各层相互通信;
- DSX Flex:将数据中心 API 连接到电网运营系统,让 AI 工厂不索取超出电网能力的电力;
- MaxLPS:与下一代 Vera-Rubin 平台的动态功耗特性配合,实时监控和调配每颗 GPU、每个机架、每排机柜的电力,在固定功率预算内安全部署多达 40% 的额外 GPU。
Nvidia 副总裁 Ian Buck 在媒体预沟通会上直言:MaxLPS 意味着"40% 更多的算力、40% 更多的 token、40% 更多的收入"。
The Next Platform 的分析指出,Nvidia 近 4 万名员工中约 75% 从事软件开发,它本质上是一家软件公司,只是恰好设计了世界上最复杂的硬件。DSX OS 的推出,将 Nvidia 的护城河从 CUDA 生态进一步延伸到了数据中心基础设施管理层面——从芯片、机架、冷却、电力到电网交互,Nvidia 正在构建一个"全栈锁定"的 AI 工厂操作系统。
与此同时,Nvidia 还宣布了与 MediaTek 合作开发的 RTX Spark Superchip,进军 Windows on Arm PC 市场。这款芯片将于 2026 年秋季在 Dell、Lenovo 等品牌的笔记本和台式机上首发。黄仁勋在 Computex 上称 2026 年为"Agent 之年",并强调 RTX Spark 的目标是"重新发明 PC"。
芯片版图重构:从 GPU 独大到多元化生态
Computex 2026 最深远的变化,或许是 AI 芯片市场从"一家独大"走向"百花齐放"的信号愈发清晰。
Marvell 宣布交付业界首款 102.4 Tbps 交换机芯片 Teralynx T100,基于 3nm 工艺,支持 512 端口 scale-out,功耗比竞品低 25%。当 AI 集群因供电限制而分散到多栋建筑甚至多个城市时,高带宽、低延迟的互联网络就成了系统能否正常工作的决定性因素。AI 网络正悄悄成为基础设施中最关键也最被低估的环节。
Broadcom 将韩国 AI 芯片公司 FuriosaAI 纳入其定制芯片客户名单,使用 2nm 工艺和 HBM4 内存为后者打造第三代加速器。FuriosaAI 当前的 RNGD 芯片以约 180W 功耗提供 512 TFLOPS 的 FP8 算力——相比 Nvidia B200 近 1000W 的功耗,其竞争力在于"效率优先"。Broadcom 的定制加速器业务目前已占其季度收入的约 65%。
STMicroelectronics 将其 2026 年数据中心收入目标翻倍至约 10 亿美元,并预计 2027 年再翻一番。这家欧洲芯片公司不制造 GPU,而是提供电源管理、模拟芯片等"不起眼但不可或缺"的组件。当一家宽线组件供应商大幅上调数据中心预期时,它验证了一个事实:AI 基础设施的资本洪流已经溢出 GPU 供应商,正在灌溉整个半导体供应链。
供电瓶颈:算力狂飙的"硬天花板"
所有芯片的算力竞赛,最终都指向同一个物理约束:电力。
Goldman Sachs 的研究预测,到 2030 年,AI 将推动数据中心电力需求增长 165%。美国数据中心的电力消耗占比将从当前的约 6% 翻倍至 11%。Deloitte 指出,AI 数据中心资本支出中超过一半流向芯片,但土地、建设、电力、许可等"其余一切"的成本正在快速攀升。
Nvidia 的 MaxLPS 和 DSX Flex 之所以被推到台前,正是因为电力已成为 AI 扩张的最大瓶颈。Data Center Knowledge 的报道指出,2026 年,电力正成为 AI 增长与数据中心运营之间最核心的交叉点——美国电网的大部分建于数十年前,远未准备好应对 AI 负载的爆发。
在这一背景下,产业正在探索多种应对路径:现场发电(on-site generation)、小型模块化核反应堆(SMR)、电池储能替代柴油备用电源、空心光纤降低能耗,以及将推理负载分散到不同地理位置以参与电网需求响应。Deloitte 特别指出,与 pre-training 不同,post-training 和 test-time scaling 是可以"中断"的,这为 AI 公司参与电网调峰提供了新的灵活性。
结语
Computex 2026 揭示的 AI 算力图景,可以用三个关键词概括:推理驱动、系统重构、供电为王。
Agentic AI 对 CPU 和网络的需求,正在打破 GPU 在数据中心叙事中的垄断地位,Intel 和 Arm 正借此窗口重返牌桌。Nvidia 的应对策略不是防守,而是将护城河从芯片延伸到整个数据中心和电网的软件控制层。与此同时,定制芯片、高效加速器和交换机等多元化方案,正在为不同预算和场景的 AI 部署提供更多选择。
但最根本的约束仍然是电力。无论芯片多快、架构多聪明,如果电网无法支撑,算力扩张就必然碰壁。这也意味着,2026 年之后,AI 算力的竞争将不再仅仅是芯片性能的比拼,而是芯片、网络、冷却、电力、软件协同效率的综合较量。
来源:
- Intel Newsroom: Intel Announces New AI Innovations at Computex(2026-06-02)
- The Next Platform: Nvidia Extends Its Grip On The AI Datacenter Outwards(2026-06-02)
- AgentPMT: Artificial Intelligence Data Centers Pivot to Agents(2026-06)
- Deloitte Insights: Why AI's next phase will likely demand more computational power, not less(2026)
- Data Center Knowledge: Inference Becomes the Next AI Chip Battleground(2026)
- Bloomberg: Nvidia Is Taking On Intel and AMD With AI Chip for Computers(2026-06-01)
- Goldman Sachs: AI to drive 165% increase in data center power demand by 2030
- Data Center Dynamics: Intel teases Crescent Island AI data center GPU(2026)

