返回博客

GTC 2026 全面解读:七芯合体、万亿美元豪赌,黄仁勋的「Token 工厂」帝国

2026年3月17日

英伟达 GTC 2026 大会深度拆解:Vera Rubin 七芯平台、Groq LPU 推理革命、Token 工厂经济学、NemoClaw 一键养虾、物理 AI 与太空计算。从芯片到生态,从地面到太空,一文看懂黄仁勋的万亿野心。


Vera Rubin 七芯合体

今天凌晨,英伟达的年度"AI 春晚"——GTC 2026 在圣何塞开幕。

黄仁勋穿着那件标志性的黑色皮夹克,用了两个多小时,丢出了一堆让人头皮发麻的数字:七款新芯片、五种机架、万亿美元需求预判、推理成本降低 90%

作为一个写了好几篇龙虾源码解读的人,我尝试把这场发布会的核心信息拆开,用人话讲清楚。


一、Vera Rubin:不是一块芯片,是一整座"AI 工厂"

这次 GTC 的绝对主角是 Vera Rubin 平台

注意,它不是一块 GPU,而是一个由七款芯片 + 五种机架组成的完整 AI 计算系统。这是英伟达有史以来发布的最复杂的计算平台。

七款芯片,各司其职

芯片定位核心亮点
Rubin GPUAI 训练/推理核心3nm 工艺,3360 亿晶体管,288GB HBM4,FP4 推理 50 PFLOPS(Blackwell 的 5 倍)
Vera CPU主机处理器88 个 Olympus 核心,LPDDR5X 带宽 1.2TB/s,通用 CPU 的 2 倍能效
NVLink 6 交换机GPU 互联260TB/s 全网络带宽,超过整个互联网的带宽总量
ConnectX-9 SuperNIC网络接口高速网络连接
BlueField-4 DPU数据处理配合 DOCA Memos 框架处理海量 KV 缓存
Spectrum-6 以太网交换机网络交换支持大规模集群组网
Groq 3 LPU专用推理加速256 个 LPU,128GB 片上 SRAM,640TB/s 带宽

最后一个 Groq 3 LPU 尤其值得注意——这是英伟达去年底花了 200 亿美元"招安"Groq 团队后的第一个落地成果。

五种机架,组成超级系统

Vera Rubin NVL72 是核心机架,72 个 Rubin GPU + 36 个 Vera CPU,全液冷设计,总算力 3.6 ExaFLOPS(FP4)。加上 Groq 3 LPX 推理机架、BlueField-4 STX 存储机架、Spectrum-6 SPX 网络机架和 Vera CPU 机架,五种机架组合成完整的 AI 工厂。

黄仁勋原话:"Vera Rubin 是一次划时代的飞跃——七款突破性芯片、五种机架、一台巨型超级计算机——旨在为 AI 的每个阶段提供澎湃动力。"


二、GPU + LPU 双引擎:推理成本降低 90%

GPU + LPU 双引擎分工

这次发布中,我认为最有商业意义的不是 Rubin GPU 有多快,而是 GPU 和 LPU 的分工协作

过去,不管是训练还是推理,都是 GPU 一把抓。但生成式 AI 的推理有一个特点:预填充(Pre-fill)阶段需要大量并行计算,而 Token 解码阶段需要极低延迟

英伟达现在把这两个阶段拆开了:

  • GPU 负责预填充——利用大规模并行计算能力处理输入
  • Groq 3 LPU 负责 Token 解码——片上 SRAM 替代片外存储,彻底消除数据搬运延迟

结果是什么?每瓦推理吞吐量提升 35 倍,单个 Token 生成成本降至前代的 1/10。

这意味着什么?

如果你用过 Claude、ChatGPT 或者养龙虾,你会知道 Token 价格决定了一切。推理成本降低 90%,直接改变的是整个 AI 产业的盈利模型。


三、Token 工厂经济学:数据中心的新身份

Token 工厂

黄仁勋在演讲中提出了一个非常形象的概念——"Token 工厂"

未来的数据中心不再是存储文件的仓库,而是生产 Token 的工厂。每一座工厂受电力限制,谁的每瓦 Token 吞吐量最高,谁的生产成本就最低。

他把 AI 服务分成了五个商业层级:

层级定价场景
免费层免费高吞吐换用户规模
中级层~$3/百万 Token基础商业应用
高级层~$6/百万 Token高级推理任务
高速层~$45/百万 Token低延迟实时场景
超高速层~$150/百万 Token金融交易、自动驾驶等极端要求

黄仁勋甚至预言:"未来每位工程师除了拥有年薪,还将拥有年度 Token 预算。"

在这个逻辑下,1GW 电力的数据中心造价约 400 亿美元,其商业价值完全取决于"每度电能产出多少 Token"。英伟达的卖点就是:用我的平台,你的 Token 工厂效率最高。

他给出的 2027 年需求预判:至少 1 万亿美元。去年在 GTC 上说的是 5000 亿,今年直接翻倍。


四、NemoClaw:英伟达版的"一键养虾"

NemoClaw 龙虾升级

对于我们这些天天跟龙虾打交道的人来说,这次最惊喜的发布是 NemoClaw

黄仁勋在演讲中说了一句让整个行业沸腾的话:

"Windows 让个人计算机成为可能,OpenClaw 让个人智能体成为可能。每一家企业都需要制定自己的 OpenClaw 战略,正如我们都需要 Linux 策略一样。"

他甚至说 OpenClaw 是"人类历史上最受欢迎的开源项目,短短几周超越了 Linux 三十年的成就"。

NemoClaw 是什么?一句话:英伟达官方加持的 OpenClaw 安全增强版

具体来说:

  1. 一键安装:一条命令部署 Nemotron 模型 + OpenShell 沙箱环境
  2. 安全护栏:通过 NVIDIA Agent Toolkit 提供隔离沙箱,保护数据隐私
  3. 全平台支持:从 GeForce RTX 笔记本到 DGX 超级计算机都能跑
  4. 本地优先:支持在本地运行开源模型,不必把数据交给云端

OpenClaw 创始人 Peter Steinberger 也出来站台,强调正在与英伟达合作"为 AI 智能体构建强大的护栏"。

结合之前腾讯 WorkBuddy、智谱 AutoClaw 的入局,现在英伟达也下场了。龙虾生态正在从"极客玩具"变成"企业基础设施"。

黄仁勋还抛出了一个观点:每一家 SaaS 公司都将转变为 AaaS(Agentic as a Service,智能体即服务) 公司。


五、物理 AI:从数字世界到真实世界

从地面到太空的 AI 帝国

GTC 2026 的另一大主题是 "物理 AI"——让 AI 不仅能处理文字和图片,还能理解和操控物理世界。

开源物理引擎 Newton

英伟达联合 Google DeepMind 和迪士尼研究院,推出了开源物理引擎 Newton。这是为机器人训练设计的仿真环境,让机器人在虚拟世界里学会各种动作,再迁移到真实世界。

人形机器人模型 GR00T N1

GR00T N1 是全球首款通用人形机器人功能模型,开源且可定制。黄仁勋甚至让一个搭载 GR00T N1 的机器人 "Blue" 在台上做了实时演示。

太空计算

最科幻的部分:英伟达推出了 Vera Rubin Space-1 太空模块,专门设计用于在太空轨道运行大语言模型和基础模型。相比 H100,太空推理能力提升 25 倍。

黄仁勋说:"太空计算已经到来。"

自动驾驶

与通用汽车深化合作,利用 Omniverse 和 Cosmos 优化工厂规划和机器人技术,推出综合全栈自动驾驶安全系统 NVIDIA Halos


六、DGX Spark:3000 美元的桌面超算

去年 GTC 就预告了,这次确认全面投产——DGX Spark

Mac Mini 大小、标准电源供电、128GB 统一内存、Grace Blackwell 超级芯片、FP4 算力 1 PFLOPS。

起售价 3000 美元(约 2.2 万人民币)。

这意味着什么?过去你想在本地跑 2000 亿参数的模型,需要一整间机房。现在,你桌上放一台 DGX Spark 就行了。

对于开发者来说,这可能是今年最值得关注的硬件——本地 AI 开发的门槛再次大幅降低。


七、路线图:Vera Rubin 只是开始

黄仁勋还剧透了完整的芯片路线图:

时间产品关键指标
2026 H1Blackwell Ultra (GB300) NVL72已在出货
2026 H2Vera Rubin NVL144七芯协同,3.6 ExaFLOPS
2027 H2Vera Rubin Ultra NVL5761TB HBM4e,FP4 推理 15 ExaFLOPS
2028Feynman 架构下下代架构,性能预计再提升数倍

从 Hopper 到 Vera Rubin Ultra,性能飙升 900 倍。英伟达每年一代新架构的节奏,正在把摩尔定律远远甩在身后。


老金说几句

这场 GTC 看下来,最大的感受是:英伟达已经不是一家芯片公司了。

七款芯片、五种机架、完整的软件栈(CUDA、NIM、NemoClaw)、从地面到太空的部署方案——黄仁勋在建造的,是一个从能源到应用的五层 AI 帝国。

几个值得关注的点:

1. GPU + LPU 分工是真正的范式转换。 过去推理和训练混用 GPU,效率不高但别无选择。现在 GPU 管训练和预填充、LPU 管解码,专芯专用。这会从根本上改变云计算厂商的采购逻辑和定价模型。

2. Token 工厂经济学正在变成现实。 当 Token 成本降低一个数量级,之前因为"太贵"而不可行的 AI 应用就会井喷。Agentic AI 是最直接的受益者——龙虾之所以费钱,就是因为一次任务要消耗大量推理 Token。成本降 90%,普及速度就能加 10 倍。

3. NemoClaw 的发布意味着龙虾从"玩具"升级为"基础设施"。 当英伟达亲自下场做安全增强版,OpenClaw 的企业级采用会加速。CEO 们不再只是"听说过龙虾",而是被要求"制定龙虾战略"。

4. 物理 AI 是下一个五年的主战场。 从开源 Newton 物理引擎到 GR00T N1 机器人模型,再到太空计算模块——英伟达在赌的是:AI 不会停留在屏幕里,它要走进工厂、走上马路、飞向太空。

回到那个让人头皮发麻的数字——1 万亿美元

去年黄仁勋说 5000 亿,当时很多人觉得在吹牛。一年后他翻了一倍,你信吗?

说实话,看完这场发布会,我有点信了。