英伟达 Vera Rubin 架构全面量产，黄仁勋提出 AI 工厂重塑算力产业商业模式

首页

资讯

------

科技资讯

2026-07-01 10:00:30

6 月 28 日，英伟达在年度股东大会上正式宣布，Vera Rubin 全新 GPU 架构进入全面量产阶段。根据官方给出的性能指标，新一代产品在大模型推理场景下的吞吐能力，较上一代 Blackwell 架构提升最高 35 倍，单卡能够同时承载上千条多模态对话任务，大幅降低单 Token 的计算成本。黄仁勋在会议中提出全新产业定义：未来的数据中心不再是普通机房，而是 “AI 工厂”，算力产出物就是 Token 文本与图像内容，整个算力产业会逐步走向工业化量产模式。

这套全新叙事彻底改写了算力行业的估值逻辑。过去资本市场把 AI 服务器当作普通硬件设备看待，更加看重硬件销售利润。而在 AI 工厂模式下，算力集群是生产车间，大模型是生产线，收益来自持续输出的智能内容服务，资本开支回报周期会被大幅拉长，行业长期资本投入会持续加码。英伟达预测，未来三年全球企业在 AI 算力基建上的资本支出会保持年均 75% 以上增速，海量资金会持续涌入智算中心、模型研发、芯片硬件三大环节。

Vera Rubin 架构专门针对稀疏大模型、长上下文多模态业务优化，强化了显存带宽与张量计算单元，完美适配当前万亿参数 MoE 模型的运行需求。除了云端训练推理芯片之外，英伟达同步发布了面向人形机器人的端侧边缘芯片，强化视觉感知、运动控制的实时算力输出，打通从云端训练到机器人本体执行的全链路硬件体系，牢牢守住从大模型到具身智能的硬件入口。

不过市场格局正在发生变化。头部大模型企业自研 ASIC 持续分流 GPU 订单，OpenAI、亚马逊、谷歌都在稳步扩大自有专用芯片的部署规模，通用 GPU 的市场份额正在被逐步蚕食。为稳住基本盘，英伟达一方面持续迭代架构提升能效，另一方面向下游延伸，推出软硬件一体化解决方案，捆绑大模型开发框架，抬高客户迁移成本。

反观国内算力硬件市场，国产 GPU、AI 加速器正在加速渗透政企智算项目。八部门发文推动工业算力与工业互联网一体化建设，大量制造行业算力项目优先采购自主可控硬件，为国产芯片创造规模化落地场景。当前国内芯片最大短板不在硬件算力，而在软件生态与模型适配。只有持续完善编译框架、驱动程序、算子库，才能真正承接工业大模型、机器人端侧算力订单，在 AI 工厂的产业浪潮中建立本土产业链优势。短期来看，通用 GPU 依旧是云端训练主力，但中长期 ASIC 与国产异构芯片会持续抢占推理市场，算力硬件市场即将进入多元化竞争时代。