6 月 28 日,英伟达在年度股东大会上正式宣布,Vera Rubin 全新 GPU 架构进入全面量产阶段。根据官方给出的性能指标,新一代产品在大模型推理场景下的吞吐能力,较上一代 Blackwell 架构提升最高 35 倍,单卡能够同时承载上千条多模态对话任务,大幅降低单 Token 的计算成本。黄仁勋在会议中提出全新产业定义:未来的数据中心不再是普通机房,而是 “AI 工厂”,算力产出物就是 Token 文本与图像内容,整个算力产业会逐步走向工业化量产模式。
这套全新叙事彻底改写了算力行业的估值逻辑。过去资本市场把 AI 服务器当作普通硬件设备看待,更加看重硬件销售利润。而在 AI 工厂模式下,算力集群是生产车间,大模型是生产线,收益来自持续输出的智能内容服务,资本开支回报周期会被大幅拉长,行业长期资本投入会持续加码。英伟达预测,未来三年全球企业在 AI 算力基建上的资本支出会保持年均 75% 以上增速,海量资金会持续涌入智算中心、模型研发、芯片硬件三大环节。
Vera Rubin 架构专门针对稀疏大模型、长上下文多模态业务优化,强化了显存带宽与张量计算单元,完美适配当前万亿参数 MoE 模型的运行需求。除了云端训练推理芯片之外,英伟达同步发布了面向人形机器人的端侧边缘芯片,强化视觉感知、运动控制的实时算力输出,打通从云端训练到机器人本体执行的全链路硬件体系,牢牢守住从大模型到具身智能的硬件入口。
不过市场格局正在发生变化。头部大模型企业自研 ASIC 持续分流 GPU 订单,OpenAI、亚马逊、谷歌都在稳步扩大自有专用芯片的部署规模,通用 GPU 的市场份额正在被逐步蚕食。为稳住基本盘,英伟达一方面持续迭代架构提升能效,另一方面向下游延伸,推出软硬件一体化解决方案,捆绑大模型开发框架,抬高客户迁移成本。
反观国内算力硬件市场,国产 GPU、AI 加速器正在加速渗透政企智算项目。八部门发文推动工业算力与工业互联网一体化建设,大量制造行业算力项目优先采购自主可控硬件,为国产芯片创造规模化落地场景。当前国内芯片最大短板不在硬件算力,而在软件生态与模型适配。只有持续完善编译框架、驱动程序、算子库,才能真正承接工业大模型、机器人端侧算力订单,在 AI 工厂的产业浪潮中建立本土产业链优势。短期来看,通用 GPU 依旧是云端训练主力,但中长期 ASIC 与国产异构芯片会持续抢占推理市场,算力硬件市场即将进入多元化竞争时代。