6 月 30 日,国际超算大会 ISC 正式发布全球超算存储性能榜单,国产超级计算集群鹏城云脑 II 一举拿下 IO 带宽、大文件读写两项全球第一名,刷新了分布式存储系统的世界纪录。这套超算集群采用全国产算力芯片 + 国产存储阵列搭建,能够稳定承载万亿参数稀疏大模型的不间断训练任务,标志着我国自主可控超算硬件体系已经可以满足顶级大模型研发需求。
大模型训练不仅依赖计算芯片的算力,数据存储带宽往往是更大的瓶颈。万亿参数模型每一轮迭代,都需要读写数十 TB 的训练数据集,如果存储吞吐跟不上 GPU 计算速度,大量算力会长期处于闲置等待状态,硬件利用率不足三成。长期以来,国内超算集群高度依赖海外高端存储设备,不仅采购成本高昂,还存在供应链管控风险,限制了本土大模型研发节奏。
鹏城云脑 II 项目团队针对性攻克分布式存储技术难题,采用自研高速互联网络架构,把集群整体 IO 带宽提升至国际顶尖水平。整套硬件平台全部选用国产 AI 加速芯片、国产高速内存与固态存储,软硬件全部实现自主研发。经过连续多轮压力测试,集群运行 MoE 万亿大模型时,硬件整体算力利用率稳定保持在 85% 以上,大幅缩小了与海外顶尖超算集群的差距。
当前国内头部大模型企业正在密集研发万亿级稀疏模型,训练任务对超算资源消耗极大。公有云高端算力供给紧张,排队周期动辄长达数月。国家级国产超算集群逐步扩容,能够为本土模型团队提供稳定的训练算力,不再被海外硬件供货节奏制约。除鹏城云脑之外,多地国家级智算中心都在升级全国产硬件集群,持续扩充自主可控训练算力。
业内技术专家表示,AI 算力分为计算与存储两大支柱,过去国内产业更多聚焦 AI 芯片研发,存储硬件长期被忽视。本次鹏城云脑 II 拿下存储榜单冠军,补齐了国产算力基础设施的短板。高速存储阵列、高速互联网卡、内存芯片共同组成完整算力底座,缺一不可。未来国产算力产业链必须计算 + 存储双线并行发展,才能完整支撑大模型长期迭代。
随着工业大模型、多模态大模型研发持续提速,国家级超算与地方智算中心还会持续扩容。国产超算拿下性能世界纪录,不只是技术荣誉,更意味着本土 AI 研发彻底拥有自主硬件根基。后续国产芯片厂商可以和超算中心深度协同,针对大模型训练场景持续优化硬件架构,进一步提升软硬件适配度,降低本土大模型研发的硬件成本,持续缩小与海外顶尖模型之间的技术差距。强大的自主超算底座,同样能够为人形机器人具身智能大模型训练提供充足算力,推动机器人智能水平快速迭代升级。