美团开源 1．6 万亿 MoE 大模型，国产加速器全程承接全链路训练推理

首页

资讯

------

科技资讯

2026-07-01 10:31:05

7 月 1 日，美团人工智能实验室正式开源 1.6 万亿参数 MoE 稀疏大模型，面向零售调度、仓储机器人、本地生活智能决策等产业场景开放权重与代码。值得关注的是，整轮模型训练、后续推理测试全程没有使用海外高端 GPU，全部依托国产 AI 加速器集群完成，完整验证了国产算力硬件支撑万亿级大模型全链路运行的可行性。这次开源事件，成为国产算力生态一次大规模实战演练。

MoE 稀疏模型已经成为当前万亿参数大模型的主流技术路线。相比稠密大模型，稀疏架构只激活部分网络参数，训练与推理成本大幅下降，非常适合企业级产业应用。美团本次开源的万亿模型，主要面向线下实体经济场景，能够优化外卖运力调度、仓储机器人路径规划、门店智能排班，直接落地实体经济智能化改造。在此之前，绝大多数开源万亿大模型都依托海外 GPU 集群训练，国产硬件只能承接小规模推理任务，很难完整跑完完整训练流程。

项目技术负责人介绍，团队针对国产推理芯片深度优化算子，对模型网络结构做轻量化裁剪，适配国产硬件的显存带宽与计算单元特性。经过反复调试，整套模型在国产加速器集群上稳定完成多轮迭代训练，推理吞吐能力达到商用落地标准。开源之后，全国数千家产业 AI 团队都可以下载模型，在国产算力服务器上直接部署运行，大范围拉动国产芯片的软件生态适配。

开源大模型正在成为培育国产算力生态最重要的载体。过去国产芯片硬件参数达标，但是缺少适配的大模型，大量硬件算力被闲置。海量开源产业模型普及之后，开发者会持续优化算子、驱动与编译框架，倒逼软硬件不断磨合迭代。随着百川、DeepSeek、美团等多款万亿开源模型陆续完成国产硬件适配，本土算力软件短板正在快速补齐。

产业落地场景也随之打开。仓储人形机器人、分拣机械臂、园区无人车，都可以接入这套调度大模型，依靠厂区本地国产算力节点完成实时决策。终端机器人只负责运动执行，复杂智能运算交给边缘算力集群，既降低机器人本体造价，又保障数据安全。零售、物流行业机器人规模化部署，会持续释放大量边缘推理芯片订单，为国产 ASIC 带来长期增量需求。

资本市场也敏锐捕捉到这一变化，AI 芯片板块迎来新一轮资金布局。行业逻辑已经从 “硬件性能比拼” 转向 “软硬件生态闭环”。开源大模型繁荣发展，持续拉动国产算力适配优化，形成 “模型开源→硬件测试→生态完善→场景落地→硬件放量” 的正向循环。随着越来越多万亿产业模型完成国产化适配，国产算力硬件将彻底走出实验室，全面占领企业私有算力市场，为人形机器人产业大规模商用筑牢算力根基。