7 月 1 日,美团人工智能实验室正式开源 1.6 万亿参数 MoE 稀疏大模型,面向零售调度、仓储机器人、本地生活智能决策等产业场景开放权重与代码。值得关注的是,整轮模型训练、后续推理测试全程没有使用海外高端 GPU,全部依托国产 AI 加速器集群完成,完整验证了国产算力硬件支撑万亿级大模型全链路运行的可行性。这次开源事件,成为国产算力生态一次大规模实战演练。
MoE 稀疏模型已经成为当前万亿参数大模型的主流技术路线。相比稠密大模型,稀疏架构只激活部分网络参数,训练与推理成本大幅下降,非常适合企业级产业应用。美团本次开源的万亿模型,主要面向线下实体经济场景,能够优化外卖运力调度、仓储机器人路径规划、门店智能排班,直接落地实体经济智能化改造。在此之前,绝大多数开源万亿大模型都依托海外 GPU 集群训练,国产硬件只能承接小规模推理任务,很难完整跑完完整训练流程。
项目技术负责人介绍,团队针对国产推理芯片深度优化算子,对模型网络结构做轻量化裁剪,适配国产硬件的显存带宽与计算单元特性。经过反复调试,整套模型在国产加速器集群上稳定完成多轮迭代训练,推理吞吐能力达到商用落地标准。开源之后,全国数千家产业 AI 团队都可以下载模型,在国产算力服务器上直接部署运行,大范围拉动国产芯片的软件生态适配。
开源大模型正在成为培育国产算力生态最重要的载体。过去国产芯片硬件参数达标,但是缺少适配的大模型,大量硬件算力被闲置。海量开源产业模型普及之后,开发者会持续优化算子、驱动与编译框架,倒逼软硬件不断磨合迭代。随着百川、DeepSeek、美团等多款万亿开源模型陆续完成国产硬件适配,本土算力软件短板正在快速补齐。
产业落地场景也随之打开。仓储人形机器人、分拣机械臂、园区无人车,都可以接入这套调度大模型,依靠厂区本地国产算力节点完成实时决策。终端机器人只负责运动执行,复杂智能运算交给边缘算力集群,既降低机器人本体造价,又保障数据安全。零售、物流行业机器人规模化部署,会持续释放大量边缘推理芯片订单,为国产 ASIC 带来长期增量需求。
资本市场也敏锐捕捉到这一变化,AI 芯片板块迎来新一轮资金布局。行业逻辑已经从 “硬件性能比拼” 转向 “软硬件生态闭环”。开源大模型繁荣发展,持续拉动国产算力适配优化,形成 “模型开源→硬件测试→生态完善→场景落地→硬件放量” 的正向循环。随着越来越多万亿产业模型完成国产化适配,国产算力硬件将彻底走出实验室,全面占领企业私有算力市场,为人形机器人产业大规模商用筑牢算力根基。