OpenAI 联合博通推出 Jalapeño 推理芯片，大模型厂商自研芯片正式进入落地期

首页

资讯

------

科技资讯

2026-07-01 09:39:53

当地时间 6 月 26 日，OpenAI 正式对外公布与博通联合定制的专用 ASIC 推理芯片 Jalapeño。这款面向大语言模型推理负载的专用芯片，从架构设计到台积电 3nm 流片量产，全程仅耗时 9 个月，创下 AI 定制芯片开发周期的行业新纪录。根据双方公开实测数据，在 GPT-5.3 代码模型的推理场景下，该芯片单位算力成本较通用 GPU 降低 50% 以上，能效密度实现跨越式提升。OpenAI 硬件团队在沟通会上表示，通用图形处理器在大模型持续推理业务中存在大量算力冗余，数据反复搬运带来极高能耗，专用 ASIC 才是降低千亿级用户服务成本的长期解决方案。

2025 年 OpenAI 全年服务器运维成本已经达到 84 亿美元。随着产品向多模态升级、智能体实现全天候在线运行，多家机构预测，2026 年企业全年算力开支将突破 140 亿美元。持续走高的硬件成本，倒逼头部模型企业向上游硬件环节延伸布局。在此之前，亚马逊 Trainium 系列、谷歌 TPU、微软 Maia 系列早已完成自研芯片的多轮内部迭代。如今 OpenAI 正式入局芯片自研，意味着全球头部 AI 企业全部开启 “模型 + 芯片” 全栈垂直整合，人工智能产业竞争正式从算法层下沉到硬件基础设施层面。

从产品定位来看，Jalapeño 主动舍弃了 GPU 的通用计算能力，所有硬件单元都针对大模型稀疏计算、长文本上下文读取做定向架构优化，大幅缩减内存与处理器之间的数据交换损耗。目前工程样片已经完成多轮 7×24 小时压力测试。企业规划在 2026 年四季度，将芯片送入微软合作数据中心开展小规模部署，2027 年建成吉瓦级算力集群实现批量落地。博通 CEO 在合作发布会中透露，未来双方还会迭代两代衍生芯片，分别面向移动端边缘推理与多模态视频生成业务，持续拓宽专用芯片的应用边界。

当前全球 ASIC 产业迎来集中爆发窗口。高盛最新行业报告预测，到 2027 年，AI 专用 ASIC 的市场需求规模将与通用 GPU 平分市场份额。云计算厂商、大模型实验室持续加码定制芯片，会进一步压缩第三方通用芯片厂商的增量空间。对于国内半导体产业而言，头部大模型企业与本土芯片设计公司开展联合定制开发，将成为接下来两年最重要的产业机会。寒武纪、壁仞科技等厂商已经推出多款推理 ASIC 产品，并且在政企智算中心落地试用。后续企业需要持续打磨软硬件适配能力，抓住国产大模型降本带来的芯片采购红利。

与此同时，定制芯片爆发也会倒逼晶圆代工产能持续紧张，台积电 3nm、2nm 订单已经排至 2028 年。韩国政府联合三星、SK 海力士紧急推出万亿级晶圆厂扩建计划，未来数年新建四座先进制程工厂，目标将 DRAM 存储产能在五年内实现翻倍，保障全球 AI 芯片生产供给稳定。全球半导体行业正式进入 “算力需求拉动产能扩张” 的强周期，AI 芯片产业链上下游将长期维持高景气度。