当地时间 6 月 26 日,OpenAI 正式对外公布与博通联合定制的专用 ASIC 推理芯片 Jalapeño。这款面向大语言模型推理负载的专用芯片,从架构设计到台积电 3nm 流片量产,全程仅耗时 9 个月,创下 AI 定制芯片开发周期的行业新纪录。根据双方公开实测数据,在 GPT-5.3 代码模型的推理场景下,该芯片单位算力成本较通用 GPU 降低 50% 以上,能效密度实现跨越式提升。OpenAI 硬件团队在沟通会上表示,通用图形处理器在大模型持续推理业务中存在大量算力冗余,数据反复搬运带来极高能耗,专用 ASIC 才是降低千亿级用户服务成本的长期解决方案。
2025 年 OpenAI 全年服务器运维成本已经达到 84 亿美元。随着产品向多模态升级、智能体实现全天候在线运行,多家机构预测,2026 年企业全年算力开支将突破 140 亿美元。持续走高的硬件成本,倒逼头部模型企业向上游硬件环节延伸布局。在此之前,亚马逊 Trainium 系列、谷歌 TPU、微软 Maia 系列早已完成自研芯片的多轮内部迭代。如今 OpenAI 正式入局芯片自研,意味着全球头部 AI 企业全部开启 “模型 + 芯片” 全栈垂直整合,人工智能产业竞争正式从算法层下沉到硬件基础设施层面。
从产品定位来看,Jalapeño 主动舍弃了 GPU 的通用计算能力,所有硬件单元都针对大模型稀疏计算、长文本上下文读取做定向架构优化,大幅缩减内存与处理器之间的数据交换损耗。目前工程样片已经完成多轮 7×24 小时压力测试。企业规划在 2026 年四季度,将芯片送入微软合作数据中心开展小规模部署,2027 年建成吉瓦级算力集群实现批量落地。博通 CEO 在合作发布会中透露,未来双方还会迭代两代衍生芯片,分别面向移动端边缘推理与多模态视频生成业务,持续拓宽专用芯片的应用边界。
当前全球 ASIC 产业迎来集中爆发窗口。高盛最新行业报告预测,到 2027 年,AI 专用 ASIC 的市场需求规模将与通用 GPU 平分市场份额。云计算厂商、大模型实验室持续加码定制芯片,会进一步压缩第三方通用芯片厂商的增量空间。对于国内半导体产业而言,头部大模型企业与本土芯片设计公司开展联合定制开发,将成为接下来两年最重要的产业机会。寒武纪、壁仞科技等厂商已经推出多款推理 ASIC 产品,并且在政企智算中心落地试用。后续企业需要持续打磨软硬件适配能力,抓住国产大模型降本带来的芯片采购红利。
与此同时,定制芯片爆发也会倒逼晶圆代工产能持续紧张,台积电 3nm、2nm 订单已经排至 2028 年。韩国政府联合三星、SK 海力士紧急推出万亿级晶圆厂扩建计划,未来数年新建四座先进制程工厂,目标将 DRAM 存储产能在五年内实现翻倍,保障全球 AI 芯片生产供给稳定。全球半导体行业正式进入 “算力需求拉动产能扩张” 的强周期,AI 芯片产业链上下游将长期维持高景气度。