OpenAI联手Broadcom发布Jalapeño芯片助力LLM推理效率跃升

关键亮点

九个月极速流片：从概念到生产仅用九个月，创下高性能芯片研发速度纪录。
性能/功耗领先：早期测试显示，Jalapeño在每瓦性能上远超业界最先进的LLM推理加速器。
全栈协同设计：OpenAI提供模型、内核、服务系统的完整需求，Broadcom负责硅实现、网络互联，Celestica负责板卡与机架集成。
多代平台规划：首代预计2026年底部署，后续将形成多代可扩展计算平台，支撑未来更大规模的模型推理。

技术创新

Jalapeño采用“空白画布”架构，专为现代大语言模型的推理工作负载打造，而非改造通用AI加速器。其核心设计围绕以下三大要素：

数据移动最小化：通过细粒度的内存层次调度和专用网络接口，显著降低跨芯片带宽需求。
计算‑内存‑网络平衡：在算力、缓存容量和高速互联之间实现近理论峰值利用率，提升交互式推理的响应速度。
模型无关性：虽基于OpenAI对GPT‑5.3‑Codex‑Spark的深度洞察，但保持对所有主流LLM（包括开源模型）的兼容性。

产业影响

OpenAI此举标志着其从“模型‑产品”向“模型‑产品‑基础设施”全链路布局的关键一步。

成本下降：更高的功耗效率直接降低数据中心的运营费用，使API调用和企业级部署的成本进一步收敛。
可靠性提升：专用硬件的延迟与吞吐优势，使得交互式对话、代码生成等实时场景的卡顿率显著下降。
生态加速：与Broadcom的合作将芯片、网络与系统层面深度捆绑，为微软等云服务商在2026年实现千瓦级AI算力部署提供了现成方案。

未来展望

OpenAI首席总裁Greg Brockman 表示，Jalapeño是“计算驱动经济”下的基础设施支柱，未来将继续投入多代芯片研发，以实现更大规模的模型服务。Broadcom 总裁兼CEO Hock Tan 亦强调，此项目是双方在AI硬件领域的长期承诺，后续将围绕更高带宽的Tomahawk网络硅和更大规模的机架系统展开合作。

在AI算力竞争日益激烈的背景下，OpenAI与Broadcom的深度协同或将重新定义大模型推理的成本曲线，为行业提供更具可持续性的增长路径。

“我们通过自行设计更多堆栈，能够以更高效率提供智能服务”，Greg Brockman 在发布会上如是说。

随着Jalapeño进入千瓦级数据中心部署阶段，业内普遍预期，下一代ChatGPT和Agent产品将在响应速度、可用性以及成本控制方面实现质的跨越。

OpenAI联手Broadcom发布Jalapeño芯片 助力LLM推理效率跃升

关键亮点

技术创新

产业影响

未来展望

标签分类

OpenAI联手Broadcom发布Jalapeño芯片助力LLM推理效率跃升