OpenAI联手Broadcom发布Jalapeño芯片 助力LLM推理效率跃升

3 阅读3分钟视野
OpenAI联手Broadcom发布Jalapeño芯片 助力LLM推理效率跃升

关键亮点

  • 九个月极速流片:从概念到生产仅用九个月,创下高性能芯片研发速度纪录。
  • 性能/功耗领先:早期测试显示,Jalapeño在每瓦性能上远超业界最先进的LLM推理加速器。
  • 全栈协同设计:OpenAI提供模型、内核、服务系统的完整需求,Broadcom负责硅实现、网络互联,Celestica负责板卡与机架集成。
  • 多代平台规划:首代预计2026年底部署,后续将形成多代可扩展计算平台,支撑未来更大规模的模型推理。

技术创新

Jalapeño采用“空白画布”架构,专为现代大语言模型的推理工作负载打造,而非改造通用AI加速器。其核心设计围绕以下三大要素:

  1. 数据移动最小化:通过细粒度的内存层次调度和专用网络接口,显著降低跨芯片带宽需求。
  2. 计算‑内存‑网络平衡:在算力、缓存容量和高速互联之间实现近理论峰值利用率,提升交互式推理的响应速度。
  3. 模型无关性:虽基于OpenAI对GPT‑5.3‑Codex‑Spark的深度洞察,但保持对所有主流LLM(包括开源模型)的兼容性。

产业影响

OpenAI此举标志着其从“模型‑产品”向“模型‑产品‑基础设施”全链路布局的关键一步。

  • 成本下降:更高的功耗效率直接降低数据中心的运营费用,使API调用和企业级部署的成本进一步收敛。
  • 可靠性提升:专用硬件的延迟与吞吐优势,使得交互式对话、代码生成等实时场景的卡顿率显著下降。
  • 生态加速:与Broadcom的合作将芯片、网络与系统层面深度捆绑,为微软等云服务商在2026年实现千瓦级AI算力部署提供了现成方案。

未来展望

OpenAI首席总裁Greg Brockman 表示,Jalapeño是“计算驱动经济”下的基础设施支柱,未来将继续投入多代芯片研发,以实现更大规模的模型服务。Broadcom 总裁兼CEO Hock Tan 亦强调,此项目是双方在AI硬件领域的长期承诺,后续将围绕更高带宽的Tomahawk网络硅和更大规模的机架系统展开合作。

在AI算力竞争日益激烈的背景下,OpenAI与Broadcom的深度协同或将重新定义大模型推理的成本曲线,为行业提供更具可持续性的增长路径。

“我们通过自行设计更多堆栈,能够以更高效率提供智能服务”,Greg Brockman 在发布会上如是说。

随着Jalapeño进入千瓦级数据中心部署阶段,业内普遍预期,下一代ChatGPT和Agent产品将在响应速度、可用性以及成本控制方面实现质的跨越。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。