OpenAI发布GPT-5.3-Codex 将编程代理提升至全流程高效时代

关键发布要点

模型定位：首款同时具备高级代码生成与通用推理的代理模型，面向软件工程全生命周期。
性能提升：在SWE‑Bench Pro、Terminal‑Bench 2.0、OSWorld‑Verified等四大基准上刷新纪录，整体速度提升约25%。
交互方式：Codex App 支持实时跟踪、对话式指令和进度更新，用户可在模型运行时即时干预。
安全防护：首次被划为“高危能力”模型，配备完整的网络安全安全栈和可信访问计划。
可用渠道：已在ChatGPT付费计划、Codex App、CLI、IDE 插件等全链路上线，API 访问即将开放。

领先的编码性能

GPT‑5.3‑Codex 在 SWE‑Bench Pro（覆盖四种语言）取得 56.8% 的最高得分，较前代提升 0.4%。在 Terminal‑Bench 2.0 中得分 64.0%，显示出卓越的终端指令执行能力。更重要的是，它在 OSWorld‑Verified（视觉驱动的桌面任务）中以 64.7% 超越人类水平（约 72%），证明了模型在真实电脑环境中的自主操作能力。

“GPT‑5.3‑Codex 不仅能写代码，还能自行调试、部署，真正成为开发者的‘副手’。” — OpenAI 技术博客

端到端工作流与交互

全流程支持：从需求分析、PRD 编写、代码实现、单元测试到部署监控，模型均可提供相应输出。
实时协作：在 Codex App 中开启 Follow‑up behavior，模型会在执行过程中持续汇报关键决策，用户可随时提出修改指令。
案例展示：模型自行迭代完成两款游戏（赛车与潜水），以及多个企业级落地页，均在数百万 token 交互后交付可玩产品。

安全与网络防护

OpenAI 将 GPT‑5.3‑Codex 列为 High‑capability 的网络安全模型，专门训练识别软件漏洞并内置多层安全审计。同步推出 Trusted Access for Cyber 试点计划，向合规的安全研究团队提供专属 API 额度与漏洞扫描工具。2023 年启动的 $1M 网络安全基金 本次升级至 $10M API 额度，扶持开源项目和关键基础设施的防御研发。

可用性与后续展望

部署环境：模型在 NVIDIA GB200 NVL72 超算平台上训练并服务，得益于合作伙伴 NVIDIA 的高效算力支持。
加速计划：未来将在 API 端提供更细粒度的“代理调度”功能，帮助企业构建多模型协同工作流。
长期目标：OpenAI 表示，GPT‑5.3‑Codex 的研发是向通用计算助手迈出的关键一步，后续将进一步拓展至数据分析、文档生成等非编码任务，实现真正的全域知识工作代理。

结语：GPT‑5.3‑Codex 的发布标志着 AI 编程代理从“代码生成”向“全流程协作”跃迁，为企业研发效率注入新动能，也为安全治理提出了更高的标准。