OpenAI发布GPT-5.3-Codex 将编程代理提升至全流程高效时代

24 阅读4分钟前沿
OpenAI发布GPT-5.3-Codex 将编程代理提升至全流程高效时代

关键发布要点

  • 模型定位:首款同时具备高级代码生成与通用推理的代理模型,面向软件工程全生命周期。
  • 性能提升:在SWE‑Bench Pro、Terminal‑Bench 2.0、OSWorld‑Verified等四大基准上刷新纪录,整体速度提升约25%。
  • 交互方式:Codex App 支持实时跟踪、对话式指令和进度更新,用户可在模型运行时即时干预。
  • 安全防护:首次被划为“高危能力”模型,配备完整的网络安全安全栈和可信访问计划。
  • 可用渠道:已在ChatGPT付费计划、Codex App、CLI、IDE 插件等全链路上线,API 访问即将开放。

领先的编码性能

GPT‑5.3‑Codex 在 SWE‑Bench Pro(覆盖四种语言)取得 56.8% 的最高得分,较前代提升 0.4%。在 Terminal‑Bench 2.0 中得分 64.0%,显示出卓越的终端指令执行能力。更重要的是,它在 OSWorld‑Verified(视觉驱动的桌面任务)中以 64.7% 超越人类水平(约 72%),证明了模型在真实电脑环境中的自主操作能力。

“GPT‑5.3‑Codex 不仅能写代码,还能自行调试、部署,真正成为开发者的‘副手’。” — OpenAI 技术博客

端到端工作流与交互

  • 全流程支持:从需求分析、PRD 编写、代码实现、单元测试到部署监控,模型均可提供相应输出。
  • 实时协作:在 Codex App 中开启 Follow‑up behavior,模型会在执行过程中持续汇报关键决策,用户可随时提出修改指令。
  • 案例展示:模型自行迭代完成两款游戏(赛车与潜水),以及多个企业级落地页,均在数百万 token 交互后交付可玩产品。

安全与网络防护

OpenAI 将 GPT‑5.3‑Codex 列为 High‑capability 的网络安全模型,专门训练识别软件漏洞并内置多层安全审计。同步推出 Trusted Access for Cyber 试点计划,向合规的安全研究团队提供专属 API 额度与漏洞扫描工具。2023 年启动的 $1M 网络安全基金 本次升级至 $10M API 额度,扶持开源项目和关键基础设施的防御研发。

可用性与后续展望

  • 部署环境:模型在 NVIDIA GB200 NVL72 超算平台上训练并服务,得益于合作伙伴 NVIDIA 的高效算力支持。
  • 加速计划:未来将在 API 端提供更细粒度的“代理调度”功能,帮助企业构建多模型协同工作流。
  • 长期目标:OpenAI 表示,GPT‑5.3‑Codex 的研发是向通用计算助手迈出的关键一步,后续将进一步拓展至数据分析、文档生成等非编码任务,实现真正的全域知识工作代理。

结语:GPT‑5.3‑Codex 的发布标志着 AI 编程代理从“代码生成”向“全流程协作”跃迁,为企业研发效率注入新动能,也为安全治理提出了更高的标准。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。