OpenAI推出GPT‑5.4,打造万兆上下文与原生电脑使用的专业级前沿模型

1 阅读3分钟前沿
OpenAI推出GPT‑5.4,打造万兆上下文与原生电脑使用的专业级前沿模型

核心亮点

  • 万兆上下文:GPT‑5.4 首次在主流模型中实现 1 M token 长上下文,支持跨文档、跨页面的长链任务。
  • 原生电脑使用:模型可以直接在桌面环境中读取截图、点击 UI、键盘输入,实现完整的自动化工作流。
  • 工具搜索:在拥有海量工具库的场景下,模型仅在需要时检索工具定义,大幅降低 Token 消耗(实验显示削减约 47%)。
  • 强化编码:结合 GPT‑5.3‑Codex 的编码基因,提升代码生成、调试和 Playwright 交互的准确性。
  • 思考前置:ChatGPT 中的 Thinking 模式会先给出任务计划,用户可在中途调整方向,减少往返轮次。

性能评测

评测项目GPT‑5.4GPT‑5.3‑CodexGPT‑5.2人类基准
GDPval(44 职业)83.0%70.9%70.9%
OSWorld‑Verified(桌面)75.0%47.3%72.4%
BrowseComp(网页搜索)89.3% (Pro)77.3%65.8%
SWE‑Bench Pro(编码)57.7%55.6%

"GPT‑5.4 在内部基准上超越了所有竞争模型,尤其在文档密集型任务和多步骤工具使用上表现突出。"—— Brendan Foody, Mercor Capital

商业化与定价

  • ChatGPT:GPT‑5.4 Thinking 对 Plus、Team、Pro 用户全量开放;GPT‑5.4 Pro 仅限 Pro 与 Enterprise。
  • API:提供 gpt-5.4gpt-5.4-pro 两个入口,后者在吞吐量与延迟上进一步优化。
  • 价格:每百万 Token 输入 $2.50,输出 $0.25;Pro 版分别为 $30 / $180。得益于更高的 Token 效率,实际成本往往低于前代模型。
  • 增值工具:同步上线的 ChatGPT for Excel 插件、Codex 中的文档与幻灯片技能,帮助企业快速迁移现有办公流程。

市场影响与前景

GPT‑5.4 的发布标志着大模型从“语言‑+‑视觉”向“语言‑+‑视觉‑+‑动作”全面跨模态的关键跃迁。

  • 企业级自动化:能够在几秒钟内完成财务模型、法律文书、产品路演等高价值输出,显著压缩人力成本。
  • 开发者生态:原生电脑使用与工具搜索让构建多步骤 Agent 成本大幅下降,预计会加速企业内部 AI 助手的落地。
  • 竞争格局:在 1 M token 上下文与原生电脑操作两大指标上领先竞争对手,可能迫使其他厂商加速相似功能的研发。

整体来看,GPT‑5.4 将成为专业人士的新“生产力引擎”,并为 OpenAI 在高端企业市场争夺份额奠定技术优势。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。