Databricks推出GPT‑5.5 助力企业代理工作流精准度突破50%

2026/05/15 (周五)•23 阅读•3分钟•前沿

DatabricksGPT-5.5AgentBricksOfficeQA Pro

2026/05/15 (周五)•23 阅读•3分钟•前沿

Databricks推出GPT‑5.5 助力企业代理工作流精准度突破50%

背景与意义

Databricks 作为企业级数据与AI平台的领航者，一直致力于将前沿大模型落地到实际业务中。近期，随着生成式AI在企业内部流程自动化的需求激增，模型的解析准确性和多步骤推理能力成为制约因素。为此，Databricks 研发并发布了 GPT‑5.5，专注于提升在企业文档密集型任务中的表现。

GPT‑5.5 在 OfficeQA Pro 的突破

OfficeQA Pro 是 Databricks 自建的企业代理基准，模拟真实工作流中对扫描 PDF、遗留文件以及长上下文文档的解析、检索与推理。

准确率：首次突破 50% 大关，刷新了行业记录。
错误率：相比 GPT‑5.4 下降 46%，显著降低了因小数位提取错误导致的连锁失效。
检索与编排：在多步骤任务中，模型能够更精准地定位所需上下文，减少不必要的搜索迂回。

“GPT‑5.5 在解析老旧文档时出现了阶梯式提升，错误率大幅下降，这对我们在生产环境中的可靠性提升意义重大。” — Arnav Singhvi, Research Engineer

产品化落地

Databricks 将 GPT‑5.5 通过 AI Unity Gateway 向企业开放，配合以下两大工具实现完整工作流：

AgentBricks：模块化的代理构建框架，支持自定义解析、检索、执行三阶段流程。
Agent Supervisor API：提供对代理全链路的监控与调度，GPT‑5.5 负责统一调度与错误纠正。

在实际部署中，客户可在现有的 AgentBricks 流程中直接替换底层模型，无需改动业务逻辑，即可获得更高的解析成功率和更流畅的任务编排。

行业影响与展望

企业级AI可靠性提升：高准确率直接转化为业务成本下降，尤其在金融、法律等对文档精度要求极高的领域。
加速AI工作流标准化：通过统一的 Agent Supervisor API，行业将逐步形成可复用的代理组件生态。
模型迭代新标杆：GPT‑5.5 的性能提升展示了大模型在特定企业基准上的可量化进步，为后续的 GPT‑6 系列设定了更高的基准。

Databricks 表示，未来将继续深化模型在企业场景的适配，并计划在更多行业垂直领域推出针对性优化版本，推动生成式AI从实验室走向生产。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方，仅供参考使用。点击此处查看消息源。