Open Responses 打响开源推理新标准，助力智能体时代

背景：从聊天到智能体的转变

随着大模型技术的成熟，开发者正从单轮对话的 Chat Completion 向能够 推理、规划、执行多步骤任务 的智能体（Agent）迁移。传统的聊天格式天生为回合制设计，难以直接支持工具调用、子任务循环等复杂工作流。这一痛点促使业界呼唤一种 开放、统一的推理标准，以降低不同模型提供商之间的集成成本。

什么是 Open Responses？

Open Responses 由 OpenAI 在 2025 年推出的 Responses API 延伸而来，经过社区开源改造后形成的公共规范。其核心特征包括：

无状态默认：请求完成即返回结果，必要时支持加密推理（encrypted reasoning）。
统一模型配置：所有模型遵循同一套参数描述，便于跨平台调参。
语义流式事件：流式输出不再是纯文本或对象差分，而是结构化的 reasoning delta、summary 等事件，提升可观测性。
可扩展的工具集成：原生支持内部工具（如文件搜索）与外部工具（自定义函数、MCP 服务器），并可在同一次请求中循环调用。

“Open Responses 的目标是让开发者像调用普通函数一样调用智能体，而不必纠结底层的协议细节。” — Hugging Face 官方博客

如何使用 – 简单示例

下面展示一次基于 cURL 的调用方式（实际使用时可通过 Hugging Face Spaces 的代理端点进行路由）：

curl https://evalstate-openresponses.hf.space/v1/responses 
  -H "Content-Type: application/json" 
  -H "Authorization: Bearer $HF_TOKEN" 
  -H "OpenResponses-Version: latest" 
  -d '{
        "model": "moonshotai/Kimi-K2-Thinking:nebius",
        "input": "解释一下光合作用的原理",
        "stream": true
      }'

在 stream 模式下，服务器会持续发送类似下列的 reasoning delta 事件：

{ "event": "response.reasoning.delta", "data": { "delta": "用户询问光合作用，模型开始检索植物叶绿体结构..." } }

如果模型只返回摘要或加密内容，则事件名会变为 response.reasoning_summary_text.delta，确保向后兼容。

对客户端与提供商的影响

客户端

迁移成本低：已实现 Responses API 的客户端只需调整字段名即可兼容。
更丰富的可观测性：通过 content、encrypted_content、summary 三层结构，开发者可以选择性查看原始推理、加密推理或摘要。

模型提供商

实现简单：若已有 Responses 兼容层，只需公开额外的 content 字段即可。
工具循环统一化：提供商可在平台内部完成工具调用、结果反馈，客户端无需自行编排子任务。

路由层的角色

Open Responses 将 模型提供商 与 路由器 明确区分。路由器可以在一次请求中根据 provider 参数选择不同的后端模型，并注入特定的 API 配置，实现 多模型混搭、负载均衡 与 功能扩展。例如：

{
  "model": "zai-org/GLM-4.7",
  "input": "查找 Q3 销售数据并发送邮件给团队",
  "tools": [...],
  "max_tool_calls": 5,
  "tool_choice": "auto",
  "provider": "openai"
}

子代理循环（Sub‑Agent Loops）

Open Responses 为典型的 推理‑工具调用‑继续推理 循环提供了统一的协议。整个过程如下： 1️⃣ 接收用户请求并生成首轮推理； 2️⃣ 若出现工具调用指令，API 自动执行（内部或外部）； 3️⃣ 将工具返回结果回填模型，继续推理； 4️⃣ 循环至模型输出 finish 信号或达到 max_tool_calls 上限。

这样，“搜索文档 → 摘要 → 起草邮件” 只需一次 HTTP 调用即可完成，极大简化了开发者的集成工作。

展望与下一步

Open Responses 仍在持续迭代中，未来计划：

引入 视频生成、多模态 扩展点；
与 OpenAI Responses 完全兼容，实现跨平台互操作；
开放 社区插件，允许第三方在路由层添加自定义调度逻辑。

社区已经可以在 Hugging Face Spaces 体验早期版本，感兴趣的开发者可通过 Open Responses Compliance Tool 验证实现是否符合规范。

结语：Open Responses 不仅是一套技术协议，更是推动 AI 推理走向开放、标准化的重要里程碑。它为智能体工作流提供了可靠的底层支撑，帮助研发者把注意力聚焦于业务创新，而非接口细节。