Open Responses 打响开源推理新标准,助力智能体时代

背景:从聊天到智能体的转变
随着大模型技术的成熟,开发者正从单轮对话的 Chat Completion 向能够 推理、规划、执行多步骤任务 的智能体(Agent)迁移。传统的聊天格式天生为回合制设计,难以直接支持工具调用、子任务循环等复杂工作流。这一痛点促使业界呼唤一种 开放、统一的推理标准,以降低不同模型提供商之间的集成成本。
什么是 Open Responses?
Open Responses 由 OpenAI 在 2025 年推出的 Responses API 延伸而来,经过社区开源改造后形成的公共规范。其核心特征包括:
- 无状态默认:请求完成即返回结果,必要时支持加密推理(encrypted reasoning)。
- 统一模型配置:所有模型遵循同一套参数描述,便于跨平台调参。
- 语义流式事件:流式输出不再是纯文本或对象差分,而是结构化的 reasoning delta、summary 等事件,提升可观测性。
- 可扩展的工具集成:原生支持内部工具(如文件搜索)与外部工具(自定义函数、MCP 服务器),并可在同一次请求中循环调用。
“Open Responses 的目标是让开发者像调用普通函数一样调用智能体,而不必纠结底层的协议细节。” — Hugging Face 官方博客
如何使用 – 简单示例
下面展示一次基于 cURL 的调用方式(实际使用时可通过 Hugging Face Spaces 的代理端点进行路由):
curl https://evalstate-openresponses.hf.space/v1/responses
-H "Content-Type: application/json"
-H "Authorization: Bearer $HF_TOKEN"
-H "OpenResponses-Version: latest"
-d '{
"model": "moonshotai/Kimi-K2-Thinking:nebius",
"input": "解释一下光合作用的原理",
"stream": true
}'
在 stream 模式下,服务器会持续发送类似下列的 reasoning delta 事件:
{ "event": "response.reasoning.delta", "data": { "delta": "用户询问光合作用,模型开始检索植物叶绿体结构..." } }
如果模型只返回摘要或加密内容,则事件名会变为 response.reasoning_summary_text.delta,确保向后兼容。
对客户端与提供商的影响
客户端
- 迁移成本低:已实现 Responses API 的客户端只需调整字段名即可兼容。
- 更丰富的可观测性:通过
content、encrypted_content、summary三层结构,开发者可以选择性查看原始推理、加密推理或摘要。
模型提供商
- 实现简单:若已有 Responses 兼容层,只需公开额外的
content字段即可。 - 工具循环统一化:提供商可在平台内部完成工具调用、结果反馈,客户端无需自行编排子任务。
路由层的角色
Open Responses 将 模型提供商 与 路由器 明确区分。路由器可以在一次请求中根据 provider 参数选择不同的后端模型,并注入特定的 API 配置,实现 多模型混搭、负载均衡 与 功能扩展。例如:
{
"model": "zai-org/GLM-4.7",
"input": "查找 Q3 销售数据并发送邮件给团队",
"tools": [...],
"max_tool_calls": 5,
"tool_choice": "auto",
"provider": "openai"
}
子代理循环(Sub‑Agent Loops)
Open Responses 为典型的 推理‑工具调用‑继续推理 循环提供了统一的协议。整个过程如下:
1️⃣ 接收用户请求并生成首轮推理;
2️⃣ 若出现工具调用指令,API 自动执行(内部或外部);
3️⃣ 将工具返回结果回填模型,继续推理;
4️⃣ 循环至模型输出 finish 信号或达到 max_tool_calls 上限。
这样,“搜索文档 → 摘要 → 起草邮件” 只需一次 HTTP 调用即可完成,极大简化了开发者的集成工作。
展望与下一步
Open Responses 仍在持续迭代中,未来计划:
- 引入 视频生成、多模态 扩展点;
- 与 OpenAI Responses 完全兼容,实现跨平台互操作;
- 开放 社区插件,允许第三方在路由层添加自定义调度逻辑。
社区已经可以在 Hugging Face Spaces 体验早期版本,感兴趣的开发者可通过 Open Responses Compliance Tool 验证实现是否符合规范。
结语:Open Responses 不仅是一套技术协议,更是推动 AI 推理走向开放、标准化的重要里程碑。它为智能体工作流提供了可靠的底层支撑,帮助研发者把注意力聚焦于业务创新,而非接口细节。