全新认知蓝图驱动的代理运行时框架发布,赋能记忆与工具验证

4 阅读4分钟开源

背景概述

随着大模型在推理、代码、数据分析等场景的广泛落地,单轮对话已难以满足多步骤任务的需求。MarkTechPost 团队基于 Auton 思想,推出了 认知蓝图(Cognitive Blueprint)驱动的运行时框架,实现了从任务分解到工具调用、结果校验的完整闭环。

核心组件

  • Blueprint Identity:定义代理的名称、版本、描述及作者信息,便于多蓝图之间的可移植性。
  • Goals & Constraints:明确任务目标与约束,例如禁止捏造数据、必须进行结果验证等。
  • Planning Strategy:支持 sequentialhierarchicalreactive 三种规划方式,配合 max_stepsmax_retries 控制执行深度。
  • Memory Management:提供 short_termepisodicpersistent 三种记忆类型,并在历史对话超出 summarize_after 后自动压缩摘要,降低算力消耗。
  • Tool Registry:统一注册外部工具(calculator、unit_converter、date_calculator、statistics_engine 等),每个工具携带参数说明与返回格式,运行时可动态查询。
  • Validation Layer:依据蓝图中 min_response_lengthforbidden_phrasesrequire_reasoning 进行答案质量检查,确保输出具备可解释性。

运行流程

  1. 任务输入 → 记忆管理器返回包含系统提示、历史摘要的消息列表。
  2. 规划阶段:LLM 根据蓝图生成结构化的 JSON 计划,每一步包括描述、所需工具、参数及推理理由。
  3. 执行阶段:遍历计划,若指定工具则调用 ToolRegistry,否则让 LLM 直接完成推理;每一步结果实时记录并反馈给后续步骤。
  4. 合成阶段:将所有步骤结果拼接,使用 LLM 生成最终答案。
  5. 验证阶段:依据蓝图规则检测答案长度、禁用词以及推理痕迹,若未通过则触发重试机制。

示例:在 ResearchBot 蓝图下,用户提问「每步 20 cm 高度需要多少步?」系统会先规划计算步数、再调用 calculator 完成数值运算,最后通过验证确保答案包含完整的计算过程。

案例展示

  • ResearchBot:侧重数学推理与外部搜索,内置 calculatorunit_convertersearch_wikipedia_stub 三个工具。
  • DataAnalystBot:专注统计分析,配备 statistics_enginelist_sorter,并限制仅处理数值数据。

两者共享同一套运行时,只通过更换蓝图 YAML 即可实现行为差异,展示了框架的高度可组合性。

影响与展望

该框架的开源发布为学术研究与企业落地提供了统一的基座:

  • 降低门槛:开发者无需从零搭建工具注册、记忆压缩等基础设施,直接聚焦业务逻辑。
  • 提升安全性:内置验证层可在生成答案前捕获潜在错误或不当表述,符合企业对 AI 可控性的基本要求。
  • 促进生态:框架采用 Pydantic 与 Enum 严格定义数据结构,易于社区贡献新工具或蓝图模板。

未来计划加入 可视化调度面板多模态工具(如图像分析)以及 自适应规划策略,进一步推动 agentic AI 向通用智能迈进。

获取方式

项目已在 GitHub 公开,完整代码、示例蓝图以及使用文档均可免费获取。欢迎社区提交 PR,共同完善 Agentic AI 的基石设施。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。