全新认知蓝图驱动的代理运行时框架发布,赋能记忆与工具验证
•4 阅读•4分钟•开源
LLMTool RegistryCognitive BlueprintMemory Management
•4 阅读•4分钟•开源
背景概述
随着大模型在推理、代码、数据分析等场景的广泛落地,单轮对话已难以满足多步骤任务的需求。MarkTechPost 团队基于 Auton 思想,推出了 认知蓝图(Cognitive Blueprint)驱动的运行时框架,实现了从任务分解到工具调用、结果校验的完整闭环。
核心组件
- Blueprint Identity:定义代理的名称、版本、描述及作者信息,便于多蓝图之间的可移植性。
- Goals & Constraints:明确任务目标与约束,例如禁止捏造数据、必须进行结果验证等。
- Planning Strategy:支持
sequential、hierarchical、reactive三种规划方式,配合max_steps与max_retries控制执行深度。 - Memory Management:提供
short_term、episodic、persistent三种记忆类型,并在历史对话超出summarize_after后自动压缩摘要,降低算力消耗。 - Tool Registry:统一注册外部工具(calculator、unit_converter、date_calculator、statistics_engine 等),每个工具携带参数说明与返回格式,运行时可动态查询。
- Validation Layer:依据蓝图中
min_response_length、forbidden_phrases与require_reasoning进行答案质量检查,确保输出具备可解释性。
运行流程
- 任务输入 → 记忆管理器返回包含系统提示、历史摘要的消息列表。
- 规划阶段:LLM 根据蓝图生成结构化的 JSON 计划,每一步包括描述、所需工具、参数及推理理由。
- 执行阶段:遍历计划,若指定工具则调用
ToolRegistry,否则让 LLM 直接完成推理;每一步结果实时记录并反馈给后续步骤。 - 合成阶段:将所有步骤结果拼接,使用 LLM 生成最终答案。
- 验证阶段:依据蓝图规则检测答案长度、禁用词以及推理痕迹,若未通过则触发重试机制。
示例:在
ResearchBot蓝图下,用户提问「每步 20 cm 高度需要多少步?」系统会先规划计算步数、再调用calculator完成数值运算,最后通过验证确保答案包含完整的计算过程。
案例展示
- ResearchBot:侧重数学推理与外部搜索,内置
calculator、unit_converter、search_wikipedia_stub三个工具。 - DataAnalystBot:专注统计分析,配备
statistics_engine与list_sorter,并限制仅处理数值数据。
两者共享同一套运行时,只通过更换蓝图 YAML 即可实现行为差异,展示了框架的高度可组合性。
影响与展望
该框架的开源发布为学术研究与企业落地提供了统一的基座:
- 降低门槛:开发者无需从零搭建工具注册、记忆压缩等基础设施,直接聚焦业务逻辑。
- 提升安全性:内置验证层可在生成答案前捕获潜在错误或不当表述,符合企业对 AI 可控性的基本要求。
- 促进生态:框架采用 Pydantic 与 Enum 严格定义数据结构,易于社区贡献新工具或蓝图模板。
未来计划加入 可视化调度面板、多模态工具(如图像分析)以及 自适应规划策略,进一步推动 agentic AI 向通用智能迈进。
获取方式
项目已在 GitHub 公开,完整代码、示例蓝图以及使用文档均可免费获取。欢迎社区提交 PR,共同完善 Agentic AI 的基石设施。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。