Nous Research发布Hermes Agent 实现持久记忆与远程终端持续协作
背景与意义
在当前的生成式AI生态中,绝大多数对话代理都是“瞬时代理”,每次会话都从零开始,缺乏跨会话的状态保持。开发者虽然可以借助LLM完成复杂代码编写,但在实际部署时仍需手动管理终端、容器和远程服务器,导致“执行鸿沟”。Hermes Agent旨在用持久记忆和真实机器访问填补这一空白,为AI开发者提供真正的协作伙伴。
多层记忆体系
- 短期记忆:在单轮推理中使用标准的上下文窗口完成即时任务。
- 技能文档(Skill Documents):任务完成后,系统会将成功的工作流抽象为可搜索的 Markdown 文件,遵循 agentskills.io 开放标准。
- 长期记忆:下次遇到相似任务时,Agent 会检索对应的 Skill Document,直接复用已有步骤,避免从头推理。
这种层级记忆模拟了程序员的经验积累,使得Agent能够在数周甚至数月内保持对特定代码库、配置和偏好的一致理解。
持久终端访问
Hermes Agent突破传统RAG的碎片化检索,提供五种后端支持的持久机器访问:
- 本地(Local):直接操作宿主机器文件系统。
- Docker:安全的容器化执行环境。
- SSH:远程登录云服务器或物理机。
- Singularity:面向高性能计算(HPC)集群的容器。
- Modal:无服务器弹性计算,适合大规模数据处理。
这些后端让Agent能够在远程服务器上启动长期的EDA、模型训练或批处理任务,离线后再次连接时仍能保持终端状态、后台进程和文件变更。
Hermes Gateway:全渠道交互
为提升可达性,Nous Research 为Agent构建了统一的 Gateway,可嵌入Telegram、Discord、Slack、WhatsApp 等常用沟通工具。用户可以在工作站发起任务,随后在手机收到“任务完成”或“进度更新”的通知,并通过文字或语音指令继续交互,真正实现“口袋中的AI助理”。
技术细节与训练
Hermes Agent 的核心模型为 Hermes‑3,基于 Llama 3.1 架构,并使用名为 Atropos 的强化学习框架进行微调。Atropos 专注于工具调用精度和长程规划,使Agent在多步部署场景中不易失误。系统整体遵循 ReAct(Reasoning‑Act)循环:观察终端输出 → 推理目标匹配 → 执行动作。该循环在实际工程任务中表现出高可解释性和可靠性。
市场前景与影响
Hermes Agent 的开源发布为开发者社区提供了可直接落地的持久化代理框架,降低了AI工具链的集成成本。随着企业对DevOps自动化和AI‑augmented 编程需求的增长,具备长期记忆与真实机器交互能力的代理有望成为下一代生产力工具的核心组件。Nous Research 通过 GitHub 完全开源代码,并邀请社区贡献 Skill Document 标准,进一步推动生态共建。
“Hermes Agent 不再是一次性对话,而是可以‘成长’的同事。”——Nous Research 官方博客
未来,随着更多企业接入 Hermes Gateway,跨平台、跨团队的协同将更加顺畅,也为 LLM 在软件工程领域的深度渗透奠定了基础。