真正有记忆的 AI Agent:Hermes 四层记忆系统揭秘
1. 闭环学习系统
所有你用过的 AI Agent 都有一个相同的问题:周一你教会它一些东西,周二它就忘得一干二净。你又回到起点,重新解释项目结构、偏好设置、工作流程。
Nous Research 构建的 Hermes Agent 就是为了终结这个循环。它是一个开源、自托管的 AI Agent,从完成的任务中学习,使用时间越长性能越好。自 2026 年 2 月发布以来,已经积累了 5,000+ GitHub Stars,活跃用户超过 2,000 人。
当 Hermes 成功完成一个任务时,它不只是记录结果然后继续。它会执行一个后执行评估:识别出确切的步骤序列、工具调用、推理模式,提取出通用的知识和模式,然后写出新的技能文档。
这就是 Nous Research 所说的封闭学习循环:
执行 → 评估 → 提取 → 精炼 → 检索
而且是复合增长的。根据 Nous Research 的基准测试,运行在社区技能集上的 Agent 经过数周的持续使用,任务成功率提高了 40%。你的 Hermes 实例在一个 $5 VPS 上跑了三个月后,它知道你的代码库结构、部署的怪癖、你偏好的 commit 信息格式、以及针对你的工作流最有效的 API 调用序列。
2. Skills 与 Tools 的架构区别
Hermes 做了一个关键性的架构区分:
- Tools(工具):通过 JSON Schema 暴露给 AI 模型的 Python 函数。确定性执行——浏览器自动化、文件操作、流处理。修改需要编辑源代码。
- Skills(技能):Markdown 文档。Agent 像读说明书一样读取并自主遵循记录的过程。关键点:Agent 可以自己编写技能,不需要修改源代码。
这意味着 Agent 可以变聪明而不碰自己的源代码。确定的工具层保持稳定和安全。知识层持续增长。两者在架构上完全分离。
3. 四层记忆系统
上下文管理是 Agent 设计的核心难题:太少上下文让 Agent 做错误决策,太多则烧 token、增加延迟、模型会忘记埋在长 prompt 里的指令。
Hermes 用四层记忆系统解决了这个矛盾:
Tier 1:Agent 的个人笔记(MEMORY.md)
存储环境事实、项目约定、操作经验。约 800 tokens,直接注入系统提示。跨会话持久。因为 Agent 会按照紧急程度和变更频率编辑这个文件(类似人类做笔记),所以它的内容始终保持精炼和相关。
Tier 2:用户档案(USER.md)
维护对你的认知:技术水平、时区、沟通风格。约 500 tokens,启动时注入。Agent 知道你是谁、你希望怎么被对待。
Tier 3:会话搜索(Session Search)
将所有历史会话归档到 SQLite 数据库。Agent 通过全文搜索 + LLM 摘要按需查询。这是大多数场景下你真正需要的记忆能力——它不需要提前加载,只在需要时检索。
Tier 4:外部记忆插件
接入基于图的检索系统如 LightRAG、Supermemory 或自定义向量数据库。面向企业级场景,支持跨会话、跨用户的知识共享。对大多数单服务器部署来说,Tier 3 已经足够。
冻结快照模式
前两层使用”Frozen Snapshot“模式:更改立即写入磁盘,但直到下次会话启动才修改活跃系统提示。这保护了语言模型在运行中的上下文稳定性——不会在对话中间突然改变 Agent 的行为。
定时推送机制
还有一个”Periodic Nudge“机制值得了解:Hermes 运行时主动在任务间隙提示 Agent 保存有价值的信息,不必等用户想起去存档。
4. Think Tool:思考后再行动
当处理复杂研究任务时,Hermes 首先调用 think_tool——一个强制性的策略停顿,迫使模型在行动之前制定一个实际的调查计划。然后并行执行。
ConductResearch 工具不是发送单个查询,而是把具体的研究主题委派给独立的子 Agent,每个子 Agent 拥有自己的干净上下文窗口和隔离的终端会话。
并行工作完成后,再次调用 think_tool——第二遍强制综合:评估返回的结果、检查缺口、判断目标是否达成。如果未达到,循环继续。
最终报告由多个模块化小报告合并而成(需要至少 64K token 窗口的模型)。
5. 安全:更保守的设计
与 OpenClaw 的对比在这里变得引人注目。
2026 年 3 月 18 日至 21 日,四天内 OpenClaw 曝出 9 个 CVE,包括一个 CVSS 9.9 的严重漏洞。到月底累计 15 个 CVE——约每天 2.2 个新漏洞。ClawHub 市场中安全公司确认有 1,184 个恶意技能(约五分之一)。SecurityScorecard 在 GitHub 上发现了超过 3,400 个包含恶意负载的 OpenClaw 仓库。
Hermes 采取了根本不同的保守路线:Agent 根据你的特定工作流在内部生成自己的技能,绕过了外部供应链攻击向量。基础设施端强制容器隔离、密码学命名空间隔离、动态凭据轮换。
6. 安装与配置
安装只需要 Git:
# 一行安装
curl -fsSL https://hermes-agent.sh | sh
# 交互式配置向导
hermes setup
# 连接本地模型(零 API 成本)
ollama pull qwen2.5-coder:32b
hermes config set model ollama:qwen2.5-coder:32b
# 设置多平台网关
hermes gateway setup
Hermes 是模型无关的。支持 Anthropic、OpenAI、DeepSeek、OpenRouter(400+ 模型一个端点)。对于深度研究任务,需要至少 64K token 窗口的模型。
7. 诚实的限制
文章作者给出了几个现实检查:
- 硬件现实:qwen2.5-coder:32b 跑在 CPU 上做编排太慢了。建议至少有一个云端模型做编排、本地模型做专一任务。
- 自编技能可能脆弱:如果底层 API 升级,旧的 Markdown 流程就断了。
- 跳过 Tier 4:对大多数单服务器部署,SQLite 全文搜索(Tier 3)已经提供了 95% 的价值。
- 安装复杂度:OpenClaw 从安装到工作更快。Hermes 有更多配置步骤。
- 项目还很新:v0.8.0 发布于 2026 年 4 月 8 日,还在快速迭代。会遇到粗糙的边缘。
- 自我提升是渐进的:40% 的提升是数周持续使用的结果,不是一夜之间的转变。
8. 更大的图景
AI Agent 领域正在分裂成两个阵营:
- 连接(Connectivity):OpenClaw 的选择——连接一切,无处不在
- 认知(Cognition):Hermes 的选择——随时间变得更聪明
两种模式都成立,取决于你的场景。但对于那些重复运行相同复杂工作流的人来说,一个真正会学习的 Agent 的复合优势是难以忽视的。
安装用五分钟。学习循环需要几周。然后差距开始拉开。
相关阅读:
- 项目地址:github.com/nousresearch/hermes-agent
- 配置文档:hermes-agent.nousresearch.com/docs
- 上一篇文章:OpenClaw:浏览器即 Agent 的架构
- 上上篇文章:Hermes vs OpenClaw:自主 AI Agent 赛道双雄

