真正有记忆的 AI Agent：Hermes 四层记忆系统揭秘

2026-05-12

1. 闭环学习系统
2. Skills 与 Tools 的架构区别
3. 四层记忆系统
- 冻结快照模式
- 定时推送机制
4. Think Tool：思考后再行动
5. 安全：更保守的设计
6. 安装与配置
7. 诚实的限制
8. 更大的图景

1. 闭环学习系统

所有你用过的 AI Agent 都有一个相同的问题：周一你教会它一些东西，周二它就忘得一干二净。你又回到起点，重新解释项目结构、偏好设置、工作流程。

Nous Research 构建的 Hermes Agent 就是为了终结这个循环。它是一个开源、自托管的 AI Agent，从完成的任务中学习，使用时间越长性能越好。自 2026 年 2 月发布以来，已经积累了 5,000+ GitHub Stars，活跃用户超过 2,000 人。

当 Hermes 成功完成一个任务时，它不只是记录结果然后继续。它会执行一个后执行评估：识别出确切的步骤序列、工具调用、推理模式，提取出通用的知识和模式，然后写出新的技能文档。

这就是 Nous Research 所说的封闭学习循环：

执行 → 评估 → 提取 → 精炼 → 检索

而且是复合增长的。根据 Nous Research 的基准测试，运行在社区技能集上的 Agent 经过数周的持续使用，任务成功率提高了 40%。你的 Hermes 实例在一个 $5 VPS 上跑了三个月后，它知道你的代码库结构、部署的怪癖、你偏好的 commit 信息格式、以及针对你的工作流最有效的 API 调用序列。

2. Skills 与 Tools 的架构区别

Hermes 做了一个关键性的架构区分：

Tools（工具）：通过 JSON Schema 暴露给 AI 模型的 Python 函数。确定性执行——浏览器自动化、文件操作、流处理。修改需要编辑源代码。
Skills（技能）：Markdown 文档。Agent 像读说明书一样读取并自主遵循记录的过程。关键点：Agent 可以自己编写技能，不需要修改源代码。

这意味着 Agent 可以变聪明而不碰自己的源代码。确定的工具层保持稳定和安全。知识层持续增长。两者在架构上完全分离。

3. 四层记忆系统

上下文管理是 Agent 设计的核心难题：太少上下文让 Agent 做错误决策，太多则烧 token、增加延迟、模型会忘记埋在长 prompt 里的指令。

Hermes 用四层记忆系统解决了这个矛盾：

Tier 1：Agent 的个人笔记（MEMORY.md）

存储环境事实、项目约定、操作经验。约 800 tokens，直接注入系统提示。跨会话持久。因为 Agent 会按照紧急程度和变更频率编辑这个文件（类似人类做笔记），所以它的内容始终保持精炼和相关。

Tier 2：用户档案（USER.md）

维护对你的认知：技术水平、时区、沟通风格。约 500 tokens，启动时注入。Agent 知道你是谁、你希望怎么被对待。

Tier 3：会话搜索（Session Search）

将所有历史会话归档到 SQLite 数据库。Agent 通过全文搜索 + LLM 摘要按需查询。这是大多数场景下你真正需要的记忆能力——它不需要提前加载，只在需要时检索。

Tier 4：外部记忆插件

接入基于图的检索系统如 LightRAG、Supermemory 或自定义向量数据库。面向企业级场景，支持跨会话、跨用户的知识共享。对大多数单服务器部署来说，Tier 3 已经足够。

冻结快照模式

前两层使用”Frozen Snapshot“模式：更改立即写入磁盘，但直到下次会话启动才修改活跃系统提示。这保护了语言模型在运行中的上下文稳定性——不会在对话中间突然改变 Agent 的行为。

定时推送机制

还有一个”Periodic Nudge“机制值得了解：Hermes 运行时主动在任务间隙提示 Agent 保存有价值的信息，不必等用户想起去存档。

4. Think Tool：思考后再行动

当处理复杂研究任务时，Hermes 首先调用 think_tool——一个强制性的策略停顿，迫使模型在行动之前制定一个实际的调查计划。然后并行执行。

ConductResearch 工具不是发送单个查询，而是把具体的研究主题委派给独立的子 Agent，每个子 Agent 拥有自己的干净上下文窗口和隔离的终端会话。

并行工作完成后，再次调用 think_tool——第二遍强制综合：评估返回的结果、检查缺口、判断目标是否达成。如果未达到，循环继续。

最终报告由多个模块化小报告合并而成（需要至少 64K token 窗口的模型）。

5. 安全：更保守的设计

与 OpenClaw 的对比在这里变得引人注目。

2026 年 3 月 18 日至 21 日，四天内 OpenClaw 曝出 9 个 CVE，包括一个 CVSS 9.9 的严重漏洞。到月底累计 15 个 CVE——约每天 2.2 个新漏洞。ClawHub 市场中安全公司确认有 1,184 个恶意技能（约五分之一）。SecurityScorecard 在 GitHub 上发现了超过 3,400 个包含恶意负载的 OpenClaw 仓库。

Hermes 采取了根本不同的保守路线：Agent 根据你的特定工作流在内部生成自己的技能，绕过了外部供应链攻击向量。基础设施端强制容器隔离、密码学命名空间隔离、动态凭据轮换。

6. 安装与配置

安装只需要 Git：

# 一行安装
curl -fsSL https://hermes-agent.sh | sh

# 交互式配置向导
hermes setup

# 连接本地模型（零 API 成本）
ollama pull qwen2.5-coder:32b
hermes config set model ollama:qwen2.5-coder:32b

# 设置多平台网关
hermes gateway setup

Hermes 是模型无关的。支持 Anthropic、OpenAI、DeepSeek、OpenRouter（400+ 模型一个端点）。对于深度研究任务，需要至少 64K token 窗口的模型。

7. 诚实的限制

文章作者给出了几个现实检查：

硬件现实：qwen2.5-coder:32b 跑在 CPU 上做编排太慢了。建议至少有一个云端模型做编排、本地模型做专一任务。
自编技能可能脆弱：如果底层 API 升级，旧的 Markdown 流程就断了。
跳过 Tier 4：对大多数单服务器部署，SQLite 全文搜索（Tier 3）已经提供了 95% 的价值。
安装复杂度：OpenClaw 从安装到工作更快。Hermes 有更多配置步骤。
项目还很新：v0.8.0 发布于 2026 年 4 月 8 日，还在快速迭代。会遇到粗糙的边缘。
自我提升是渐进的：40% 的提升是数周持续使用的结果，不是一夜之间的转变。

8. 更大的图景

AI Agent 领域正在分裂成两个阵营：

连接（Connectivity）：OpenClaw 的选择——连接一切，无处不在
认知（Cognition）：Hermes 的选择——随时间变得更聪明

两种模式都成立，取决于你的场景。但对于那些重复运行相同复杂工作流的人来说，一个真正会学习的 Agent 的复合优势是难以忽视的。

安装用五分钟。学习循环需要几周。然后差距开始拉开。