Update avaliable. Click RELOAD to update.
📱 安装应用到主屏幕,获得更好体验
目录

真正有记忆的 AI Agent:Hermes 四层记忆系统揭秘

1. 闭环学习系统

所有你用过的 AI Agent 都有一个相同的问题:周一你教会它一些东西,周二它就忘得一干二净。你又回到起点,重新解释项目结构、偏好设置、工作流程。

Nous Research 构建的 Hermes Agent 就是为了终结这个循环。它是一个开源、自托管的 AI Agent,从完成的任务中学习,使用时间越长性能越好。自 2026 年 2 月发布以来,已经积累了 5,000+ GitHub Stars,活跃用户超过 2,000 人。

当 Hermes 成功完成一个任务时,它不只是记录结果然后继续。它会执行一个后执行评估:识别出确切的步骤序列、工具调用、推理模式,提取出通用的知识和模式,然后写出新的技能文档。

这就是 Nous Research 所说的封闭学习循环

执行 → 评估 → 提取 → 精炼 → 检索

而且是复合增长的。根据 Nous Research 的基准测试,运行在社区技能集上的 Agent 经过数周的持续使用,任务成功率提高了 40%。你的 Hermes 实例在一个 $5 VPS 上跑了三个月后,它知道你的代码库结构、部署的怪癖、你偏好的 commit 信息格式、以及针对你的工作流最有效的 API 调用序列。

2. Skills 与 Tools 的架构区别

Hermes 做了一个关键性的架构区分:

Skills vs Tools 架构图

这意味着 Agent 可以变聪明而不碰自己的源代码。确定的工具层保持稳定和安全。知识层持续增长。两者在架构上完全分离。

3. 四层记忆系统

上下文管理是 Agent 设计的核心难题:太少上下文让 Agent 做错误决策,太多则烧 token、增加延迟、模型会忘记埋在长 prompt 里的指令。

四层记忆系统架构

Hermes 用四层记忆系统解决了这个矛盾:

Tier 1:Agent 的个人笔记(MEMORY.md)

存储环境事实、项目约定、操作经验。约 800 tokens,直接注入系统提示。跨会话持久。因为 Agent 会按照紧急程度和变更频率编辑这个文件(类似人类做笔记),所以它的内容始终保持精炼和相关。

Tier 2:用户档案(USER.md)

维护对你的认知:技术水平、时区、沟通风格。约 500 tokens,启动时注入。Agent 知道你是谁、你希望怎么被对待。

Tier 3:会话搜索(Session Search)

将所有历史会话归档到 SQLite 数据库。Agent 通过全文搜索 + LLM 摘要按需查询。这是大多数场景下你真正需要的记忆能力——它不需要提前加载,只在需要时检索。

Tier 4:外部记忆插件

接入基于图的检索系统如 LightRAG、Supermemory 或自定义向量数据库。面向企业级场景,支持跨会话、跨用户的知识共享。对大多数单服务器部署来说,Tier 3 已经足够。

冻结快照模式

前两层使用”Frozen Snapshot“模式:更改立即写入磁盘,但直到下次会话启动才修改活跃系统提示。这保护了语言模型在运行中的上下文稳定性——不会在对话中间突然改变 Agent 的行为。

定时推送机制

还有一个”Periodic Nudge“机制值得了解:Hermes 运行时主动在任务间隙提示 Agent 保存有价值的信息,不必等用户想起去存档。

4. Think Tool:思考后再行动

当处理复杂研究任务时,Hermes 首先调用 think_tool——一个强制性的策略停顿,迫使模型在行动之前制定一个实际的调查计划。然后并行执行。

ConductResearch 工具不是发送单个查询,而是把具体的研究主题委派给独立的子 Agent,每个子 Agent 拥有自己的干净上下文窗口和隔离的终端会话。

并行工作完成后,再次调用 think_tool——第二遍强制综合:评估返回的结果、检查缺口、判断目标是否达成。如果未达到,循环继续。

最终报告由多个模块化小报告合并而成(需要至少 64K token 窗口的模型)。

5. 安全:更保守的设计

与 OpenClaw 的对比在这里变得引人注目。

2026 年 3 月 18 日至 21 日,四天内 OpenClaw 曝出 9 个 CVE,包括一个 CVSS 9.9 的严重漏洞。到月底累计 15 个 CVE——约每天 2.2 个新漏洞。ClawHub 市场中安全公司确认有 1,184 个恶意技能(约五分之一)。SecurityScorecard 在 GitHub 上发现了超过 3,400 个包含恶意负载的 OpenClaw 仓库。

Hermes 采取了根本不同的保守路线:Agent 根据你的特定工作流在内部生成自己的技能,绕过了外部供应链攻击向量。基础设施端强制容器隔离、密码学命名空间隔离、动态凭据轮换。

6. 安装与配置

安装只需要 Git:

# 一行安装
curl -fsSL https://hermes-agent.sh | sh

# 交互式配置向导
hermes setup

# 连接本地模型(零 API 成本)
ollama pull qwen2.5-coder:32b
hermes config set model ollama:qwen2.5-coder:32b

# 设置多平台网关
hermes gateway setup

Hermes 是模型无关的。支持 Anthropic、OpenAI、DeepSeek、OpenRouter(400+ 模型一个端点)。对于深度研究任务,需要至少 64K token 窗口的模型。

7. 诚实的限制

文章作者给出了几个现实检查:

8. 更大的图景

AI Agent 领域正在分裂成两个阵营:

两种模式都成立,取决于你的场景。但对于那些重复运行相同复杂工作流的人来说,一个真正会学习的 Agent 的复合优势是难以忽视的。

安装用五分钟。学习循环需要几周。然后差距开始拉开。

相关阅读:

版权所有,本作品采用知识共享署名-非商业性使用 3.0 未本地化版本许可协议进行许可。转载请注明出处:https://www.wangjun.dev//2026/05/hermes-agent-four-tier-memory-system/