五层记忆架构
概述
[[hermes-agent]] 的记忆系统由五层组成,从每轮注入到按需检索,形成完整的长短期记忆链路。设计原则:热记忆 = 指路牌(只放每次都需要的),MemPalace = 百科全书(按需检索)。
五层结构
| 层级 | 名称 | 存储 | 容量 | 加载方式 |
|---|---|---|---|---|
| L0 | Persona | SOUL.md | ~3000字符 | 每轮注入 |
| L1 | 热记忆 | MEMORY.md + USER.md | ~2200字符上限 | 每轮注入(启动时冻结) |
| L2 | 语义检索 | [[mempalace]] ChromaDB | 无硬限 | 按需 mempalace_recall |
| L3 | 知识图谱 | [[mempalace]] SQLite 三元组 | 无硬限 | 按需 mempalace_knowledge |
| L4 | 会话历史 | session_search (FTS5) | 全量 | 按需搜索 |
回忆优先级
| |
溢出机制
当热记忆超过 ~70% 容量时,非核心信息下沉到 [[mempalace]]:
- 网络拓扑、环境配置 → 下沉
- 项目细节、技术记录 → 下沉
- 核心偏好、高频踩坑 → 保留
- 行为规则、授权声明 → 保留
三工具协同
| 工具 | 定位 | 集成层级 |
|---|---|---|
| [[hermes-agent]] 内置 | 记忆编排中枢 | L0 + L1 |
| [[mempalace]] | 本地长期语义记忆 | L2 + L3 |
| [[ima-openapi]] | 云端知识库 | 外部知识源 |
嵌入模型
使用 Qwen3-Embedding-0.6B(4096维,通过 [[ollama]] 部署),中文命中率从 50% 提升到 100%。
相关
- [[mempalace]] — L2/L3 实现
- [[hermes-agent]] — 中枢
- [[ima-openapi]] — 云端知识源