五层记忆架构

五层记忆架构

概述

[[hermes-agent]] 的记忆系统由五层组成,从每轮注入到按需检索,形成完整的长短期记忆链路。设计原则:热记忆 = 指路牌(只放每次都需要的),MemPalace = 百科全书(按需检索)

五层结构

层级名称存储容量加载方式
L0PersonaSOUL.md~3000字符每轮注入
L1热记忆MEMORY.md + USER.md~2200字符上限每轮注入(启动时冻结)
L2语义检索[[mempalace]] ChromaDB无硬限按需 mempalace_recall
L3知识图谱[[mempalace]] SQLite 三元组无硬限按需 mempalace_knowledge
L4会话历史session_search (FTS5)全量按需搜索

回忆优先级

1
热记忆(L0+L1) → MemPalace语义搜索(L2) → session_search(L4) → 结构化文件

溢出机制

当热记忆超过 ~70% 容量时,非核心信息下沉到 [[mempalace]]:

  • 网络拓扑、环境配置 → 下沉
  • 项目细节、技术记录 → 下沉
  • 核心偏好、高频踩坑 → 保留
  • 行为规则、授权声明 → 保留

三工具协同

工具定位集成层级
[[hermes-agent]] 内置记忆编排中枢L0 + L1
[[mempalace]]本地长期语义记忆L2 + L3
[[ima-openapi]]云端知识库外部知识源

嵌入模型

使用 Qwen3-Embedding-0.6B(4096维,通过 [[ollama]] 部署),中文命中率从 50% 提升到 100%。

相关

  • [[mempalace]] — L2/L3 实现
  • [[hermes-agent]] — 中枢
  • [[ima-openapi]] — 云端知识源