五层记忆架构

五层记忆架构

概述

[[hermes-agent]] 的记忆系统由五层组成，从每轮注入到按需检索，形成完整的长短期记忆链路。设计原则：热记忆 = 指路牌（只放每次都需要的），MemPalace = 百科全书（按需检索）。

五层结构

层级	名称	存储	容量	加载方式
L0	Persona	SOUL.md	~3000字符	每轮注入
L1	热记忆	MEMORY.md + USER.md	~2200字符上限	每轮注入（启动时冻结）
L2	语义检索	[[mempalace]] ChromaDB	无硬限	按需 mempalace_recall
L3	知识图谱	[[mempalace]] SQLite 三元组	无硬限	按需 mempalace_knowledge
L4	会话历史	session_search (FTS5)	全量	按需搜索

回忆优先级

1
热记忆(L0+L1) → MemPalace语义搜索(L2) → session_search(L4) → 结构化文件

溢出机制

当热记忆超过 ~70% 容量时，非核心信息下沉到 [[mempalace]]：

网络拓扑、环境配置 → 下沉
项目细节、技术记录 → 下沉
核心偏好、高频踩坑 → 保留
行为规则、授权声明 → 保留

三工具协同

工具	定位	集成层级
[[hermes-agent]] 内置	记忆编排中枢	L0 + L1
[[mempalace]]	本地长期语义记忆	L2 + L3
[[ima-openapi]]	云端知识库	外部知识源

嵌入模型

使用 Qwen3-Embedding-0.6B（4096维，通过 [[ollama]] 部署），中文命中率从 50% 提升到 100%。

相关

[[mempalace]] — L2/L3 实现
[[hermes-agent]] — 中枢
[[ima-openapi]] — 云端知识源