<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Architecture on Kalend's Blog</title><link>https://blog.kalend.top/tags/architecture/</link><description>Recent content in Architecture on Kalend's Blog</description><generator>Hugo -- gohugo.io</generator><language>zh</language><atom:link href="https://blog.kalend.top/tags/architecture/index.xml" rel="self" type="application/rss+xml"/><item><title>五层记忆架构</title><link>https://blog.kalend.top/wiki/concepts/memory-layered-architecture/</link><pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate><guid>https://blog.kalend.top/wiki/concepts/memory-layered-architecture/</guid><description>&lt;h1 id="五层记忆架构"&gt;五层记忆架构
&lt;/h1&gt;&lt;h2 id="概述"&gt;概述
&lt;/h2&gt;&lt;p&gt;[[hermes-agent]] 的记忆系统由五层组成，从每轮注入到按需检索，形成完整的长短期记忆链路。设计原则：&lt;strong&gt;热记忆 = 指路牌（只放每次都需要的），MemPalace = 百科全书（按需检索）&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="五层结构"&gt;五层结构
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;层级&lt;/th&gt;
 &lt;th&gt;名称&lt;/th&gt;
 &lt;th&gt;存储&lt;/th&gt;
 &lt;th&gt;容量&lt;/th&gt;
 &lt;th&gt;加载方式&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;L0&lt;/td&gt;
 &lt;td&gt;Persona&lt;/td&gt;
 &lt;td&gt;SOUL.md&lt;/td&gt;
 &lt;td&gt;~3000字符&lt;/td&gt;
 &lt;td&gt;每轮注入&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;L1&lt;/td&gt;
 &lt;td&gt;热记忆&lt;/td&gt;
 &lt;td&gt;MEMORY.md + USER.md&lt;/td&gt;
 &lt;td&gt;~2200字符上限&lt;/td&gt;
 &lt;td&gt;每轮注入（启动时冻结）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;L2&lt;/td&gt;
 &lt;td&gt;语义检索&lt;/td&gt;
 &lt;td&gt;[[mempalace]] ChromaDB&lt;/td&gt;
 &lt;td&gt;无硬限&lt;/td&gt;
 &lt;td&gt;按需 mempalace_recall&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;L3&lt;/td&gt;
 &lt;td&gt;知识图谱&lt;/td&gt;
 &lt;td&gt;[[mempalace]] SQLite 三元组&lt;/td&gt;
 &lt;td&gt;无硬限&lt;/td&gt;
 &lt;td&gt;按需 mempalace_knowledge&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;L4&lt;/td&gt;
 &lt;td&gt;会话历史&lt;/td&gt;
 &lt;td&gt;session_search (FTS5)&lt;/td&gt;
 &lt;td&gt;全量&lt;/td&gt;
 &lt;td&gt;按需搜索&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="回忆优先级"&gt;回忆优先级
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;热记忆(L0+L1) → MemPalace语义搜索(L2) → session_search(L4) → 结构化文件
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="溢出机制"&gt;溢出机制
&lt;/h2&gt;&lt;p&gt;当热记忆超过 ~70% 容量时，非核心信息下沉到 [[mempalace]]：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;网络拓扑、环境配置 → 下沉&lt;/li&gt;
&lt;li&gt;项目细节、技术记录 → 下沉&lt;/li&gt;
&lt;li&gt;核心偏好、高频踩坑 → 保留&lt;/li&gt;
&lt;li&gt;行为规则、授权声明 → 保留&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="三工具协同"&gt;三工具协同
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;工具&lt;/th&gt;
 &lt;th&gt;定位&lt;/th&gt;
 &lt;th&gt;集成层级&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;[[hermes-agent]] 内置&lt;/td&gt;
 &lt;td&gt;记忆编排中枢&lt;/td&gt;
 &lt;td&gt;L0 + L1&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;[[mempalace]]&lt;/td&gt;
 &lt;td&gt;本地长期语义记忆&lt;/td&gt;
 &lt;td&gt;L2 + L3&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;[[ima-openapi]]&lt;/td&gt;
 &lt;td&gt;云端知识库&lt;/td&gt;
 &lt;td&gt;外部知识源&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="嵌入模型"&gt;嵌入模型
&lt;/h2&gt;&lt;p&gt;使用 Qwen3-Embedding-0.6B（4096维，通过 [[ollama]] 部署），中文命中率从 50% 提升到 100%。&lt;/p&gt;
&lt;h2 id="相关"&gt;相关
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;[[mempalace]] — L2/L3 实现&lt;/li&gt;
&lt;li&gt;[[hermes-agent]] — 中枢&lt;/li&gt;
&lt;li&gt;[[ima-openapi]] — 云端知识源&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>