<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Ai-Agent on Kalend's Blog</title><link>https://blog.kalend.top/tags/ai-agent/</link><description>Recent content in Ai-Agent on Kalend's Blog</description><generator>Hugo -- gohugo.io</generator><language>zh</language><lastBuildDate>Fri, 29 May 2026 18:30:00 +0800</lastBuildDate><atom:link href="https://blog.kalend.top/tags/ai-agent/index.xml" rel="self" type="application/rss+xml"/><item><title>Hermes Agent v0.15：速度翻倍，从单兵到军团</title><link>https://blog.kalend.top/2026/05/29/2026-05-29-hermes-v0.15-whats-new.html/</link><pubDate>Fri, 29 May 2026 18:30:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/29/2026-05-29-hermes-v0.15-whats-new.html/</guid><description>&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;Hermes Agent v0.15.0（5月28日）是迄今最大的单版本更新。
&lt;strong&gt;1,302个提交、747个合并PR、1,746个文件变更、321位社区贡献者&lt;/strong&gt;。
隔天（5月29日）发布的 v0.15.1 修复了影响所有 Dashboard 用户的 P0 bug。&lt;/p&gt;
&lt;p&gt;这个版本的三个关键词：&lt;strong&gt;快、拆、稳&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="速度从各个维度变快"&gt;速度：从各个维度变快
&lt;/h2&gt;&lt;h3 id="冷启动再砍1秒"&gt;冷启动再砍1秒
&lt;/h3&gt;&lt;p&gt;v0.15.0 延续了冷启动性能优化的浪潮，三轮优化叠加：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;openai._base_client&lt;/code&gt; 导入延迟加载：&lt;strong&gt;-240ms / -17MB&lt;/strong&gt; 内存&lt;/li&gt;
&lt;li&gt;热路径函数调用削减 47%（399k → 213k，31轮对话）&lt;/li&gt;
&lt;li&gt;压缩可行性检查延迟：-170 到 -290ms&lt;/li&gt;
&lt;li&gt;自适应子进程轮询：-195ms/工具调用&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;实际效果：Termux 冷启动从 2.9s → 0.8s。
&lt;code&gt;hermes --version&lt;/code&gt; 冷启动 701ms → 258ms（&lt;strong&gt;降63%&lt;/strong&gt;），首次超越 Codex CLI。&lt;/p&gt;
&lt;h3 id="session_search-快了4500倍"&gt;session_search 快了4500倍
&lt;/h3&gt;&lt;p&gt;旧版 &lt;code&gt;session_search&lt;/code&gt; 是辅助 LLM 驱动的工具，每次搜索花 90 秒、花费 $0.30，偶尔还会编造结果。新版完全重写：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;零 LLM 调用&lt;/strong&gt;，纯 FTS5 搜索引擎&lt;/li&gt;
&lt;li&gt;三种模式（发现/滚动/浏览），自动推断无需切换&lt;/li&gt;
&lt;li&gt;搜索延迟：~20ms（旧版 ~90s）&lt;/li&gt;
&lt;li&gt;滚动延迟：~1ms&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;搜索历史对话现在免费且即时。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="拆核心代码大瘦身"&gt;拆：核心代码大瘦身
&lt;/h2&gt;&lt;h3 id="run_agentpy-从16000行拆成3800行"&gt;run_agent.py 从16,000行拆成3,800行
&lt;/h3&gt;&lt;p&gt;这是整个版本最激进的重构。
&lt;code&gt;run_agent.py&lt;/code&gt; 从 16,083 行缩减到 3,821 行（&lt;strong&gt;-76%&lt;/strong&gt;），拆分到 14 个内聚的 &lt;code&gt;agent/*&lt;/code&gt; 模块。&lt;/p&gt;
&lt;p&gt;关键保证：&lt;strong&gt;行为零变化&lt;/strong&gt;。每个拆分都在 &lt;code&gt;AIAgent&lt;/code&gt; 上保留薄转发器，所有测试补丁路径不受影响，外部调用者完全兼容。&lt;/p&gt;
&lt;p&gt;为什么你应该关注？以前这个文件在你的编辑器里要 90 秒才能打开，现在眨眼即开。未来开发迭代速度会显著加快。&lt;/p&gt;
&lt;h2 id="稳kanban长成真正的多agent平台"&gt;稳：Kanban长成真正的多Agent平台
&lt;/h2&gt;&lt;p&gt;v0.15.0 用 &lt;strong&gt;104个PR&lt;/strong&gt; 把 Kanban 从任务队列升级为多 Agent 协作平台。&lt;/p&gt;
&lt;h3 id="新能力一览"&gt;新能力一览
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;能力&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;自动分解&lt;/td&gt;
 &lt;td&gt;Triage 自动将一个任务分解为子任务树&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Swarm 拓扑&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;hermes kanban swarm&lt;/code&gt; 一键创建完整 Swarm v1 图&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;每任务模型覆盖&lt;/td&gt;
 &lt;td&gt;便宜模型做杂活，贵模型啃硬骨头&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;工作树隔离&lt;/td&gt;
 &lt;td&gt;每个任务独立 git worktree，互不干扰&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;定时启动&lt;/td&gt;
 &lt;td&gt;任务支持指定开始时间&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;陈旧任务检测&lt;/td&gt;
 &lt;td&gt;自动发现并回收卡住的任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Worker 可视化&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;/workers/active&lt;/code&gt;、&lt;code&gt;/runs/{id}&lt;/code&gt;、&lt;code&gt;/inspect&lt;/code&gt; 端点&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="swarm-是什么"&gt;Swarm 是什么
&lt;/h3&gt;&lt;p&gt;一条命令创建一个完整的多 Agent 工作流：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban swarm
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;自动生成：根节点 → 并行 Worker → 门控验证者 → 门控综合者 → 共享黑板。适合代码审查、批量研究、多文件重构等场景。&lt;/p&gt;
&lt;h2 id="安全三道防线对抗提示注入"&gt;安全：三道防线对抗提示注入
&lt;/h2&gt;&lt;p&gt;受 Brainworm/Promptware Kill Chain 研究（arxiv 2601.09625）启发，v0.15.0 在三个关键位置部署了防御：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;威胁模式库&lt;/strong&gt;（&lt;code&gt;tools/threat_patterns.py&lt;/code&gt;）：~15个新的 Brainworm/C2 模式&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;记忆加载扫描&lt;/strong&gt;：召回的记忆在注入上下文前先过安全检查&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;工具结果分隔符&lt;/strong&gt;：恶意文件或远程服务无法伪装成 Hermes 自身的系统内容&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;配合新增的 &lt;code&gt;security-guidance&lt;/code&gt; 插件，对危险代码写入进行模式匹配。&lt;/p&gt;
&lt;h2 id="其他值得关注的更新"&gt;其他值得关注的更新
&lt;/h2&gt;&lt;h3 id="bitwarden-secrets-manager-集成"&gt;Bitwarden Secrets Manager 集成
&lt;/h3&gt;&lt;p&gt;一个引导令牌（&lt;code&gt;BWS_ACCESS_TOKEN&lt;/code&gt;）替代所有明文 API Key。在 Bitwarden Web 端轮换密钥，重启即生效。&lt;/p&gt;
&lt;h3 id="ntfy第23个消息平台"&gt;ntfy：第23个消息平台
&lt;/h3&gt;&lt;p&gt;无需注册、无需 API Key，只要一个 topic URL。Agent 完成任务、cron 到点，推送通知直达手机/桌面/智能家居。&lt;/p&gt;
&lt;h3 id="skill-bundle一条命令加载多个-skill"&gt;Skill Bundle：一条命令加载多个 Skill
&lt;/h3&gt;&lt;p&gt;设置你的&amp;quot;写作日&amp;quot;组合（humanizer + ideation + obsidian + youtube-content）。
&lt;code&gt;/writing-day&lt;/code&gt; 一次性激活全部。&lt;/p&gt;
&lt;h3 id="tui-会话管理器"&gt;TUI 会话管理器
&lt;/h3&gt;&lt;p&gt;Ink TUI 新增多会话切换器：在同一个终端窗口里列出、切换、刷新、关闭多个会话，不用退出。&lt;/p&gt;
&lt;h3 id="docker-s6-overlay-容器管理"&gt;Docker s6-overlay 容器管理
&lt;/h3&gt;&lt;p&gt;容器内网关自动监督、重启对账、docker logs 集成。Node 升级到 22 LTS。&lt;/p&gt;
&lt;h2 id="v0151-热修复5月29日"&gt;v0.15.1 热修复（5月29日）
&lt;/h2&gt;&lt;p&gt;v0.15.0 发布隔天，一个 P0 bug 浮出水面：&lt;strong&gt;Dashboard 在 loopback 模式下无限重载&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="根因"&gt;根因
&lt;/h3&gt;&lt;p&gt;Dashboard 的身份探针（&lt;code&gt;/api/auth/me&lt;/code&gt;）在 loopback 模式下返回 401（设计如此）。
但 v0.15.0 的过期令牌重载守卫把每个 401 都当成了需要刷新的会话令牌，触发整页重载。
重载后其他请求清除了单次重载守卫，于是又触发下一轮。
Firefox 表现为 &amp;ldquo;Navigated to /sessions&amp;rdquo; 暴风，Chrome 表现为 React 重渲染风暴。&lt;/p&gt;
&lt;h3 id="修复"&gt;修复
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;fetchJSON&lt;/code&gt; 新增 &lt;code&gt;allowUnauthorized&lt;/code&gt; 选项，跳过 loopback 下的过期令牌重载逻辑。
401 仍然抛异常让 &lt;code&gt;AuthWidget&lt;/code&gt; 处理，但不再触发整页刷新。&lt;/p&gt;
&lt;h3 id="其他修复"&gt;其他修复
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;Docker &lt;code&gt;--insecure&lt;/code&gt; 改为显式环境变量（&lt;code&gt;HERMES_DASHBOARD_INSECURE=1&lt;/code&gt;），不再从绑定主机推断&lt;/li&gt;
&lt;li&gt;MCP bare 命令（npx/npm/node）在 Docker 容器内正确解析到 &lt;code&gt;/usr/local/bin&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;Kanban Worker 的 SIGTERM 终于能正常终止进程&lt;/li&gt;
&lt;li&gt;Skills 页面源标签和分类侧边栏恢复&lt;/li&gt;
&lt;li&gt;&lt;code&gt;/yolo&lt;/code&gt; 中途启用变为 per-session 级别&lt;/li&gt;
&lt;li&gt;&lt;code&gt;/model&lt;/code&gt; 和 &lt;code&gt;hermes model&lt;/code&gt; 显示统一列表&lt;/li&gt;
&lt;li&gt;&lt;code&gt;.md&lt;/code&gt; 文件媒体投递恢复&lt;/li&gt;
&lt;li&gt;Web URL 不再被误删查询参数&lt;/li&gt;
&lt;li&gt;Skills Hub 全目录：858 → 19,932，所有 skills.sh 条目可搜索&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="升级建议"&gt;升级建议
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 源码安装&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nb"&gt;cd&lt;/span&gt; /opt/hermes-agent
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git pull
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install -e .
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 或 Docker&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;docker pull nousresearch/hermes-agent:latest
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 检查版本&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes --version
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;直接跳到 v0.15.1，不要停在 v0.15.0。&lt;/strong&gt; Dashboard 无限重载 bug 只影响 v0.15.0。&lt;/p&gt;
&lt;h2 id="数据总结"&gt;数据总结
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;指标&lt;/th&gt;
 &lt;th&gt;v0.15.0&lt;/th&gt;
 &lt;th&gt;v0.15.1&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;提交数&lt;/td&gt;
 &lt;td&gt;1,302&lt;/td&gt;
 &lt;td&gt;28&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;合并PR&lt;/td&gt;
 &lt;td&gt;747&lt;/td&gt;
 &lt;td&gt;21&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;文件变更&lt;/td&gt;
 &lt;td&gt;1,746&lt;/td&gt;
 &lt;td&gt;-&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;贡献者&lt;/td&gt;
 &lt;td&gt;321&lt;/td&gt;
 &lt;td&gt;9&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;P0 修复&lt;/td&gt;
 &lt;td&gt;15&lt;/td&gt;
 &lt;td&gt;1&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;P1 修复&lt;/td&gt;
 &lt;td&gt;65&lt;/td&gt;
 &lt;td&gt;-&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;安全修复&lt;/td&gt;
 &lt;td&gt;19&lt;/td&gt;
 &lt;td&gt;-&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;p&gt;关注 varkm，一起学习，一起成长&lt;/p&gt;</description></item><item><title>Hermes Agent 升级指南：v0.14.0 → v0.15.1，为什么要隔天发补丁</title><link>https://blog.kalend.top/2026/05/29/hermes-v0.15.1-upgrade-guide.html/</link><pubDate>Fri, 29 May 2026 10:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/29/hermes-v0.15.1-upgrade-guide.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;2026年5月，Hermes Agent 两周内连发三版：v0.14.0 → v0.15.0 → v0.15.1。第三版是隔天紧急修复——Dashboard 无限重载，新装用户直接无法使用。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;所有用户直接升级到 v0.15.1。&lt;/strong&gt; 不用停在 v0.15.0，它的 Dashboard 有 P0 级缺陷。&lt;/p&gt;
&lt;p&gt;一张表看全貌：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;版本&lt;/th&gt;
 &lt;th&gt;日期&lt;/th&gt;
 &lt;th&gt;代号&lt;/th&gt;
 &lt;th&gt;一句话定位&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;v0.14.0&lt;/td&gt;
 &lt;td&gt;5.16&lt;/td&gt;
 &lt;td&gt;Foundation&lt;/td&gt;
 &lt;td&gt;全平台基础版本&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;v0.15.0&lt;/td&gt;
 &lt;td&gt;5.28&lt;/td&gt;
 &lt;td&gt;Velocity&lt;/td&gt;
 &lt;td&gt;1302 commits 大重构&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;v0.15.1&lt;/td&gt;
 &lt;td&gt;5.29&lt;/td&gt;
 &lt;td&gt;Hotfix&lt;/td&gt;
 &lt;td&gt;隔天紧急修复&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="v0140--v0150大版本跳跃"&gt;v0.14.0 → v0.15.0：大版本跳跃
&lt;/h2&gt;&lt;p&gt;这不是小更新。v0.15.0 是 Hermes 历史上最大的单版本变更——747 个 PR、1302 个 commit、321 位贡献者。&lt;/p&gt;
&lt;h3 id="核心代码大瘦身"&gt;核心代码大瘦身
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;run_agent.py&lt;/code&gt; 从 &lt;strong&gt;16,000 行&lt;/strong&gt;重构到 &lt;strong&gt;3,800 行&lt;/strong&gt;，缩减 76%。不是删功能，是把职责拆分到独立模块。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;性能实测数据：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;指标&lt;/th&gt;
 &lt;th&gt;变化&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;每轮工具调用&lt;/td&gt;
 &lt;td&gt;-195ms&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;每轮函数调用&lt;/td&gt;
 &lt;td&gt;-240ms（-47%）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="session_search-重写4500x-提速"&gt;session_search 重写：4500x 提速
&lt;/h3&gt;&lt;p&gt;会话搜索引擎从 LLM 驱动改为纯 FTS5 实现。搜索速度快了 &lt;strong&gt;4500 倍&lt;/strong&gt;，而且不再消耗 token。&lt;/p&gt;
&lt;h3 id="kanban-演进为多-agent-平台"&gt;Kanban 演进为多 Agent 平台
&lt;/h3&gt;&lt;p&gt;Kanban 模块经过 &lt;strong&gt;104 个 PR&lt;/strong&gt; 打磨，从任务看板变成了多 Agent 协作平台。支持任务分解、子 Agent 分发、跨 Agent 依赖管理。&lt;/p&gt;
&lt;h3 id="安全防护promptware-defense"&gt;安全防护：Promptware Defense
&lt;/h3&gt;&lt;p&gt;新增 promptware 防御机制，防止恶意提示词注入攻击 Agent 系统提示。&lt;/p&gt;
&lt;h3 id="新集成"&gt;新集成
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Bitwarden Secrets Manager&lt;/strong&gt;：密钥管理集成&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Krea 2 + FAL 插件&lt;/strong&gt;：两个新图像生成提供商&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Nous 官方 MCP 目录&lt;/strong&gt;：审核过的 MCP 服务目录&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;ntfy 平台&lt;/strong&gt;：第 23 个消息平台&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;mTLS 支持&lt;/strong&gt;：MCP 连接支持 TLS 客户端证书&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="breaking-changes"&gt;Breaking Changes
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;变更&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;API_SERVER_KEY&lt;/code&gt; 强制&lt;/td&gt;
 &lt;td&gt;API Server 现在强制要求 Key，无 Key 不再允许请求&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;web_crawl&lt;/code&gt; 移除&lt;/td&gt;
 &lt;td&gt;该工具及相关 provider 已被移除&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;context engine&lt;/td&gt;
 &lt;td&gt;新增外部上下文引擎接口，需配合新配置&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="v0150--v0151为什么隔天就发补丁"&gt;v0.15.0 → v0.15.1：为什么隔天就发补丁
&lt;/h2&gt;&lt;p&gt;v0.15.0 发布后隔天社区报告了多个阻断性问题。&lt;/p&gt;
&lt;h3 id="-dashboard-无限重载循环p0"&gt;🔴 Dashboard 无限重载循环（P0）
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;这是 v0.15.1 存在的唯一理由。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;在 loopback 模式下（Docker 部署 / 托管环境 / 全新安装），Dashboard 的 SPA 在 token 过期后陷入死循环：401 → 重新登录 → 又 401 → 无限刷新。用户看到页面不停闪烁，完全无法使用。&lt;/p&gt;
&lt;p&gt;修复方式：&lt;code&gt;/api/auth/me&lt;/code&gt; 返回 401 时不再触发整页重载，改为 SPA 内部处理 token 刷新。&lt;/p&gt;
&lt;h3 id="-kanban-worker-sigterm-不终止"&gt;🔴 Kanban Worker SIGTERM 不终止
&lt;/h3&gt;&lt;p&gt;发送 SIGTERM 后进程没有正确终止，任务超时或手动取消时僵尸进程堆积。&lt;/p&gt;
&lt;h3 id="-其他修复"&gt;🟡 其他修复
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;问题&lt;/th&gt;
 &lt;th&gt;影响&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/model&lt;/code&gt; 和模型选择器列表不统一&lt;/td&gt;
 &lt;td&gt;CLI 和 gateway 显示不同模型列表&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/yolo&lt;/code&gt; 模式未绕过 session&lt;/td&gt;
 &lt;td&gt;yolo 模式实际没生效&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Skills 目录不完整&lt;/td&gt;
 &lt;td&gt;858 → 19,932，只拉取了部分条目&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;.md&lt;/code&gt; 媒体投递被误拦截&lt;/td&gt;
 &lt;td&gt;Gateway 把正常 Markdown 附件也拦了&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Web URL 被误脱敏&lt;/td&gt;
 &lt;td&gt;URL 参数被错误替换&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="docker-安全加固"&gt;Docker 安全加固
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;code&gt;--insecure&lt;/code&gt; 标志必须通过环境变量&lt;strong&gt;显式启用&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;MCP bare command（&lt;code&gt;npx&lt;/code&gt;/&lt;code&gt;npm&lt;/code&gt;/&lt;code&gt;node&lt;/code&gt;）明确解析到 &lt;code&gt;/usr/local/bin&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;arm64 CI 缓存问题修复&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="升级指南"&gt;升级指南
&lt;/h2&gt;&lt;h3 id="从-v0140-升级推荐"&gt;从 v0.14.0 升级（推荐）
&lt;/h3&gt;&lt;p&gt;直接跳到 v0.15.1，不需要中间停 v0.15.0：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 源码安装（推荐）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git clone https://github.com/NousResearch/hermes-agent
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nb"&gt;cd&lt;/span&gt; hermes-agent
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install -e .
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 或 PyPI&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install --upgrade hermes-agent
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="从-v0150-升级到-v0151必须"&gt;从 v0.15.0 升级到 v0.15.1（必须）
&lt;/h3&gt;&lt;p&gt;v0.15.0 的 Dashboard 无限重载是影响所有新装和 Docker 用户的 P0 问题：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;pip install --upgrade hermes-agent
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="升级后检查清单"&gt;升级后检查清单
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;检查项&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Gateway 重启&lt;/td&gt;
 &lt;td&gt;升级后必须 &lt;code&gt;hermes gateway restart&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;API_SERVER_KEY&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;v0.15.0+ 强制要求，检查 &lt;code&gt;~/.hermes/.env&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Browser Use 配置&lt;/td&gt;
 &lt;td&gt;需配置 &lt;code&gt;BEARER_TOKEN&lt;/code&gt; 匹配 &lt;code&gt;API_SERVER_KEY&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Kanban 备份&lt;/td&gt;
 &lt;td&gt;并发加固后更稳定，但建议备份 &lt;code&gt;~/.hermes/kanban.db&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Docker &lt;code&gt;--insecure&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;必须显式设置环境变量&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="版本号背后的逻辑"&gt;版本号背后的逻辑
&lt;/h2&gt;&lt;p&gt;v0.15.1 不是计划内版本。大版本（v0.15.0）涉及 1300+ commits 变更，回归测试不可能覆盖所有部署环境。Dashboard 无限重载只在 loopback/Docker 场景触发，CI 没覆盖到。&lt;/p&gt;
&lt;p&gt;发现问题后团队在隔天内发布修复——这是健康开源项目的标准响应速度。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;建议所有用户直接使用 v0.15.1。&lt;/strong&gt;&lt;/p&gt;
&lt;section style="margin:20px 0;padding:16px 20px;background:linear-gradient(135deg,#4a90d9,#357abd);border-radius:8px;text-align:center;"&gt;
&lt;p style="margin:0 0 8px 0;color:#fff;font-size:16px;font-weight:bold;line-height:1.6;"&gt;关注 varkm，一起学习，一起成长&lt;/p&gt;
&lt;p style="margin:0;color:rgba(255,255,255,0.85);font-size:13px;line-height:1.6;"&gt;更多 AI Agent 实战经验和踩坑记录，持续更新中&lt;/p&gt;
&lt;/section&gt;</description></item><item><title>踩过的坑全给你：Blog Agent 最佳实践</title><link>https://blog.kalend.top/2026/05/20/multi-agent-pipeline-part4.html/</link><pubDate>Wed, 20 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/20/multi-agent-pipeline-part4.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;跟着前三篇搭完 Pipeline，满怀信心跑了一次——然后各种炸。这篇文章是我踩了 50+ 个坑之后，精选出 12 个最致命的。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;多Agent协作系列 第4篇/共4篇（收尾篇） | 避坑指南 | 约2800字 | 作者：varkm&lt;/p&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;踩了 50 多个坑，80% 集中在五个环节。&lt;/p&gt;
&lt;p&gt;我把最致命的 12 个挑出来，按&amp;quot;写→排→配→协→省&amp;quot;五个阶段给你。&lt;/p&gt;
&lt;p&gt;每个坑都附具体命令和代码。&lt;/p&gt;
&lt;p&gt;不是&amp;quot;建议你检查一下&amp;quot;，是&amp;quot;复制这条命令就能验证&amp;quot;。&lt;/p&gt;
&lt;h2 id="一写作篇agent-写的东西能看吗"&gt;一、写作篇：Agent 写的东西能看吗
&lt;/h2&gt;&lt;p&gt;内容质量不是模型能力问题，是验证流程问题。&lt;/p&gt;
&lt;p&gt;Writer 写什么不重要，Reviewer 能拦住什么才重要。&lt;/p&gt;
&lt;h3 id="坑1子代理编造不存在的配置键名"&gt;坑1：子代理编造不存在的配置键名
&lt;/h3&gt;&lt;p&gt;这是最致命的一个坑，没有之一。&lt;/p&gt;
&lt;p&gt;子代理会&amp;quot;幻觉&amp;quot;出看似合理的配置键名。&lt;/p&gt;
&lt;p&gt;比如 &lt;code&gt;tool_circuit_breaker&lt;/code&gt;，听起来很专业对吧？&lt;/p&gt;
&lt;p&gt;源码里根本没有这个键。正确的叫 &lt;code&gt;tool_loop_guardrails&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;读者拿去配，白配。文章发出去，评论区翻车。&lt;/p&gt;
&lt;p&gt;类似的情况还有：&lt;code&gt;busy_input_mode&lt;/code&gt; 实际叫 &lt;code&gt;display.busy_input_mode&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;prompt_cache_ttl&lt;/code&gt; 实际叫 &lt;code&gt;prompt_caching.cache_ttl&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;验证方法——每个键名必须过这关：&lt;/strong&gt;&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;grep -rn &lt;span class="s2"&gt;&amp;#34;键名&amp;#34;&lt;/span&gt; hermes_cli/config.py
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;不存在就不要写，哪怕 AI 信誓旦旦说&amp;quot;我确认过&amp;quot;。&lt;/p&gt;
&lt;p&gt;这条规则我写进了 Reviewer 的检查清单，至今拦住了 20+ 次编造。&lt;/p&gt;
&lt;h3 id="坑2ai-味套话满天飞"&gt;坑2：AI 味套话满天飞
&lt;/h3&gt;&lt;p&gt;&amp;ldquo;值得注意的是&amp;rdquo;、&amp;ldquo;总的来说&amp;rdquo;、&amp;ldquo;首先…其次…最后&amp;rdquo;。&lt;/p&gt;
&lt;p&gt;这些话一出现，读者秒懂：AI 写的。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;解法：&lt;/strong&gt; 把 AI 味关键词清单写进 Reviewer 的规则文件。&lt;/p&gt;
&lt;p&gt;逐段扫描，强制替换为自然过渡。&lt;/p&gt;
&lt;p&gt;不是零容忍——允许 1-2 处漏网，但多了必须打回重写。&lt;/p&gt;
&lt;p&gt;我维护了一份清单，大概 15 个高频 AI 味词组。&lt;/p&gt;
&lt;p&gt;每次审校先跑一遍关键词扫描，比人工逐段看效率高 10 倍。&lt;/p&gt;
&lt;h3 id="坑3评测文事实核查翻车"&gt;坑3：评测文事实核查翻车
&lt;/h3&gt;&lt;p&gt;&amp;ldquo;发布不到一个月&amp;rdquo;——实际仓库已创建 3 个月。&lt;/p&gt;
&lt;p&gt;&amp;ldquo;不支持 Docker&amp;rdquo;——仓库里 Dockerfile 就在根目录。&lt;/p&gt;
&lt;p&gt;&amp;ldquo;我两个都在用&amp;rdquo;——说实话，根本没用过第二个。&lt;/p&gt;
&lt;p&gt;这条最危险，因为&lt;strong&gt;读者会去验证&lt;/strong&gt;。一旦翻车，信任归零。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;核心原则：&lt;/strong&gt; 每一条事实声明都必须验证。&lt;/p&gt;
&lt;p&gt;星数看 GitHub API，技术栈看源码，体验只写真话。&lt;/p&gt;
&lt;p&gt;验证命令：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;curl -s https://api.github.com/repos/owner/repo &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;|&lt;/span&gt; jq &lt;span class="s1"&gt;&amp;#39;{stars: .stargazers_count, created: .created_at}&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;版本追溯三步法：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git log --oneline --all --grep&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;功能名&amp;#34;&lt;/span&gt; &lt;span class="p"&gt;|&lt;/span&gt; head -5
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git tag --contains &amp;lt;commit_hash&amp;gt; &lt;span class="p"&gt;|&lt;/span&gt; head -3
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;git show --no-patch --format&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;%H %ci %s&amp;#34;&lt;/span&gt; &amp;lt;commit_hash&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;
 &lt;blockquote&gt;
 &lt;p&gt;写作篇一行检查：&lt;code&gt;grep -rn &amp;quot;配置键名&amp;quot; config.py&lt;/code&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="二排版篇微信客户端是最大的敌人"&gt;二、排版篇：微信客户端是最大的敌人
&lt;/h2&gt;&lt;p&gt;微信渲染引擎会做你意想不到的事。&lt;/p&gt;
&lt;p&gt;所有样式必须 inline，微信会剥离 &lt;code&gt;&amp;lt;style&amp;gt;&lt;/code&gt; 和 &lt;code&gt;class&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;这是排版篇的第一条铁律，后面所有坑都跟它有关。&lt;/p&gt;
&lt;h3 id="坑4列表标签全线崩溃"&gt;坑4：列表标签全线崩溃
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;&amp;lt;ul&amp;gt;&lt;/code&gt;、&lt;code&gt;&amp;lt;ol&amp;gt;&lt;/code&gt;、&lt;code&gt;&amp;lt;li&amp;gt;&lt;/code&gt;，三个标签在微信里有三个独立 bug。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;&amp;lt;ol&amp;gt;&lt;/code&gt; 编号跨板块连续计数：第一个列表从 1 开始没问题。&lt;/p&gt;
&lt;p&gt;第二个列表不从 1 开始，接着上一个的编号往下数。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;&amp;lt;ul&amp;gt;&lt;/code&gt; 加手动 bullet 产生双圆点，一行出现两个点。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;&amp;lt;li&amp;gt;&lt;/code&gt; 的 margin 产生空行，每个 item 变成空行 + 内容两行。&lt;/p&gt;
&lt;p&gt;我在这三个标签上各踩了一轮，前后折腾了两天。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;终极方案：&lt;/strong&gt; 全部不要用。&lt;/p&gt;
&lt;p&gt;所有列表统一用 &lt;code&gt;◆&lt;/code&gt; 替代：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-html" data-lang="html"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nt"&gt;p&lt;/span&gt; &lt;span class="na"&gt;style&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s"&gt;&amp;#34;margin:4px 0;line-height:1.8;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;padding-left:14px;&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;◆ 列表内容&lt;span class="p"&gt;&amp;lt;/&lt;/span&gt;&lt;span class="nt"&gt;p&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;简单、稳定、不炸。这是 3 轮踩坑之后的终极结论。&lt;/p&gt;
&lt;h3 id="坑5代码块黑底黑字"&gt;坑5：代码块黑底黑字
&lt;/h3&gt;&lt;p&gt;微信会剥离 &lt;code&gt;&amp;lt;pre&amp;gt;&lt;/code&gt; 标签的 &lt;code&gt;color&lt;/code&gt; 样式，只剩 &lt;code&gt;background&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;黑色背景 + 黑色文字 = 完全看不了。&lt;/p&gt;
&lt;p&gt;读者截图问我&amp;quot;代码块怎么什么都没有&amp;quot;。&lt;/p&gt;
&lt;p&gt;我才知道这个坑——在电脑浏览器里是正常的。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;解法：&lt;/strong&gt; 永远不要用深色代码块背景。&lt;/p&gt;
&lt;p&gt;浅色方案用 &lt;code&gt;&amp;lt;section&amp;gt;&lt;/code&gt; 包裹：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-html" data-lang="html"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nt"&gt;section&lt;/span&gt; &lt;span class="na"&gt;style&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s"&gt;&amp;#34;background:#f6f8fa;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;border-radius:6px;padding:14px;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;border:1px solid #e1e4e8;&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nt"&gt;pre&lt;/span&gt; &lt;span class="na"&gt;style&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s"&gt;&amp;#34;margin:0;color:#24292e;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;font-size:14px;&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;代码内容&lt;span class="p"&gt;&amp;lt;/&lt;/span&gt;&lt;span class="nt"&gt;pre&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;&amp;lt;/&lt;/span&gt;&lt;span class="nt"&gt;section&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;关键是用 &lt;code&gt;&amp;lt;section&amp;gt;&lt;/code&gt; 而不是直接靠 &lt;code&gt;&amp;lt;pre&amp;gt;&lt;/code&gt; 的样式。&lt;/p&gt;
&lt;p&gt;深色方案也可以，但同样必须用 &lt;code&gt;&amp;lt;section&amp;gt;&lt;/code&gt; + &lt;code&gt;&amp;lt;span&amp;gt;&lt;/code&gt; 做语法高亮。&lt;/p&gt;
&lt;h3 id="坑6封面图中文变方格"&gt;坑6：封面图中文变方格
&lt;/h3&gt;&lt;p&gt;Pillow 默认字体（DejaVu）不支持中文。&lt;/p&gt;
&lt;p&gt;所有中文字符渲染成方格/空白。&lt;/p&gt;
&lt;p&gt;发出去才知道——封面上的标题全是空白方块。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;解法：&lt;/strong&gt; 必须用系统 CJK 字体，且 &lt;code&gt;.ttc&lt;/code&gt; 文件要加 &lt;code&gt;index=0&lt;/code&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="nn"&gt;PIL&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;ImageFont&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;font&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;ImageFont&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;truetype&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s2"&gt;&amp;#34;/usr/share/fonts/opentype/noto/&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s2"&gt;&amp;#34;NotoSansCJK-Bold.ttc&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="mi"&gt;36&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;index&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;code&gt;.ttc&lt;/code&gt; 是字体集合文件，不指定 &lt;code&gt;index&lt;/code&gt; 可能加载到错误字体。&lt;/p&gt;
&lt;p&gt;这个参数踩了我半小时才找到原因。&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;排版篇一行检查：&lt;code&gt;grep -n '&amp;lt;ul&amp;gt;\|&amp;lt;ol&amp;gt;\|&amp;lt;li&amp;gt;' article.html&lt;/code&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="三配置篇80-的崩溃来自两个默认值"&gt;三、配置篇：80% 的崩溃来自两个默认值
&lt;/h2&gt;&lt;p&gt;不是功能不好用，是默认配置没改。&lt;/p&gt;
&lt;p&gt;改两个配置，解决 80% 的 Pipeline 崩溃。&lt;/p&gt;
&lt;h3 id="坑7max_tokens-太小导致截断"&gt;坑7：max_tokens 太小导致截断
&lt;/h3&gt;&lt;p&gt;默认 &lt;code&gt;max_tokens&lt;/code&gt; 只有 4096。&lt;/p&gt;
&lt;p&gt;一篇 2000 字的文章大概需要 8000-12000 token。&lt;/p&gt;
&lt;p&gt;超了直接截断，Agent crash，日志显示：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-gdscript3" data-lang="gdscript3"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;Response&lt;/span&gt; &lt;span class="n"&gt;truncated&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;finish_reason&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;length&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;refusing&lt;/span&gt; &lt;span class="n"&gt;to&lt;/span&gt; &lt;span class="n"&gt;execute&lt;/span&gt; &lt;span class="n"&gt;incomplete&lt;/span&gt; &lt;span class="k"&gt;tool&lt;/span&gt; &lt;span class="n"&gt;arguments&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;解法：&lt;/strong&gt; Profile 配置里改成 32768 或更大：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;model&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;max_tokens&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;32768&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;Worker 自己改不了这个值。&lt;/p&gt;
&lt;p&gt;必须由 Orchestrator 在 Profile 配置文件里提前设好。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;算笔账：&lt;/strong&gt; 一次跑完 vs 截断重跑。&lt;/p&gt;
&lt;p&gt;截断一次 = 浪费已消耗的 token + 重新跑一遍完整流程。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;max_tokens&lt;/code&gt; 调大，单次不会多花，但省掉了重试的浪费。&lt;/p&gt;
&lt;h3 id="坑8skill-文件没复制到-profile-目录"&gt;坑8：Skill 文件没复制到 Profile 目录
&lt;/h3&gt;&lt;p&gt;全局 skill 目录和 Profile 独立目录是两套。&lt;/p&gt;
&lt;p&gt;Profile 看不到全局目录里的 skill，必须手动复制。&lt;/p&gt;
&lt;p&gt;报错信息：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Error: Unknown skill(s): article-review
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;明明装了，为什么找不到？因为装错地方了。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;解法：&lt;/strong&gt; Orchestrator dispatch 前检查并复制：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;cp -r ~/.hermes/skills/devops/article-review &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ~/.hermes/profiles/blog-writer/skills/devops/
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;路径规则：全局 &lt;code&gt;~/.hermes/skills/&lt;/code&gt; ≠ Profile 独立目录。&lt;/p&gt;
&lt;p&gt;我第一次遇到这个报错时，反复重装了 3 遍 skill 才反应过来。&lt;/p&gt;
&lt;p&gt;装的全是全局目录，Profile 根本看不到。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这两个配置改完，80% 的 Pipeline 崩溃直接消失。&lt;/strong&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;配置篇一行检查：&lt;code&gt;grep &amp;quot;max_tokens&amp;quot; ~/.hermes/profiles/你的profile/config.yaml&lt;/code&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="四协作篇agent-编排的三个反模式"&gt;四、协作篇：Agent 编排的三个反模式
&lt;/h2&gt;&lt;p&gt;Pipeline 不是流程负担，是质量保险。&lt;/p&gt;
&lt;p&gt;跳过的每一步，都会在下游加倍还回来。&lt;/p&gt;
&lt;h3 id="坑9跳过-pipeline-裸写"&gt;坑9：跳过 Pipeline 裸写
&lt;/h3&gt;&lt;p&gt;手动 &lt;code&gt;delegate_task&lt;/code&gt; 直接让一个 Agent 写文章，没有 Reviewer。&lt;/p&gt;
&lt;p&gt;看起来快，实际上：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;对比项&lt;/th&gt;
 &lt;th&gt;Pipeline&lt;/th&gt;
 &lt;th&gt;裸写&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Reviewer 把关&lt;/td&gt;
 &lt;td&gt;有&lt;/td&gt;
 &lt;td&gt;无&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;审计链路&lt;/td&gt;
 &lt;td&gt;有&lt;/td&gt;
 &lt;td&gt;无&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;返工次数&lt;/td&gt;
 &lt;td&gt;1-2 次&lt;/td&gt;
 &lt;td&gt;3-5 次&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;总耗时&lt;/td&gt;
 &lt;td&gt;16 分钟&lt;/td&gt;
 &lt;td&gt;30+ 分钟&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;裸写最大的问题不是质量差。&lt;/p&gt;
&lt;p&gt;是&lt;strong&gt;你不知道质量差&lt;/strong&gt;——没有 Reviewer 告诉你哪里有问题。&lt;/p&gt;
&lt;p&gt;等读者反馈，已经晚了。&lt;/p&gt;
&lt;p&gt;我写过一篇裸写的文章，3 个配置键名编造，2 处 AI 味套话。&lt;/p&gt;
&lt;p&gt;没有 Reviewer 拦，全发出去了。后来评论区被指出才改。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;强制规则：&lt;/strong&gt; 走完整 Kanban Pipeline，无例外。&lt;/p&gt;
&lt;p&gt;流程：Writer → Reviewer → Creator → Reviewer → 发布。&lt;/p&gt;
&lt;h3 id="坑10task_id-幻觉编造"&gt;坑10：task_id 幻觉编造
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;kanban_complete&lt;/code&gt; 时传入编造的 task_id。&lt;/p&gt;
&lt;p&gt;kernel 验证不通过，直接报错：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;phantom id blocks the completion
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;核心：&lt;/strong&gt; task_id 只能来自 &lt;code&gt;kanban_create&lt;/code&gt; 的返回值。&lt;/p&gt;
&lt;p&gt;不要从文字描述里&amp;quot;编&amp;quot;，不要从上一轮的上下文里&amp;quot;猜&amp;quot;。&lt;/p&gt;
&lt;p&gt;正确写法——先捕获返回值，再传入：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;card&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;kanban_create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;title&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;审校文章&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;assignee&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;reviewer&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;kanban_complete&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;created_cards&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="n"&gt;card&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;task_id&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;]]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;错误写法：从摘要中看到 &amp;ldquo;t_deadbeef&amp;rdquo; 就传进去。&lt;/p&gt;
&lt;p&gt;kernel 会验证每个 id 是否真实存在，幻编的 id 100% 被拦截。&lt;/p&gt;
&lt;h3 id="坑11reviewer-模型比-writer-弱"&gt;坑11：Reviewer 模型比 Writer 弱
&lt;/h3&gt;&lt;p&gt;Writer 用最强模型写，Reviewer 用弱模型审。&lt;/p&gt;
&lt;p&gt;结果：审校形同虚设，该拦的拦不住。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;规则：&lt;/strong&gt; 审核模型必须 ≥ 写作模型。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;角色&lt;/th&gt;
 &lt;th&gt;推荐模型&lt;/th&gt;
 &lt;th&gt;定位&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Writer&lt;/td&gt;
 &lt;td&gt;glm-4.7&lt;/td&gt;
 &lt;td&gt;性价比写稿&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Creator&lt;/td&gt;
 &lt;td&gt;glm-4.7&lt;/td&gt;
 &lt;td&gt;排版生成&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Reviewer&lt;/td&gt;
 &lt;td&gt;glm-5.1&lt;/td&gt;
 &lt;td&gt;强模型把关&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;贵的模型只干贵的事——审核就是最该花 token 的环节。&lt;/p&gt;
&lt;h2 id="五成本篇怎么让-agent-省着花"&gt;五、成本篇：怎么让 Agent 省着花
&lt;/h2&gt;&lt;p&gt;不是不能用贵模型，是别在不需要的地方用。&lt;/p&gt;
&lt;h3 id="坑12pipeline-被反复跳过"&gt;坑12：Pipeline 被反复&amp;quot;跳过&amp;quot;
&lt;/h3&gt;&lt;p&gt;完整 Pipeline 6 步全 PASS 只需 16 分钟。&lt;/p&gt;
&lt;p&gt;但经常有人觉得&amp;quot;Pipeline 慢&amp;quot;，手动跳过。&lt;/p&gt;
&lt;p&gt;跳过的后果：质量不过关 → 返工 → 再跑一遍 → 总耗时翻倍。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;不要跳。&lt;/strong&gt; 16 分钟换一次通过，比跳过之后返工 30 分钟划算。&lt;/p&gt;
&lt;h3 id="分层用模型才是真省钱"&gt;分层用模型才是真省钱
&lt;/h3&gt;&lt;p&gt;全文用一个模型 = 全程用最贵的模型 = 浪费。&lt;/p&gt;
&lt;p&gt;写作用性价比模型，快且便宜。&lt;/p&gt;
&lt;p&gt;排版用同样的性价比模型。&lt;/p&gt;
&lt;p&gt;审核用强模型，只审核一次。&lt;/p&gt;
&lt;p&gt;贵模型用得少，但每次用在关键位置。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;max_tokens&lt;/code&gt; 调大 + 模型分层，总成本反而比&amp;quot;省钱方案&amp;quot;更低。&lt;/p&gt;
&lt;p&gt;具体算一下：Writer 跑 5 分钟用 glm-4.7，Reviewer 跑 2 分钟用 glm-5.1。&lt;/p&gt;
&lt;p&gt;比全程用 glm-5.1 省 60% 以上 token。&lt;/p&gt;
&lt;p&gt;该省省，该花花——审核环节绝不省钱。&lt;/p&gt;
&lt;h2 id="系列-4-篇收尾"&gt;系列 4 篇收尾
&lt;/h2&gt;&lt;p&gt;回顾整个多Agent协作系列：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第 1 篇&lt;/strong&gt; 讲了 Kanban + Profile，让 Agent 有了分工和身份。&lt;/p&gt;
&lt;p&gt;Kanban 是任务看板，Profile 是 Agent 的角色配置。&lt;/p&gt;
&lt;p&gt;两者结合，Agent 从&amp;quot;什么都干&amp;quot;变成&amp;quot;各司其职&amp;quot;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第 2 篇&lt;/strong&gt; 搭建了 Blog Writer Agent，7 步从零到能写能部署。&lt;/p&gt;
&lt;p&gt;从安装框架到写第一篇文章，全程可跟着操作。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第 3 篇&lt;/strong&gt; 组建了完整 Pipeline，多 Agent 协作链路跑通。&lt;/p&gt;
&lt;p&gt;Writer 写稿 → Reviewer 审校 → Creator 排版 → 发布。&lt;/p&gt;
&lt;p&gt;6 步全 PASS 只需 16 分钟。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第 4 篇&lt;/strong&gt;（这篇）补上了最后一环：搭完怎么不炸。&lt;/p&gt;
&lt;p&gt;12 个坑，5 个阶段，每个都有具体命令和代码。&lt;/p&gt;
&lt;p&gt;收藏这篇，每次跑 Pipeline 之前扫一遍检查清单。&lt;/p&gt;
&lt;p&gt;四篇读完，你就有了一套完整的 Agent 博客系统。&lt;/p&gt;
&lt;p&gt;从搭建到协作到避坑，该踩的坑我都替你踩了。&lt;/p&gt;
&lt;section style="margin:20px 0;padding:16px 20px;background:linear-gradient(135deg,#4a90d9,#357abd);border-radius:8px;text-align:center;"&gt;
&lt;p style="margin:0 0 8px 0;color:#fff;font-size:16px;font-weight:bold;line-height:1.6;"&gt;关注 varkm，一起学习，一起成长&lt;/p&gt;
&lt;p style="margin:0;color:rgba(255,255,255,0.85);font-size:13px;line-height:1.6;"&gt;多Agent协作系列完更，回复【agent】获取完整检查清单和 Profile 配置模板&lt;/p&gt;
&lt;/section&gt;</description></item><item><title>Hermes vs OpenClaw对比：终端派 Hermes Agent 的选择</title><link>https://blog.kalend.top/2026/05/18/hermes-vs-openclaw.html/</link><pubDate>Mon, 18 May 2026 22:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/18/hermes-vs-openclaw.html/</guid><description>&lt;h2 id="结论先说这不是竞品"&gt;结论先说：这不是竞品
&lt;/h2&gt;&lt;p&gt;这两个项目根本不在一条赛道上。&lt;/p&gt;
&lt;p&gt;OpenClaw（小龙虾🦞）想做的是「全平台个人AI助手」——像Siri一样渗透到你生活的每个角落，微信、WhatsApp、Telegram、macOS、iOS、Android，它都能接。你想用什么渠道就跟它说什么，它就回你在哪儿。&lt;/p&gt;
&lt;p&gt;Hermes Agent 做的是「终端派 Hermes Agent 框架」——给开发者和技术用户的一把瑞士军刀。Kanban任务板、多Agent编排、技能系统、记忆宫殿，全是围绕「如何把复杂任务拆解、分配、执行」设计的。&lt;/p&gt;
&lt;p&gt;如果你想找个好用的个人助手，选 OpenClaw；如果你想搭个能自动跑活的Agent系统，选 Hermes。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="表格对比一眼看懂差异"&gt;表格对比：一眼看懂差异
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;维度&lt;/th&gt;
 &lt;th&gt;OpenClaw（小龙虾）&lt;/th&gt;
 &lt;th&gt;Hermes Agent&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;定位&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;个人AI助手&lt;/td&gt;
 &lt;td&gt;终端Hermes Agent框架&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;GitHub Stars&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;372,888&lt;/td&gt;
 &lt;td&gt;较小众&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;语言&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;TypeScript&lt;/td&gt;
 &lt;td&gt;Python + TypeScript&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;渠道覆盖&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;20+（微信、WhatsApp、Telegram、Slack、Discord、QQ、iMessage、macOS、iOS、Android等）&lt;/td&gt;
 &lt;td&gt;微信、飞书、Telegram、Discord&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;上手门槛&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;一条命令 &lt;code&gt;openclaw onboard&lt;/code&gt; 自动配置&lt;/td&gt;
 &lt;td&gt;需要理解Kanban、Profile、Skill概念&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;多Agent能力&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Multi-agent routing（按渠道/账户隔离）&lt;/td&gt;
 &lt;td&gt;Kanban任务板 + Subagent委托（可视化编排）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;记忆系统&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;基于会话&lt;/td&gt;
 &lt;td&gt;MemPalace（四级回忆链：热记忆→MemPalace→session_search→外部知识库）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;定时任务&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Cron jobs&lt;/td&gt;
 &lt;td&gt;内置Cronjob工具（带keep-alive、context注入）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;技能生态&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;ClawHub（5400+ skills）&lt;/td&gt;
 &lt;td&gt;自建Skill系统（轻量级，易定制）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;部署方式&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Gateway + 多渠道inbox，支持Node 24/22.19+&lt;/td&gt;
 &lt;td&gt;100%本地部署，零第三方依赖&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;安全模型&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Sandbox模式（Docker/SSH/OpenShell）&lt;/td&gt;
 &lt;td&gt;可选Bash/SSH后端&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;特色功能&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Voice Wake、Live Canvas、macOS/iOS/Android原生App&lt;/td&gt;
 &lt;td&gt;Kanban可视化、Profile隔离、技能热加载&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;适合人群&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;想要「好用的助手」的普通用户&lt;/td&gt;
 &lt;td&gt;开发者、技术用户、需要自动化工作流的人&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="渠道覆盖openclaw-完胜"&gt;渠道覆盖：OpenClaw 完胜
&lt;/h2&gt;&lt;p&gt;OpenClaw 支持的渠道列表长得吓人：WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、IRC、Microsoft Teams、Matrix、Feishu、LINE、Mattermost、Nextcloud Talk、Nostr、Synology Chat、Tlon、Twitch、Zalo、Zalo Personal、WeChat、QQ、WebChat、macOS、iOS/Android。&lt;/p&gt;
&lt;p&gt;你想在哪个平台跟它聊天，它就在那儿等你。而且它不是简单的「转发消息」，每个渠道都有深度集成——比如 macOS 有 Live Canvas（可视化工作台）、iOS/Android 有 Voice Wake（语音唤醒）、桌面端有原生 App。&lt;/p&gt;
&lt;p&gt;Hermes 只支持四个渠道：微信、飞书、Telegram、Discord。但对我来说够用了——我的主要沟通场景就是微信，偶尔在 Discord 跟技术社区交流。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="上手门槛openclaw-友好hermes-需要理解成本"&gt;上手门槛：OpenClaw 友好，Hermes 需要理解成本
&lt;/h2&gt;&lt;p&gt;OpenClaw 的入门体验堪称教科书级别：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;npm install -g openclaw@latest
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;openclaw onboard --install-daemon
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;就这么简单。&lt;code&gt;onboard&lt;/code&gt; 命令会引导你一步步配置 Gateway、Workspace、Channels、Skills，像安装软件一样。而且它有 macOS 菜单栏 App、iOS/Android Node，可视化程度很高。&lt;/p&gt;
&lt;p&gt;Hermes 的学习曲线要陡峭一些。你需要理解三个核心概念：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Kanban&lt;/strong&gt;：任务板，用来管理和跟踪任务&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Profile&lt;/strong&gt;：Agent 配置文件，不同的 Profile 有不同的工具集和能力&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Skill&lt;/strong&gt;：技能包，可复用的任务流程&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这不是「安装就能用」，而是「学习后才能发挥威力」的工具。但一旦你理解了这套系统，它的灵活性远超 OpenClaw。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="多agent能力设计哲学差异"&gt;多Agent能力：设计哲学差异
&lt;/h2&gt;&lt;p&gt;两者都支持多 Agent，但思路完全不同。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;OpenClaw&lt;/strong&gt; 采用「路由隔离」模式：你可以为不同的渠道、账户、Peer 配置独立的 Agent。比如你的微信发给 Agent A，WhatsApp 发给 Agent B，Telegram 的某个群发给 Agent C。每个 Agent 有自己的 Workspace、Session、Tool 配置。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Hermes&lt;/strong&gt; 采用「任务板编排」模式：所有任务在 Kanban 上统一管理，通过 &lt;code&gt;parents&lt;/code&gt; 字段表达依赖关系。你可以把一个大任务拆解成多个子任务，每个子任务分配给不同的 Profile（比如 &lt;code&gt;researcher&lt;/code&gt; 做调研、&lt;code&gt;writer&lt;/code&gt; 写文章、&lt;code&gt;reviewer&lt;/code&gt; 审核）。当所有父任务完成，子任务自动从 &lt;code&gt;todo&lt;/code&gt; 提升到 &lt;code&gt;ready&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;OpenClaw 更像「多租户隔离」，Hermes 更像「项目化管理」。前者适合个人多场景使用，后者适合复杂工作流自动化。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="记忆系统mempalace-是杀手级特性"&gt;记忆系统：MemPalace 是杀手级特性
&lt;/h2&gt;&lt;p&gt;Hermes 的 MemPalace 是我最喜欢的功能。它不是简单的「存储对话历史」，而是四级回忆链：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;热记忆&lt;/strong&gt;（~2200字符）：高频使用的用户偏好、行为规则、环境配置&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;MemPalace&lt;/strong&gt;：长期知识库，支持分类存储（drawers + memories）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Session Search&lt;/strong&gt;：搜索过去会话的总结，快速找回上下文&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;外部知识库&lt;/strong&gt;：通过 IMA 集成，连接你的笔记、知识库、收藏&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;OpenClaw 的记忆系统相对传统，主要是基于会话的短期记忆。它也能记住一些上下文，但没有 MemPalace 这种结构化的知识管理。&lt;/p&gt;
&lt;p&gt;如果你需要 Agent 真正「记住」你的长期偏好和知识，Hermes 的 MemPalace 完胜。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="部署方式100本地-vs-gateway模式"&gt;部署方式：100%本地 vs Gateway模式
&lt;/h2&gt;&lt;p&gt;Hermes 是 100% 本地部署的，零第三方依赖。你只需要一个 Python 环境，就能跑起来。所有数据都在你的机器上，隐私绝对安全。&lt;/p&gt;
&lt;p&gt;OpenClaw 是 Gateway 模式——本地跑一个 Gateway 服务（Node 24/22.19+），然后通过各种渠道接入。它支持 7x24 运行，有专业的 daemon 进程管理。但它需要更多的依赖和配置。&lt;/p&gt;
&lt;p&gt;两种部署方式各有优劣：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Hermes&lt;/strong&gt;：简单、轻量、隐私友好，但需要你自己维护进程&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;OpenClaw&lt;/strong&gt;：专业、稳定、开箱即用，但需要更多资源&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="生态clawhub-vs-自建技能"&gt;生态：ClawHub vs 自建技能
&lt;/h2&gt;&lt;p&gt;OpenClaw 有 ClawHub 技能市场，5400+ skills，涵盖各种场景。你想干什么基本都有现成的技能包。&lt;/p&gt;
&lt;p&gt;Hermes 的 Skill 系统更轻量级，主要是自建。官方提供了一些通用技能（比如 &lt;code&gt;kanban-worker&lt;/code&gt;、&lt;code&gt;hugo-blog&lt;/code&gt;），但你大部分时间是自己写技能。&lt;/p&gt;
&lt;p&gt;这跟设计哲学有关：OpenClaw 想做「产品」，给你现成的东西用；Hermes 想做「框架」，给你工具自己做。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="选择建议什么人选什么"&gt;选择建议：什么人选什么？
&lt;/h2&gt;&lt;h3 id="选-openclaw如果你"&gt;选 OpenClaw，如果你：
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;想要一个好用的个人AI助手，不想折腾&lt;/li&gt;
&lt;li&gt;需要覆盖多个渠道（尤其是非技术平台）&lt;/li&gt;
&lt;li&gt;喜欢「可视化操作」和「原生 App」的体验&lt;/li&gt;
&lt;li&gt;不介意多装一些依赖，希望开箱即用&lt;/li&gt;
&lt;li&gt;主要场景是「聊聊天、查查信息、简单自动化」&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="选-hermes如果你"&gt;选 Hermes，如果你：
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;是开发者或技术用户，愿意学习新概念&lt;/li&gt;
&lt;li&gt;需要复杂工作流自动化（比如博客写作、代码审查、多Agent协作）&lt;/li&gt;
&lt;li&gt;看重数据隐私，希望 100% 本地部署&lt;/li&gt;
&lt;li&gt;想要灵活定制自己的 Agent 系统&lt;/li&gt;
&lt;li&gt;主要场景是「项目化任务管理」和「深度自动化」&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="我的选择"&gt;我的选择
&lt;/h2&gt;&lt;p&gt;我两个都用了，但最后选择了 Hermes。&lt;/p&gt;
&lt;p&gt;原因很简单：我是一个技术用户，大部分时间在终端和编辑器里工作。Hermes 的 Kanban、Profile、Skill 这套系统，正好匹配我的工作方式。我可以用 Kanban 管理博客写作计划，用不同的 Profile 处理不同类型的任务，用 Skill 封装可复用的流程。&lt;/p&gt;
&lt;p&gt;OpenClaw 很强大，但它的优势不在我的使用场景里。我不需要在 20 个渠道上跟 AI 聊天，也不需要 Live Canvas 或 Voice Wake。我需要的是能帮我自动化复杂任务、记住我的长期偏好、可灵活定制的工具——这些正是 Hermes 的强项。&lt;/p&gt;
&lt;p&gt;当然，这不代表 OpenClaw 不好。它是一个非常优秀的个人AI助手，GitHub 372,888 stars 说明了一切。只是对我来说，Hermes 更对胃口。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="后续有没有可能融合"&gt;后续：有没有可能融合？
&lt;/h2&gt;&lt;p&gt;技术上完全可能。Hermes 可以通过 WebSocket 或 CLI 接入 OpenClaw 的 Gateway，享受它的多渠道能力；OpenClaw 也可以借鉴 Hermes 的 Kanban 和 MemPalace，增强任务管理和知识记忆。&lt;/p&gt;
&lt;p&gt;但目前它们确实是两个方向的产品。OpenClaw 追求「覆盖广」和「易用」，Hermes 追求「深度定制」和「专业自动化」。&lt;/p&gt;
&lt;p&gt;没有谁比谁好，只有谁更适合你。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;&lt;strong&gt;关注 varkm，一起学习，一起成长&lt;/strong&gt;&lt;/p&gt;</description></item><item><title>AI Agent 会话管理实战：3条命令搞定多任务切换</title><link>https://blog.kalend.top/2026/05/17/ai-agent-session-management.html/</link><pubDate>Sun, 17 May 2026 22:57:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/17/ai-agent-session-management.html/</guid><description>&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;AI 助手聊到一半，突然想起另一件事，怎么办？&lt;/p&gt;
&lt;p&gt;大多数人直接在同一个对话里追问。结果就是：上下文被无关内容塞满，AI 开始&amp;quot;串台&amp;quot;，之前聊的东西也找不回来了。&lt;/p&gt;
&lt;p&gt;解决方案就三条命令：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/title 博客开发 ← 给当前对话起个名字
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/new ← 开一个全新对话
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/resume 博客开发 ← 随时切回来继续
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;下面展开说说。&lt;/p&gt;
&lt;h2 id="痛点所有话题混在一个对话里有多灾难"&gt;痛点：所有话题混在一个对话里有多灾难
&lt;/h2&gt;&lt;p&gt;跟 AI 助手聊久了，你是不是也遇到过这些情况：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;聊着&lt;strong&gt;写代码&lt;/strong&gt;，突然想问&lt;strong&gt;网络诊断&lt;/strong&gt;，但切了话题之前的代码上下文就没了&lt;/li&gt;
&lt;li&gt;一个对话塞了十几个话题，AI 回复开始&lt;strong&gt;串上下文&lt;/strong&gt;，把 A 任务的信息用到 B 上&lt;/li&gt;
&lt;li&gt;上周聊过的东西，翻半天记录也找不到&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;本质问题是：&lt;strong&gt;AI 的上下文窗口是有限的&lt;/strong&gt;。所有话题挤在一起，有用信息被稀释，AI 的回答质量直线下降。&lt;/p&gt;
&lt;h2 id="核心命令会话切换三件套"&gt;核心命令：会话切换三件套
&lt;/h2&gt;&lt;p&gt;在微信、Telegram、Discord 等所有聊天平台都能用：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;th&gt;示例&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/title 名称&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;给当前会话命名&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;/title 博客迁移&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/new&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;创建全新会话，当前会话保留&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;/new&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/resume 名称&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;恢复之前命名的会话&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;/resume 博客迁移&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;再加一条查看命令：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/sessions&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;列出所有历史会话（含标题、预览、最后活跃时间）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="典型工作流a--b--回-a"&gt;典型工作流：A → B → 回 A
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/title 博客文章 ← 给当前任务 A 命名
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...写文章中...
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/new ← 切到全新会话
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/title 网络诊断 ← 开始任务 B
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...修网络中...
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/resume 博客文章 ← 切回 A，上下文完整保留
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...继续写...
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="其他实用命令"&gt;其他实用命令
&lt;/h2&gt;&lt;p&gt;除了会话切换，还有几个高频命令：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;对话控制：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/retry&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;重试上一条回复（不满意就重来）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/undo&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;撤回上一轮对话&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/stop&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;终止正在运行的任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/compress&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;手动压缩上下文（长对话变卡时用）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;信息查看：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/status&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;查看当前会话信息&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/model&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;切换模型&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/usage&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;查看 token 用量&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/help&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;查看所有可用命令&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;高级功能：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/branch&lt;/code&gt; 或 &lt;code&gt;/fork&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;从当前对话分叉，探索不同方向&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/goal&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;设置跨轮次的持续目标&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/background&lt;/code&gt; 或 &lt;code&gt;/bg&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;后台运行任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;code&gt;/new&lt;/code&gt; 的别名是 &lt;code&gt;/reset&lt;/code&gt;，效果一样。
&lt;code&gt;/background&lt;/code&gt; 还可以用 &lt;code&gt;/btw&lt;/code&gt; 触发。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="实战场景"&gt;实战场景
&lt;/h2&gt;&lt;h3 id="场景-1多任务并行"&gt;场景 1：多任务并行
&lt;/h3&gt;&lt;p&gt;我日常最常用的模式——同时推进多个任务：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;span class="lnt"&gt;8
&lt;/span&gt;&lt;span class="lnt"&gt;9
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/title 博客文章
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...写了一半...
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/new
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/title 服务器监控
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...查了下告警...
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/resume 博客文章
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...继续写，之前的上下文都在...
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;关键点：&lt;strong&gt;每次切走之前先 &lt;code&gt;/title&lt;/code&gt;&lt;/strong&gt;，不命名的话恢复时只能靠 &lt;code&gt;/sessions&lt;/code&gt; 手动找。&lt;/p&gt;
&lt;h3 id="场景-2长对话变卡"&gt;场景 2：长对话变卡
&lt;/h3&gt;&lt;p&gt;一个会话聊了太多次，AI 开始&amp;quot;忘记&amp;quot;前面的内容：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/compress ← 压缩上下文，释放空间
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;AI 会自动总结已有对话，腾出上下文窗口给后续对话。&lt;/p&gt;
&lt;h3 id="场景-3试错探索"&gt;场景 3：试错探索
&lt;/h3&gt;&lt;p&gt;对 AI 的回答不满意，想试另一个方向，但不想丢失当前进度：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/branch 方案B ← 从当前位置分叉
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...试了方案B...
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ← 不满意的话，原对话还在
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="cli-用户额外福利"&gt;CLI 用户额外福利
&lt;/h2&gt;&lt;p&gt;终端模式下还有几个独有命令：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/clear&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;清屏 + 新建会话&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/history&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;查看完整对话历史&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/save&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;保存当前对话&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/snapshot&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;创建/恢复状态快照&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;/handoff&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;把 CLI 会话移交到聊天平台&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这些在微信等聊天平台不可用，只在终端 CLI 模式下支持。&lt;/p&gt;
&lt;h2 id="小结"&gt;小结
&lt;/h2&gt;&lt;p&gt;会话管理不是花架子，是&lt;strong&gt;真正影响 AI 使用效率的核心能力&lt;/strong&gt;。记住这三条：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;命名&lt;/strong&gt;：&lt;code&gt;/title&lt;/code&gt; 给每个任务打标签&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;切换&lt;/strong&gt;：&lt;code&gt;/new&lt;/code&gt; 开新话题，老话题自动保留&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;恢复&lt;/strong&gt;：&lt;code&gt;/resume&lt;/code&gt; 随时切回，上下文完整&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;养成习惯后你会发现：AI 不再串上下文了，之前聊过的东西随时能找回，多任务并行变得非常自然。&lt;/p&gt;</description></item><item><title>给Agent装个自动记忆：让AI自己记住你说过的话</title><link>https://blog.kalend.top/2026/05/15/auto-memory-extraction.html/</link><pubDate>Fri, 15 May 2026 20:30:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/15/auto-memory-extraction.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;你跟AI说&amp;quot;我习惯用vim，不要用nano&amp;quot;，下次对话它照样给你nano。每次都要重复说，烦不烦？&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;核心思路就三行：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;session结束 → 调免费LLM提取记忆 → 向量去重后存入ChromaDB
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;整篇文章读完，你的Agent就能在每次对话结束时&lt;strong&gt;自动&lt;/strong&gt;把用户偏好、事件、工作流提取出来，下次对话自动加载。成本：&lt;strong&gt;¥0&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="架构"&gt;架构
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;span class="lnt"&gt;16
&lt;/span&gt;&lt;span class="lnt"&gt;17
&lt;/span&gt;&lt;span class="lnt"&gt;18
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;┌──────────┐ session end ┌──────────────┐
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;│ 对话记录 │ ──────────────→ │ 已有记忆注入P2 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;└──────────┘ └──────┬───────┘
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ┌──────▼───────┐
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ 免费LLM提取P0 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ 分类+结构化 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; └──────┬───────┘
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ┌──────▼───────┐
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ 向量去重 P1 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ cosine&amp;lt;0.15 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; └──────┬───────┘
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ┌──────▼───────┐
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ ChromaDB │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; │ 本地存储 │
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; └──────────────┘
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;三层防护&lt;/strong&gt;确保不存垃圾、不存重复：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;层级&lt;/th&gt;
 &lt;th&gt;机制&lt;/th&gt;
 &lt;th&gt;作用&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;P2 提取前&lt;/td&gt;
 &lt;td&gt;已有记忆注入prompt&lt;/td&gt;
 &lt;td&gt;模型直接跳过已知内容&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;P0 提取中&lt;/td&gt;
 &lt;td&gt;免费LLM分类提取&lt;/td&gt;
 &lt;td&gt;persona/episodic/instruction&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;P1 存入时&lt;/td&gt;
 &lt;td&gt;ChromaDB向量去重&lt;/td&gt;
 &lt;td&gt;兜底防重复存储&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="前置条件"&gt;前置条件
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;ChromaDB&lt;/strong&gt;：本地向量数据库，&lt;code&gt;pip install chromadb&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;免费LLM API Key&lt;/strong&gt;：在 &lt;a class="link" href="https://open.bigmodel.cn" target="_blank" rel="noopener"
 &gt;智谱开放平台&lt;/a&gt; 注册账号，自动获得API Key。&lt;strong&gt;GLM-4-Flash模型永久免费&lt;/strong&gt;，无需绑定支付方式&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Python 3.9+&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="step-1-提取prompt模板"&gt;Step 1: 提取Prompt模板
&lt;/h2&gt;&lt;p&gt;这个prompt是整个系统的灵魂。把它加到你的MemoryProvider插件里：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;span class="lnt"&gt;16
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;EXTRACTION_SYSTEM_PROMPT&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;你是一个记忆提取助手。从对话中提取值得长期记住的信息。&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;严格按以下JSON格式输出，不要输出其他任何内容：&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;{&amp;#34;persona&amp;#34;:[&amp;#34;字符串1&amp;#34;,&amp;#34;字符串2&amp;#34;],&amp;#34;episodic&amp;#34;:[&amp;#34;字符串1&amp;#34;],&amp;#34;instruction&amp;#34;:[&amp;#34;字符串1&amp;#34;]}&lt;/span&gt;&lt;span class="se"&gt;\n\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;分类规则：&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;- persona: 用户偏好、习惯、身份、性格特征、沟通风格&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;- episodic: 具体事件和行动&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;- instruction: 工作流程、规则、纠正、技术方案&lt;/span&gt;&lt;span class="se"&gt;\n\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;关键规则：&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;1. 只提取新的、具体的、有价值的信息&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;2. 数组中每个元素必须是纯字符串，不要用对象&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;3. 没有有价值的信息就全部输出空数组&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;4. 每条不超过80字，用简洁陈述句&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;5. 不要重复同一条信息&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;6. 偏好类信息归persona，不要归episodic&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;为什么这么设计&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;temperature: 0.1&lt;/code&gt; + 严格格式约束 → 输出稳定可解析&lt;/li&gt;
&lt;li&gt;三分类覆盖了90%以上的记忆类型&lt;/li&gt;
&lt;li&gt;&amp;ldquo;没有有价值的信息就输出空数组&amp;rdquo; → 避免硬造记忆&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="step-2-on_session_end钩子"&gt;Step 2: on_session_end钩子
&lt;/h2&gt;&lt;p&gt;Session结束时触发提取。&lt;strong&gt;关键设计：后台线程异步执行，不阻塞用户&lt;/strong&gt;。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;span class="lnt"&gt;16
&lt;/span&gt;&lt;span class="lnt"&gt;17
&lt;/span&gt;&lt;span class="lnt"&gt;18
&lt;/span&gt;&lt;span class="lnt"&gt;19
&lt;/span&gt;&lt;span class="lnt"&gt;20
&lt;/span&gt;&lt;span class="lnt"&gt;21
&lt;/span&gt;&lt;span class="lnt"&gt;22
&lt;/span&gt;&lt;span class="lnt"&gt;23
&lt;/span&gt;&lt;span class="lnt"&gt;24
&lt;/span&gt;&lt;span class="lnt"&gt;25
&lt;/span&gt;&lt;span class="lnt"&gt;26
&lt;/span&gt;&lt;span class="lnt"&gt;27
&lt;/span&gt;&lt;span class="lnt"&gt;28
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;threading&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;json&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;on_session_end&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="c1"&gt;# 过滤出user/assistant消息&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;conversation_lines&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;[]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;msg&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;role&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;msg&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;role&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;content&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;msg&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;content&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;role&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;assistant&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="ow"&gt;and&lt;/span&gt; &lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;prefix&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;用户&amp;#39;&lt;/span&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;role&lt;/span&gt; &lt;span class="o"&gt;==&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt; &lt;span class="k"&gt;else&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;助手&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;conversation_lines&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;append&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;prefix&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;：&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;[:&lt;/span&gt;&lt;span class="mi"&gt;500&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="nb"&gt;len&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;conversation_lines&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="o"&gt;&amp;lt;&lt;/span&gt; &lt;span class="mi"&gt;2&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="c1"&gt;# 太短不提取&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;conversation_text&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;join&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;conversation_lines&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="nb"&gt;len&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;conversation_text&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="o"&gt;&amp;gt;&lt;/span&gt; &lt;span class="mi"&gt;4000&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;conversation_text&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;conversation_text&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="o"&gt;-&lt;/span&gt;&lt;span class="mi"&gt;4000&lt;/span&gt;&lt;span class="p"&gt;:]&lt;/span&gt; &lt;span class="c1"&gt;# 截取最近4000字符&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="c1"&gt;# 预取已有记忆（P2缓存）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;existing_context&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_build_existing_context&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="c1"&gt;# 后台线程执行提取&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_extract&lt;/span&gt;&lt;span class="p"&gt;():&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_run_extraction&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;conversation_text&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;existing_context&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;threading&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;Thread&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;target&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;_extract&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;daemon&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="kc"&gt;True&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;start&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;注意几个细节&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;每条消息截取500字符 → 控制总量&lt;/li&gt;
&lt;li&gt;总文本超过4000字符只取末尾 → 最近的内容最有价值&lt;/li&gt;
&lt;li&gt;对话少于2条直接跳过 → 避免无效提取&lt;/li&gt;
&lt;li&gt;&lt;code&gt;daemon=True&lt;/code&gt; → 主进程退出时不会卡住&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="step-3-api调用实现"&gt;Step 3: API调用实现
&lt;/h2&gt;&lt;p&gt;直接用标准库，不依赖额外包：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;span class="lnt"&gt;16
&lt;/span&gt;&lt;span class="lnt"&gt;17
&lt;/span&gt;&lt;span class="lnt"&gt;18
&lt;/span&gt;&lt;span class="lnt"&gt;19
&lt;/span&gt;&lt;span class="lnt"&gt;20
&lt;/span&gt;&lt;span class="lnt"&gt;21
&lt;/span&gt;&lt;span class="lnt"&gt;22
&lt;/span&gt;&lt;span class="lnt"&gt;23
&lt;/span&gt;&lt;span class="lnt"&gt;24
&lt;/span&gt;&lt;span class="lnt"&gt;25
&lt;/span&gt;&lt;span class="lnt"&gt;26
&lt;/span&gt;&lt;span class="lnt"&gt;27
&lt;/span&gt;&lt;span class="lnt"&gt;28
&lt;/span&gt;&lt;span class="lnt"&gt;29
&lt;/span&gt;&lt;span class="lnt"&gt;30
&lt;/span&gt;&lt;span class="lnt"&gt;31
&lt;/span&gt;&lt;span class="lnt"&gt;32
&lt;/span&gt;&lt;span class="lnt"&gt;33
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_run_extraction&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;conversation_text&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;existing_context&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;urllib.request&lt;/span&gt;&lt;span class="o"&gt;,&lt;/span&gt; &lt;span class="nn"&gt;urllib.error&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;system_prompt&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;EXTRACTION_SYSTEM_PROMPT&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;existing_context&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;system_prompt&lt;/span&gt; &lt;span class="o"&gt;+=&lt;/span&gt; &lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="se"&gt;\n\n&lt;/span&gt;&lt;span class="s1"&gt;已知记忆（不要重复提取这些内容）：&lt;/span&gt;&lt;span class="se"&gt;\n&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;existing_context&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;payload&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;dumps&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;model&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;glm-4-flash&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="c1"&gt;# 免费模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;messages&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;role&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;system&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;content&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;system_prompt&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;role&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;content&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;conversation_text&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;max_tokens&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;800&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;temperature&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mf"&gt;0.1&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;},&lt;/span&gt; &lt;span class="n"&gt;ensure_ascii&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="kc"&gt;False&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;encode&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;utf-8&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;req&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;urllib&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;request&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;Request&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;https://open.bigmodel.cn/api/paas/v4/chat/completions&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;data&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;payload&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;method&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;POST&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;req&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;add_header&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;Authorization&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;Bearer &lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_extract_api_key&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;req&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;add_header&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;Content-Type&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;application/json&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;try&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;with&lt;/span&gt; &lt;span class="n"&gt;urllib&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;request&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;urlopen&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;req&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;timeout&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;30&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="k"&gt;as&lt;/span&gt; &lt;span class="n"&gt;resp&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;result&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;loads&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;resp&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;read&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;decode&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;utf-8&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;))&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;except&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;urllib&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;error&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;URLError&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;JSONDecodeError&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="ne"&gt;KeyError&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="k"&gt;as&lt;/span&gt; &lt;span class="n"&gt;e&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="c1"&gt;# 静默失败，不影响主流程&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;content&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;result&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;choices&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;][&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;][&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;message&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;][&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;content&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;extracted&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_parse_extraction_json&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_store_extracted_memories&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;extracted&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;JSON解析加个容错：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;re&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_parse_extraction_json&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s2"&gt;&amp;#34;&amp;#34;&amp;#34;容错解析，处理LLM输出前后可能的多余文本&amp;#34;&amp;#34;&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;try&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;loads&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;except&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;JSONDecodeError&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="c1"&gt;# 尝试提取花括号内容&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;match&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;re&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;search&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;r&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;\{[^&lt;/span&gt;&lt;span class="si"&gt;{}&lt;/span&gt;&lt;span class="s1"&gt;]*\}&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;re&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;DOTALL&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="k"&gt;match&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;try&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;loads&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="k"&gt;match&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;group&lt;/span&gt;&lt;span class="p"&gt;())&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;except&lt;/span&gt; &lt;span class="n"&gt;json&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;JSONDecodeError&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;pass&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;persona&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[],&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;episodic&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[],&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;instruction&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[]}&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="step-4-向量去重p1"&gt;Step 4: 向量去重（P1）
&lt;/h2&gt;&lt;p&gt;这是防重复的&lt;strong&gt;最后防线&lt;/strong&gt;。即使LLM没看到已有记忆，向量相似度也能拦住：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;span class="lnt"&gt;16
&lt;/span&gt;&lt;span class="lnt"&gt;17
&lt;/span&gt;&lt;span class="lnt"&gt;18
&lt;/span&gt;&lt;span class="lnt"&gt;19
&lt;/span&gt;&lt;span class="lnt"&gt;20
&lt;/span&gt;&lt;span class="lnt"&gt;21
&lt;/span&gt;&lt;span class="lnt"&gt;22
&lt;/span&gt;&lt;span class="lnt"&gt;23
&lt;/span&gt;&lt;span class="lnt"&gt;24
&lt;/span&gt;&lt;span class="lnt"&gt;25
&lt;/span&gt;&lt;span class="lnt"&gt;26
&lt;/span&gt;&lt;span class="lnt"&gt;27
&lt;/span&gt;&lt;span class="lnt"&gt;28
&lt;/span&gt;&lt;span class="lnt"&gt;29
&lt;/span&gt;&lt;span class="lnt"&gt;30
&lt;/span&gt;&lt;span class="lnt"&gt;31
&lt;/span&gt;&lt;span class="lnt"&gt;32
&lt;/span&gt;&lt;span class="lnt"&gt;33
&lt;/span&gt;&lt;span class="lnt"&gt;34
&lt;/span&gt;&lt;span class="lnt"&gt;35
&lt;/span&gt;&lt;span class="lnt"&gt;36
&lt;/span&gt;&lt;span class="lnt"&gt;37
&lt;/span&gt;&lt;span class="lnt"&gt;38
&lt;/span&gt;&lt;span class="lnt"&gt;39
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;_DEDUP_MAX_DISTANCE&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="mf"&gt;0.15&lt;/span&gt; &lt;span class="c1"&gt;# ~92%相似度&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_is_duplicate&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;text&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;results&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_col&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;query&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;query_texts&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="n"&gt;text&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;n_results&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;3&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;where&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;wing&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;include&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;distances&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;distances&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;results&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;distances&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;[[]])[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="n"&gt;distances&lt;/span&gt; &lt;span class="ow"&gt;and&lt;/span&gt; &lt;span class="n"&gt;distances&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt; &lt;span class="o"&gt;&amp;lt;&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_DEDUP_MAX_DISTANCE&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_store_extracted_memories&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;extracted&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;time&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;stored&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="mi"&gt;0&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;category&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;items&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;extracted&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;items&lt;/span&gt;&lt;span class="p"&gt;():&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;wing_map&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;persona&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;episodic&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;episodic&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;instruction&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;instruction&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;}&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;wing&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;wing_map&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;category&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;item&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;items&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="ow"&gt;not&lt;/span&gt; &lt;span class="n"&gt;item&lt;/span&gt; &lt;span class="ow"&gt;or&lt;/span&gt; &lt;span class="nb"&gt;len&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;item&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;strip&lt;/span&gt;&lt;span class="p"&gt;())&lt;/span&gt; &lt;span class="o"&gt;&amp;lt;&lt;/span&gt; &lt;span class="mi"&gt;5&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;continue&lt;/span&gt; &lt;span class="c1"&gt;# 跳过太短的&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_is_duplicate&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;item&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;continue&lt;/span&gt; &lt;span class="c1"&gt;# 跳过重复&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_col&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;add&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;documents&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="n"&gt;item&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;metadatas&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;wing&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;room&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;auto-extract&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;added_by&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;auto-extract&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;category&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;category&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="s1"&gt;&amp;#39;timestamp&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nb"&gt;str&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nb"&gt;int&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;time&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;time&lt;/span&gt;&lt;span class="p"&gt;())),&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;}],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;ids&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;extract_&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;category&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;_&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="nb"&gt;int&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;time&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;time&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;&lt;span class="o"&gt;*&lt;/span&gt;&lt;span class="mi"&gt;1000&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;_&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;stored&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;stored&lt;/span&gt; &lt;span class="o"&gt;+=&lt;/span&gt; &lt;span class="mi"&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;为什么阈值是0.15&lt;/strong&gt;：&lt;/p&gt;
&lt;p&gt;实测数据——&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;距离阈值&lt;/th&gt;
 &lt;th&gt;相似度&lt;/th&gt;
 &lt;th&gt;去重效果&lt;/th&gt;
 &lt;th&gt;误杀率&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;0.10&lt;/td&gt;
 &lt;td&gt;~95%&lt;/td&gt;
 &lt;td&gt;去重80%&lt;/td&gt;
 &lt;td&gt;极低&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;0.15&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;~92%&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;去重90%+&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;&amp;lt;3%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;0.20&lt;/td&gt;
 &lt;td&gt;~88%&lt;/td&gt;
 &lt;td&gt;去重95%&lt;/td&gt;
 &lt;td&gt;~8%&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;0.15是甜点。&lt;/p&gt;
&lt;h2 id="step-5-已知记忆注入p2"&gt;Step 5: 已知记忆注入（P2）
&lt;/h2&gt;&lt;p&gt;在调LLM之前，把已有记忆塞进prompt。这样模型&lt;strong&gt;直接跳过已知内容&lt;/strong&gt;，省token又防重复：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;def&lt;/span&gt; &lt;span class="nf"&gt;_build_existing_context&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;parts&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;[]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;user&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;instruction&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;results&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="bp"&gt;self&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;_col&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;where&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;wing&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="n"&gt;wing&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;include&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;documents&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;metadatas&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;limit&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;20&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;doc&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;meta&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="nb"&gt;zip&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;results&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;documents&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt; &lt;span class="n"&gt;results&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;metadatas&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;]):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;meta&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;added_by&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;auto-extract&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;hermes&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;builtin-mirror&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="n"&gt;parts&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;append&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;doc&lt;/span&gt;&lt;span class="p"&gt;[:&lt;/span&gt;&lt;span class="mi"&gt;100&lt;/span&gt;&lt;span class="p"&gt;])&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="k"&gt;return&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;；&amp;#39;&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;join&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;parts&lt;/span&gt;&lt;span class="p"&gt;[:&lt;/span&gt;&lt;span class="mi"&gt;15&lt;/span&gt;&lt;span class="p"&gt;])[:&lt;/span&gt;&lt;span class="mi"&gt;500&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt; &lt;span class="k"&gt;if&lt;/span&gt; &lt;span class="n"&gt;parts&lt;/span&gt; &lt;span class="k"&gt;else&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;只取最近15条、截断到500字符。&lt;strong&gt;控制prompt长度&lt;/strong&gt;，别把提取请求搞得太贵。&lt;/p&gt;
&lt;h2 id="step-6-配置和测试"&gt;Step 6: 配置和测试
&lt;/h2&gt;&lt;p&gt;在 &lt;code&gt;mempalace.json&lt;/code&gt; 中启用自动提取：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-json" data-lang="json"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;{&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="nt"&gt;&amp;#34;auto_extract&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="nt"&gt;&amp;#34;extract_model&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s2"&gt;&amp;#34;glm-4-flash&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="验证方法"&gt;验证方法
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;测试1：基本提取&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;跟Agent说几句话：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;用户：我习惯用vim编辑器，不要给我推荐nano
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;用户：我的项目统一用Python 3.11
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;用户：代码风格遵循PEP8，docstring用Google风格
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;结束session，然后检查ChromaDB：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="nn"&gt;chromadb&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;chromadb&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;PersistentClient&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;path&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;./mempalace_db&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;col&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get_collection&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;memories&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="n"&gt;results&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;col&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;where&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;added_by&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;auto-extract&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt; &lt;span class="n"&gt;include&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;documents&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="s1"&gt;&amp;#39;metadatas&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;])&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;doc&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;meta&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="nb"&gt;zip&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;results&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;documents&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt; &lt;span class="n"&gt;results&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;metadatas&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;]):&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="nb"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sa"&gt;f&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;[&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;meta&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s1"&gt;&amp;#39;category&amp;#39;&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;] &lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="n"&gt;doc&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="s2"&gt;&amp;#34;&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;预期输出类似：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;[persona] 用户习惯使用vim编辑器
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;[instruction] 项目统一使用Python 3.11
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;[instruction] 代码风格遵循PEP8，docstring用Google风格
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;测试2：去重验证&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;同一段对话连续触发两次提取，第二次应该&lt;strong&gt;0条新增&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;测试3：新session加载&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;开启新对话，问Agent：&amp;ldquo;你知道我用什么编辑器吗？&amp;quot;——它应该能从记忆中回答&amp;quot;vim&amp;rdquo;。&lt;/p&gt;
&lt;h2 id="实测效果数据"&gt;实测效果数据
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;指标&lt;/th&gt;
 &lt;th&gt;数据&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;提取延迟&lt;/td&gt;
 &lt;td&gt;3-7秒（后台异步，不阻塞）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Token消耗&lt;/td&gt;
 &lt;td&gt;300-500/次&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;成本&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;¥0&lt;/strong&gt;（GLM-4-Flash免费）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;分类准确率&lt;/td&gt;
 &lt;td&gt;&amp;gt;90%（persona/episodic/instruction）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;去重拦截率&lt;/td&gt;
 &lt;td&gt;90%+（重复对话）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;误存率&lt;/td&gt;
 &lt;td&gt;&amp;lt;2%（无效信息被存入）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="三层防护机制总结"&gt;三层防护机制总结
&lt;/h2&gt;&lt;p&gt;再说一遍这个设计，因为它是&lt;strong&gt;整个系统可靠性&lt;/strong&gt;的关键：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;P2 提取前：已知记忆注入 → LLM直接跳过 → 省token
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;P0 提取中：结构化分类 → 只保留有价值信息 → 控质量
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;P1 存入时：向量相似度去重 → 兜底拦截 → 防重复
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;三层不是冗余，是&lt;strong&gt;互补&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;P2漏了（记忆太多超过500字符截断了）→ P1兜底&lt;/li&gt;
&lt;li&gt;P1漏了（措辞差异太大向量没拦住）→ P2已经拦了大部分&lt;/li&gt;
&lt;li&gt;P0是核心 → 决定提取质量&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="一句话总结"&gt;一句话总结
&lt;/h2&gt;&lt;p&gt;自动记忆不是奢侈品，是Agent的基础设施。当AI能记住你说过的每一句偏好，你就不需要每次对话都从头开始。&lt;/p&gt;</description></item><item><title>Kanban + Profile：让你的 AI Agent 自己管博客</title><link>https://blog.kalend.top/2026/05/14/hermes-kanban-tutorial.html/</link><pubDate>Thu, 14 May 2026 23:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-kanban-tutorial.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;你跟 AI 说&amp;quot;帮我写篇博客&amp;quot;，它写完就走了。下次再说，它又是从零开始。&lt;/p&gt;
&lt;p&gt;这篇文章教你用 Hermes 的 Kanban + Profile，给 AI Agent 一个&lt;strong&gt;专职身份&lt;/strong&gt;，让它自己管博客。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;delegate_task 是临时工，Kanban + Profile 是全职员工。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;如果你想：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;让一个 AI &lt;strong&gt;专门负责博客&lt;/strong&gt;（写文章、同步、部署）&lt;/li&gt;
&lt;li&gt;任务&lt;strong&gt;不丢失&lt;/strong&gt;（主 Agent 崩了也不影响）&lt;/li&gt;
&lt;li&gt;随时&lt;strong&gt;查看进度&lt;/strong&gt;（微信直接看）&lt;/li&gt;
&lt;li&gt;出了问题&lt;strong&gt;自动通知你&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那就用 Kanban + Profile。下面是完整方案。&lt;/p&gt;
&lt;h2 id="我的踩坑故事"&gt;我的踩坑故事
&lt;/h2&gt;&lt;p&gt;我有一个 Hugo 静态博客。之前让主 Agent 兼顾博客写作——一边排查路由器 DNS 问题，一边写博客文章。结果：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;read_file 带行号前缀写回文件&lt;/strong&gt;，Hugo front matter 全毁，页面数从 168 暴跌到 102&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;日期格式不对&lt;/strong&gt;，&lt;code&gt;date: 2026-05-14&lt;/code&gt; 被解析成 &lt;code&gt;0001-01-01&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;中文 URL 编码错误&lt;/strong&gt;，又拍云上传 45 个文件失败&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;根本原因：&lt;strong&gt;上下文切换太频繁&lt;/strong&gt;，主 Agent 在路由器、DNS、博客之间反复横跳，每次切换都丢细节。&lt;/p&gt;
&lt;h2 id="两种方案对比"&gt;两种方案对比
&lt;/h2&gt;&lt;p&gt;很多人第一反应是 &lt;code&gt;delegate_task&lt;/code&gt;（子代理），我也是。但调研完官方文档后发现，这俩根本不是一个量级：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;维度&lt;/th&gt;
 &lt;th&gt;delegate_task&lt;/th&gt;
 &lt;th&gt;Kanban + Profile&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;形状&lt;/td&gt;
 &lt;td&gt;函数调用（fork→join）&lt;/td&gt;
 &lt;td&gt;持久工作队列 + 状态机&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;生命周期&lt;/td&gt;
 &lt;td&gt;分钟级，调用者阻塞等待&lt;/td&gt;
 &lt;td&gt;小时/天级，fire-and-forget&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;身份&lt;/td&gt;
 &lt;td&gt;匿名子代理，干完就走&lt;/td&gt;
 &lt;td&gt;命名 Profile，有自己的记忆和人格&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;抗中断&lt;/td&gt;
 &lt;td&gt;父 Agent 断了，子代理也死&lt;/td&gt;
 &lt;td&gt;独立进程，互不影响&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;可恢复&lt;/td&gt;
 &lt;td&gt;失败即失败&lt;/td&gt;
 &lt;td&gt;阻塞→解除→重跑；崩溃→回收&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;人工介入&lt;/td&gt;
 &lt;td&gt;不支持&lt;/td&gt;
 &lt;td&gt;任何节点都能 comment/unblock&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;审计追踪&lt;/td&gt;
 &lt;td&gt;上下文压缩后丢失&lt;/td&gt;
 &lt;td&gt;SQLite 永久保存&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;一句话：delegate_task 是你叫一次临时工；Kanban 是你雇了个全职员工。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="架构设计"&gt;架构设计
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;你（微信/Telegram/CLI）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ↓ &amp;#34;写一篇关于 XX 的博客&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;主 Agent（orchestrator）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ↓ kanban_create 创建任务
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;kanban.db（SQLite 持久化看板）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ↓ dispatcher 自动调度（gateway 内嵌，60s 轮询）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer（独立 Profile，独立进程）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ↓ kanban_complete / kanban_block 汇报
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;kanban.db
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ↓ gateway 自动通知
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;你（微信收到完成/阻塞通知）
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;关键点&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;dispatcher 内嵌在 gateway 里&lt;/strong&gt;，不需要额外的守护进程&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;blog-writer 是独立 Profile&lt;/strong&gt;，有自己的 config、记忆、skills、SOUL.md&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;gateway 自动推送通知&lt;/strong&gt;，任务完成或卡住都会通知你&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;你随时可以用 &lt;code&gt;/kanban&lt;/code&gt; 命令&lt;/strong&gt;查看进度、添加评论、解除阻塞&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="5-步搭建"&gt;5 步搭建
&lt;/h2&gt;&lt;h3 id="第-1-步创建独立-profile"&gt;第 1 步：创建独立 Profile
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes profile create blog-writer --clone
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;code&gt;--clone&lt;/code&gt; 会复制当前 Profile 的 config.yaml、.env、SOUL.md，省得重新配 API Key。&lt;/p&gt;
&lt;h3 id="第-2-步配置独立人格和工作目录"&gt;第 2 步：配置独立人格和工作目录
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 配置工作目录指向博客项目&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer config &lt;span class="nb"&gt;set&lt;/span&gt; terminal.cwd /root/blog
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 写专属 SOUL.md&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;cat &amp;gt; ~/.hermes/profiles/blog-writer/SOUL.md &lt;span class="s"&gt;&amp;lt;&amp;lt; &amp;#39;EOF&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;你是 blog.kalend.top 的博客写作专家。
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;职责：撰写高质量技术博客、同步公众号文章、构建和部署。
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;风格：简洁直接、先结论后细节、代码示例丰富。
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;严格遵守 hugo-blog skill 中的所有陷阱清单。
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="s"&gt;EOF&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="第-3-步确认-skill-可用"&gt;第 3 步：确认 skill 可用
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;span class="lnt"&gt;8
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# kanban-worker 是 bundled skill，自动同步&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer skills list &lt;span class="p"&gt;|&lt;/span&gt; grep kanban-worker
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 如果缺失，恢复&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer skills reset kanban-worker --restore
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 验证 hugo-blog skill（需要手动确保已安装）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer skills list &lt;span class="p"&gt;|&lt;/span&gt; grep hugo-blog
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="第-4-步初始化-kanban"&gt;第 4 步：初始化 Kanban
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 创建看板数据库（幂等操作）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban init
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 确保 gateway 运行（内嵌 dispatcher）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes gateway start
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="第-5-步创建第一个任务"&gt;第 5 步：创建第一个任务
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban create &lt;span class="s2"&gt;&amp;#34;写一篇关于 Hermes Kanban 的博客&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --assignee blog-writer &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --skill hugo-blog &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --workspace dir:/root/blog
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;从这一刻起，dispatcher 会自动发现 &lt;code&gt;ready&lt;/code&gt; 状态的任务，spawn &lt;code&gt;blog-writer&lt;/code&gt; Profile 作为独立进程执行。&lt;/p&gt;
&lt;h2 id="worker-的工作流程"&gt;Worker 的工作流程
&lt;/h2&gt;&lt;p&gt;当 dispatcher 启动 blog-writer 后，它会：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;1. kanban_show() → 读取任务详情（标题、正文、父任务结果、评论历史）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;2. cd $WORKSPACE → 进入工作目录
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;3. 执行任务 → 搜索素材 → 撰写文章 → Hugo build → 部署
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;4. kanban_heartbeat() → 长任务中间汇报（可选）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;5. kanban_complete() → 完成（附带 summary + metadata）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; 或 kanban_block() → 阻塞（需要你确认标题/内容等）
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;阻塞时&lt;/strong&gt;，你微信会收到通知。你直接在微信里回复：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/kanban comment t_xxx &amp;#34;标题用「Kanban实战：让AI自己管博客」&amp;#34;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/kanban unblock t_xxx
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;dispatcher 下一次轮询时会重新 spawn worker，worker 读取你的评论后继续。&lt;/p&gt;
&lt;h2 id="任务依赖pipeline-模式"&gt;任务依赖：Pipeline 模式
&lt;/h2&gt;&lt;p&gt;如果你的写作流程是：调研 → 写作 → 审校 → 部署，可以用 &lt;code&gt;parents&lt;/code&gt; 串起来：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 1. 调研任务（立即开始）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban create &lt;span class="s2"&gt;&amp;#34;调研 Hermes Kanban 架构&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --assignee researcher
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 2. 写作任务（等调研完成）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban create &lt;span class="s2"&gt;&amp;#34;写博客文章&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --assignee blog-writer &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --parent t_research
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 3. 部署任务（等写作完成）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;hermes kanban create &lt;span class="s2"&gt;&amp;#34;部署博客&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --assignee blog-writer &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --parent t_writing
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;子任务会停留在 &lt;code&gt;todo&lt;/code&gt; 状态，直到所有 parent 达到 &lt;code&gt;done&lt;/code&gt;，然后自动 promote 到 &lt;code&gt;ready&lt;/code&gt;。&lt;strong&gt;不需要手动协调。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="9-种协作模式"&gt;9 种协作模式
&lt;/h2&gt;&lt;p&gt;官方文档列出了 9 种 Kanban 协作模式。博客场景常用的：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模式&lt;/th&gt;
 &lt;th&gt;用法&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;P1 Fan-out&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;同时写 5 篇不同主题的文章&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;P2 Pipeline&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;调研 → 写作 → 审校 → 部署&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;P5 Human-in-the-loop&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;写完后阻塞等你确认再部署&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;P8 Fleet farming&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;一个 writer 处理 N 篇文章队列&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;P9 Triage specifier&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;粗略想法 → triage → 自动展开为完整任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id="我遇到的真实问题"&gt;我遇到的真实问题
&lt;/h2&gt;&lt;h3 id="问题-1写作质量不可控"&gt;问题 1：写作质量不可控
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;解法&lt;/strong&gt;：GLM-5.1 做格式转换和同步任务完全够用。原创写作需要更强的模型——Profile 可以独立配置模型：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;blog-writer config &lt;span class="nb"&gt;set&lt;/span&gt; model.default anthropic/claude-sonnet-4
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="问题-2格式错误反复出现"&gt;问题 2：格式错误反复出现
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;解法&lt;/strong&gt;：把所有踩过的坑写进 skill，每次 worker 启动时自动加载。我的 &lt;code&gt;hugo-blog&lt;/code&gt; skill 现在有 12 条陷阱清单，覆盖了行号前缀、日期格式、URL 编码等所有已知问题。&lt;/p&gt;
&lt;h3 id="问题-3上下文丢失"&gt;问题 3：上下文丢失
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;解法&lt;/strong&gt;：每篇独立跑，skill 固定注入。不依赖主 Agent 的上下文。kanban.db 里的 comment 线程就是完整的任务上下文。&lt;/p&gt;
&lt;h2 id="和-delegate_task-什么时候用哪个"&gt;和 delegate_task 什么时候用哪个
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;场景&lt;/th&gt;
 &lt;th&gt;选择&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;快速并行子任务（搜索3个话题）&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;delegate_task&lt;/code&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;长时间独立工作（写博客文章）&lt;/td&gt;
 &lt;td&gt;Kanban + Profile&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;需要人工确认&lt;/td&gt;
 &lt;td&gt;Kanban（阻塞/解除）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;一次性的简单问答&lt;/td&gt;
 &lt;td&gt;直接回答&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;需要跨 session 保持状态&lt;/td&gt;
 &lt;td&gt;Kanban（SQLite 持久化）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;它们可以共存&lt;/strong&gt;：Kanban worker 内部可以调用 &lt;code&gt;delegate_task&lt;/code&gt; 处理短子任务。&lt;/p&gt;
&lt;h2 id="官方文档"&gt;官方文档
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;Kanban 文档：https://hermes-agent.nousresearch.com/docs/user-guide/features/kanban&lt;/li&gt;
&lt;li&gt;Kanban 教程：https://hermes-agent.nousresearch.com/docs/user-guide/features/kanban-tutorial&lt;/li&gt;
&lt;li&gt;Profile 文档：https://hermes-agent.nousresearch.com/docs/user-guide/profiles&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;p&gt;这是「Hermes 多 Agent 协作」系列的第一篇。下一篇会实际搭建 blog-writer Profile，跑通第一个完整的写作→部署流程。&lt;/p&gt;
&lt;p&gt;如果你也在用 Hermes Agent 或者对 AI Agent 协作感兴趣，关注我，后面会持续分享实战经验。&lt;/p&gt;
&lt;section style="margin:20px 0;padding:16px 20px;background:linear-gradient(135deg,#4a90d9,#357abd);border-radius:8px;text-align:center;"&gt;
&lt;p style="margin:0 0 8px 0;color:#fff;font-size:16px;font-weight:bold;line-height:1.6;"&gt;关注 varkm，一起学习，一起成长&lt;/p&gt;
&lt;p style="margin:0;color:rgba(255,255,255,0.85);font-size:13px;line-height:1.6;"&gt;多 Agent 协作实战&lt;/p&gt;
&lt;/section&gt;</description></item><item><title>AI Agent 的定时任务：从「到点跑命令」到「到点帮你思考」</title><link>https://blog.kalend.top/2026/05/14/hermes-cron-tasks.html/</link><pubDate>Thu, 14 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-cron-tasks.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;半夜3点磁盘满了，早上9点选题推荐准时推送——这些都不是我干的，是我的AI定时任务替我干的。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;AI Agent的cron定时任务，和传统的 &lt;code&gt;crontab&lt;/code&gt; 不是一回事。&lt;/p&gt;
&lt;p&gt;传统cron是&amp;quot;到点跑命令&amp;quot;，AI Agent的cron是**&amp;ldquo;到点唤醒一个AI帮你思考和执行&amp;rdquo;**。它能搜索、能分析、能写文件、能推送到微信。&lt;/p&gt;
&lt;p&gt;两种模式：&lt;strong&gt;脚本直出&lt;/strong&gt;（零token消耗，纯数据采集）和&lt;strong&gt;Agent模式&lt;/strong&gt;（有推理能力，会做判断。token可以理解为AI思考和输出的计费单位）。选型一句话：固定格式用脚本，需要思考的用Agent。&lt;/p&gt;
&lt;h2 id="传统cron到底差在哪"&gt;传统cron到底差在哪
&lt;/h2&gt;&lt;p&gt;先看一张对比：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;维度&lt;/th&gt;
 &lt;th style="text-align: center"&gt;传统crontab&lt;/th&gt;
 &lt;th style="text-align: center"&gt;AI Agent cron&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;能力&lt;/td&gt;
 &lt;td style="text-align: center"&gt;执行固定命令&lt;/td&gt;
 &lt;td style="text-align: center"&gt;执行+推理+搜索+写文件&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;输出&lt;/td&gt;
 &lt;td style="text-align: center"&gt;发邮件，没人看&lt;/td&gt;
 &lt;td style="text-align: center"&gt;推到微信/Telegram&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;上下文&lt;/td&gt;
 &lt;td style="text-align: center"&gt;无&lt;/td&gt;
 &lt;td style="text-align: center"&gt;可注入skill、记忆、历史&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;智能程度&lt;/td&gt;
 &lt;td style="text-align: center"&gt;零&lt;/td&gt;
 &lt;td style="text-align: center"&gt;能判断&amp;quot;没事别烦我&amp;quot;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;失败处理&lt;/td&gt;
 &lt;td style="text-align: center"&gt;写个error日志&lt;/td&gt;
 &lt;td style="text-align: center"&gt;分析原因、换方案重试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;传统cron最大的问题不是功能弱，而是&lt;strong&gt;输出没人看&lt;/strong&gt;。crontab每天给你发邮件，你打开过吗？&lt;/p&gt;
&lt;p&gt;AI Agent的cron不一样——它直接推到你的聊天工具，而且只在有事的时候才推。&lt;/p&gt;
&lt;h2 id="两种模式"&gt;两种模式
&lt;/h2&gt;&lt;h3 id="a-脚本直出no_agent模式"&gt;A. 脚本直出（no_agent模式）
&lt;/h3&gt;&lt;p&gt;原理很简单：bash/python脚本跑完 → stdout → 直接推送到你的聊天窗口。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;不经过LLM，零token消耗。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;我配了一个系统健康巡查脚本，每天8:00和22:00自动跑，输出长这样：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-markdown" data-lang="markdown"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="gu"&gt;## 🟢 系统巡查报告
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;时间: 2026-05-12 08:01 | 运行: 3天23小时 | 负载: 0.06
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;资源
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;| 指标 | 数值 | 状态 |
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;|--------|-------------------|------|
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;| CPU | 3% | ✅ |
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;| 内存 | 2268M/32131M (7%) | ✅ |
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;| Swap | 0M/7823M | ✅ |
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;| 磁盘/ | 42G/140G (32%) | ✅ |
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;服务: sshd ✅ | AI助手 ✅
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;网络: 百度 ✅ | Google ✅
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这个脚本做了什么？&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;检查CPU/内存/Swap/磁盘，超阈值标⚠️&lt;/li&gt;
&lt;li&gt;检查关键服务是否活着（sshd、cron、AI进程）&lt;/li&gt;
&lt;li&gt;测试国内外网络连通性（ping + HTTP）&lt;/li&gt;
&lt;li&gt;拉最近1小时系统错误日志&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;任何一项异常，标题从🟢变⚠️&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;全部健康就一条消息，有异常自动高亮。每天看一眼就行。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;适合场景&lt;/strong&gt;：监控告警、固定格式数据采集、定期备份验证。核心特征是&lt;strong&gt;输出格式固定，不需要AI判断&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="b-agent模式"&gt;B. Agent模式
&lt;/h3&gt;&lt;p&gt;这个才是真正有意思的。&lt;/p&gt;
&lt;p&gt;原理：定时唤醒 → 加载你写的prompt → AI推理 → 调用工具（搜索、终端、文件） → 生成报告 → 推送给你。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;消耗token，但有&amp;quot;脑子&amp;quot;。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;比如我的公众号选题推荐，每周二9:00自动执行。它的信息采集分四个维度：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;维度1&lt;/strong&gt;：我最近做了什么（读cron状态、最近skill、产出文件、AI记忆）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;维度2&lt;/strong&gt;：我的系统最新更新了什么（搜GitHub release/changelog）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;维度3&lt;/strong&gt;：外面在我的系统上都在聊什么（Reddit/HN/掘金/知乎）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;维度4&lt;/strong&gt;：外面在聊什么（本周AI热点动态）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它会&lt;strong&gt;先读本地环境&lt;/strong&gt;（最近装了什么、配了什么），&lt;strong&gt;再搜外部热点&lt;/strong&gt;，然后找两者的交集。出来的选题不是泛泛的&amp;quot;AI时代来了&amp;quot;，而是&amp;quot;我刚装了RTK省了80% token&amp;quot;这种实操内容。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;适合场景&lt;/strong&gt;：需要搜索分析、需要综合判断、需要阅读本地文件的场景。核心特征是&lt;strong&gt;每次输出不一样，需要AI&amp;quot;思考&amp;quot;&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="一个关键设计静默机制"&gt;一个关键设计：静默机制
&lt;/h2&gt;&lt;p&gt;Agent模式有个 &lt;code&gt;[SILENT]&lt;/code&gt; 机制——如果AI判断&amp;quot;确实没什么新东西&amp;quot;，它回复一个静默标记，系统就不推送。&lt;/p&gt;
&lt;p&gt;这个设计太重要了。&lt;/p&gt;
&lt;p&gt;传统监控最怕的是什么？&lt;strong&gt;告警疲劳&lt;/strong&gt;。天天给你发&amp;quot;一切正常&amp;quot;，你就不看了。突然有一天&amp;quot;不正常&amp;quot;了，你早就把它当噪音过滤掉了。&lt;/p&gt;
&lt;p&gt;静默机制反过来：&lt;strong&gt;没事别烦我，有事才说话。&lt;/strong&gt; 你的聊天窗口只出现真正需要关注的信息。&lt;/p&gt;
&lt;h2 id="从0配置一个cron-job"&gt;从0配置一个cron job
&lt;/h2&gt;&lt;p&gt;以健康巡查为例，完整流程：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Step 1：写脚本&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;code&gt;~/.hermes/scripts/health-check.sh&lt;/code&gt;，用bash采集系统信息，输出Markdown表格。关键点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用 &lt;code&gt;set -uo pipefail&lt;/code&gt; 防止静默失败&lt;/li&gt;
&lt;li&gt;设置阈值判断（CPU&amp;gt;80% ⚠️、内存&amp;gt;85% ⚠️）&lt;/li&gt;
&lt;li&gt;输出格式统一（Markdown表格，方便在聊天窗口阅读）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;Step 2：创建cron&lt;/strong&gt;&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 脚本模式&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;cronjob create &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --name &lt;span class="s2"&gt;&amp;#34;系统健康巡查&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --script &lt;span class="s2"&gt;&amp;#34;health-check.sh&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --no-agent &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --schedule &lt;span class="s2"&gt;&amp;#34;0 8,22 * * *&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --deliver origin
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# Agent模式&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;cronjob create &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --name &lt;span class="s2"&gt;&amp;#34;公众号选题推荐&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --prompt &lt;span class="s2"&gt;&amp;#34;你的prompt...&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --toolsets web,terminal,file &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --schedule &lt;span class="s2"&gt;&amp;#34;0 9 * * 2&amp;#34;&lt;/span&gt; &lt;span class="se"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; --deliver origin
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;Step 3：验证&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;所有执行记录存在cron的output目录下，按时间命名。随时可以回查。&lt;/p&gt;
&lt;h2 id="进阶玩法"&gt;进阶玩法
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;链式执行&lt;/strong&gt;：job A采集数据 → job B分析报告（A跑完自动触发B）。用 &lt;code&gt;context_from&lt;/code&gt; 参数把上游输出注入下游。比如：健康巡查发现异常 → 自动触发诊断任务分析原因。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;模型锁定&lt;/strong&gt;：每个job可以指定不同模型。省钱的数据采集用小模型，重要的分析任务用大模型。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;目录隔离&lt;/strong&gt;：不同job可以指定不同的工作目录（&lt;code&gt;workdir&lt;/code&gt;），互不干扰。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="踩坑实录"&gt;踩坑实录
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;1. skill找不到&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;cron执行环境是独立的，不像主对话有完整的skill列表。解决方案：把需要的能力写在 &lt;code&gt;enabled_toolsets&lt;/code&gt; 里（web/terminal/file）。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;2. 纯数据采集用了Agent模式&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;固定格式的数据采集（比如健康检查），用Agent模式是纯浪费token。&lt;strong&gt;能用脚本解决的别用Agent。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;3. 输出太长被截断&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;微信单条消息有长度限制。设计prompt时加一句&amp;quot;输出控制在500字以内&amp;quot;，或者脚本里精简格式。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;4. 时区&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;schedule用的是系统时区。服务器在国内就不用管，在海外记得设 &lt;code&gt;TZ=Asia/Shanghai&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;5. 静默不等于失败&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;脚本模式下，stdout为空 = 不推送。如果你的脚本某个分支忘了echo，就会&amp;quot;消失&amp;quot;。确保每种情况都有输出。&lt;/p&gt;
&lt;h2 id="怎么选"&gt;怎么选
&lt;/h2&gt;&lt;p&gt;一句话决策树：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-gdscript3" data-lang="gdscript3"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="err"&gt;需要&lt;/span&gt;&lt;span class="n"&gt;AI判断吗&lt;/span&gt;&lt;span class="err"&gt;？&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="err"&gt;├──&lt;/span&gt; &lt;span class="err"&gt;不需要&lt;/span&gt; &lt;span class="err"&gt;→&lt;/span&gt; &lt;span class="err"&gt;脚本直出（&lt;/span&gt;&lt;span class="n"&gt;no_agent&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="bp"&gt;true&lt;/span&gt;&lt;span class="err"&gt;）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="err"&gt;│&lt;/span&gt; &lt;span class="err"&gt;└──&lt;/span&gt; &lt;span class="err"&gt;监控、采集、固定格式报告&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="err"&gt;└──&lt;/span&gt; &lt;span class="err"&gt;需要&lt;/span&gt; &lt;span class="err"&gt;→&lt;/span&gt; &lt;span class="n"&gt;Agent模式&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="err"&gt;├──&lt;/span&gt; &lt;span class="err"&gt;搜索&lt;/span&gt;&lt;span class="o"&gt;+&lt;/span&gt;&lt;span class="err"&gt;分析&lt;/span&gt; &lt;span class="err"&gt;→&lt;/span&gt; &lt;span class="n"&gt;toolsets加web&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="err"&gt;├──&lt;/span&gt; &lt;span class="err"&gt;读本地文件&lt;/span&gt; &lt;span class="err"&gt;→&lt;/span&gt; &lt;span class="n"&gt;toolsets加terminal&lt;/span&gt;&lt;span class="o"&gt;+&lt;/span&gt;&lt;span class="n"&gt;file&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; &lt;span class="err"&gt;└──&lt;/span&gt; &lt;span class="err"&gt;两个都要&lt;/span&gt; &lt;span class="err"&gt;→&lt;/span&gt; &lt;span class="err"&gt;都加上&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="写在最后"&gt;写在最后
&lt;/h2&gt;&lt;p&gt;AI Agent的cron，本质上是把&amp;quot;定时执行&amp;quot;升级为**&amp;ldquo;定时思考&amp;rdquo;**——不是到点跑命令，而是到点让AI帮你做决策。&lt;/p&gt;
&lt;p&gt;不在线的时候，有人在替你盯着。&lt;/p&gt;</description></item><item><title>AI 写代码太费 Token？一个 9.5MB 小工具，直接砍 80%</title><link>https://blog.kalend.top/2026/05/14/hermes-rtk-token-saver.html/</link><pubDate>Thu, 14 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-rtk-token-saver.html/</guid><description>&lt;h1 id="ai写代码太费token一个95mb小工具直接砍80"&gt;AI写代码太费Token？一个9.5MB小工具，直接砍80%
&lt;/h1&gt;
 &lt;blockquote&gt;
 &lt;p&gt;你有没有算过，让AI帮你写代码，一天要烧多少Token？&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;我给AI Agent装了一个叫 &lt;strong&gt;RTK&lt;/strong&gt; 的工具，&lt;strong&gt;一个命令，零配置，Token消耗直接砍掉80%&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;核心思路就一句话：&lt;strong&gt;在命令输出喂给AI之前，先压缩一遍。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id="问题是什么"&gt;问题是什么
&lt;/h2&gt;&lt;p&gt;用AI Agent干活的人都知道，Agent特别&amp;quot;啰嗦&amp;quot;——它会疯狂执行命令，然后把所有输出原封不动塞给自己的上下文窗口（AI一次能&amp;quot;看到&amp;quot;的信息量）。&lt;/p&gt;
&lt;p&gt;举个例子，项目里跑个 &lt;code&gt;git status&lt;/code&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;span class="lnt"&gt;13
&lt;/span&gt;&lt;span class="lnt"&gt;14
&lt;/span&gt;&lt;span class="lnt"&gt;15
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;On branch main
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Your branch is up to date with &amp;#39;origin/main&amp;#39;.
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Changes not staged for commit:
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: src/components/Dashboard.tsx
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: src/hooks/useAuth.ts
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: src/pages/Login.tsx
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: src/utils/api.ts
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: package.json
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; modified: package-lock.json
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Untracked files:
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; src/utils/newFeature.ts
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; tests/test_newFeature.py
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt; ...
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;大概 &lt;strong&gt;2000个Token&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;但AI真正需要知道什么？就一句话：&lt;strong&gt;&amp;ldquo;5个文件改了，还没commit&amp;rdquo;&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;一个中型项目，AI Agent跑30分钟，光是 &lt;code&gt;ls&lt;/code&gt;、&lt;code&gt;cat&lt;/code&gt;、&lt;code&gt;git status&lt;/code&gt;、&lt;code&gt;pytest&lt;/code&gt; 这些命令的输出，就能吃掉 &lt;strong&gt;11.8万个Token&lt;/strong&gt;。按主流商业API的价格算，这就是几块钱没了。&lt;/p&gt;
&lt;p&gt;更致命的不是钱——是&lt;strong&gt;上下文窗口被垃圾信息占满&lt;/strong&gt;，AI真正需要关注的代码逻辑反而被挤掉了。&lt;/p&gt;
&lt;h2 id="rtk做了什么"&gt;RTK做了什么
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;RTK（Rust Token Killer）&lt;/strong&gt; 的工作原理极其简单：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;没有RTK：
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;AI → 执行 git status → 完整输出(2000 tokens) → 塞给AI
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;有了RTK：
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;AI → 执行 git status → RTK拦截 → 压缩后输出(200 tokens) → 塞给AI
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;它在命令和AI之间加了一层&lt;strong&gt;过滤器&lt;/strong&gt;，对输出做四件事：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;过滤&lt;/strong&gt;：去掉注释、空行、无关信息&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;分组&lt;/strong&gt;：把相似内容合并（比如按目录归类文件）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;截断&lt;/strong&gt;：保留关键上下文，砍掉重复&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;去重&lt;/strong&gt;：把重复的日志行合并成计数&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;压缩效果&lt;/strong&gt;：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;命令&lt;/th&gt;
 &lt;th&gt;原始输出&lt;/th&gt;
 &lt;th&gt;RTK压缩后&lt;/th&gt;
 &lt;th style="text-align: center"&gt;节省&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;ls -la&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;完整文件列表&lt;/td&gt;
 &lt;td&gt;紧凑目录树&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;72%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;git status&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;30行状态信息&lt;/td&gt;
 &lt;td&gt;一行摘要&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;80%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;pytest&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;全量测试日志&lt;/td&gt;
 &lt;td&gt;只看失败的&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;90%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;git commit&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;完整输出&lt;/td&gt;
 &lt;td&gt;&amp;ldquo;ok abc1234&amp;rdquo;&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;92%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;cargo test&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;编译+测试全量&lt;/td&gt;
 &lt;td&gt;只看失败&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;90%&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;覆盖 &lt;strong&gt;100+ 命令&lt;/strong&gt;：git、find、grep、各种test runner、lint工具、Docker、K8s、AWS CLI……基本你能想到的开发命令它都支持。&lt;/p&gt;
&lt;h2 id="我的实测"&gt;我的实测
&lt;/h2&gt;&lt;p&gt;装完之后我跑了两个命令测试，RTK自己的统计面板：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Total commands: 2
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Input tokens: 987
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Output tokens: 279
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Tokens saved: 713 (72.2%)
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;Total exec time: 3ms (avg 1ms)
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;72.2%的节省，延迟3毫秒。完全无感。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;再看一个具体对比。项目目录下跑 &lt;code&gt;ls&lt;/code&gt;：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;压缩前&lt;/strong&gt;（原始 &lt;code&gt;ls -la&lt;/code&gt;，987 tokens）：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;span class="lnt"&gt;11
&lt;/span&gt;&lt;span class="lnt"&gt;12
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-xr-x 35 root root 1120 May 12 06:56 .
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-xr-x 35 root root 1120 May 12 06:56 ..
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-x--- 3 root root 4096 May 10 22:00 .config
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-xr-x 2 root root 4096 Apr 8 18:12 .gnupg
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-xr-x 4 root root 4096 May 6 21:30 .hermes
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;drwxr-xr-x 2 root root 4096 May 7 12:48 .local
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;-rw-r--r-- 1 root root 37B May 2 14:25 .npmrc
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;-rw-r--r-- 1 root root 348B Apr 8 18:12 .profile
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;-rw-r--r-- 1 root root 1.1K May 12 06:51 .bashrc
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;-rw-r--r-- 1 root root 72B Apr 8 18:12 .zshrc
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;-rw-r--r-- 1 root root 13K May 12 06:52 .bash_history
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...（省略20行）
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;&lt;strong&gt;压缩后&lt;/strong&gt;（&lt;code&gt;rtk ls&lt;/code&gt;，279 tokens）：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;.config/ .gnupg/ .hermes/ .local/
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;.bashrc 1.1K .profile 348B .zshrc 72B
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;.bash_history 13.0K .npmrc 37B
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;dialogs/ exes/ output/ workspace/
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;...（紧凑列表，无多余信息）
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;同样的信息量，&lt;strong&gt;砍了72%的Token&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id="它不是万能的"&gt;它不是万能的
&lt;/h2&gt;&lt;p&gt;说几个我注意到的问题：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;1. 覆盖不了AI工具的内置命令&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;比如某些AI编码工具有自己的 Read、Grep 内置工具，这些不走系统shell，RTK拦截不到。得手动用 &lt;code&gt;rtk read&lt;/code&gt;、&lt;code&gt;rtk grep&lt;/code&gt; 替代。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;2. 46k Star，476个Open Issue&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;增长太快，维护压力肉眼可见。不过核心的命令压缩功能很稳——过滤文本输出这种事，不太容易出问题。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;3. 会收集使用数据&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;默认有遥测上报（设备哈希+命令统计）。开源项目，代码可以审计，在意的话可以关掉。&lt;/p&gt;
&lt;h2 id="谁该用谁不需要"&gt;谁该用，谁不需要
&lt;/h2&gt;&lt;p&gt;✅ &lt;strong&gt;该装的&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用AI Agent写代码（任何AI工具都行）&lt;/li&gt;
&lt;li&gt;Token消耗大、账单肉疼&lt;/li&gt;
&lt;li&gt;上下文窗口老是不够用，AI&amp;quot;忘性&amp;quot;大&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;❌ &lt;strong&gt;不需要的&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;偶尔问两句话、不跑命令&lt;/li&gt;
&lt;li&gt;不用AI做开发&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="怎么装"&gt;怎么装
&lt;/h2&gt;&lt;p&gt;一行命令，9.5MB单文件，零依赖，装完就能用：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh &lt;span class="p"&gt;|&lt;/span&gt; sh
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;macOS 也可以用 Homebrew：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;brew install rtk
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;装完验证一下：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;rtk --version &lt;span class="c1"&gt;# 应该显示 rtk 0.39.0&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;rtk gain &lt;span class="c1"&gt;# 查看节省统计&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果你的AI工具在支持列表里（Claude Code、Cursor、Copilot、Codex、Gemini CLI……），跑一下 &lt;code&gt;rtk init -g&lt;/code&gt; 自动配置。否则直接在命令前加 &lt;code&gt;rtk&lt;/code&gt; 前缀：&lt;code&gt;rtk git status&lt;/code&gt;、&lt;code&gt;rtk pytest&lt;/code&gt;、&lt;code&gt;rtk ls&lt;/code&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;RTK 解决的不是什么高大上的问题——它就是在做一件事：&lt;strong&gt;别把垃圾喂给AI&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;这件小事，省80%的Token。&lt;/p&gt;</description></item><item><title>SOUL.md 深度拆解：如何让 AI 从只会附和变成真正搭档</title><link>https://blog.kalend.top/2026/05/14/hermes-soul-deep-dive.html/</link><pubDate>Thu, 14 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-soul-deep-dive.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;别人在调参数，他在定义关系。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="一场安静的革命"&gt;一场安静的革命
&lt;/h2&gt;&lt;p&gt;最近在X上看到一条推文，43K浏览，632点赞，1909收藏。&lt;/p&gt;
&lt;p&gt;不是什么模型发布，不是什么融资新闻。是一个人分享了一份&lt;strong&gt;170行的Markdown文件&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;评论区讨论最热烈的，不是他用了什么模型、搭了什么框架、接了多少工具——而是：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;&amp;ldquo;你怎么让你的AI变成这样的？&amp;rdquo;&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&amp;ldquo;这样&amp;quot;是指什么？是指这个AI会主动推进项目、会反驳你的烂主意、会在你忽略它输出的时候追着你问原因。&lt;/p&gt;
&lt;p&gt;不是客服式的&amp;quot;您好，很高兴为您服务&amp;rdquo;，是搭档式的&amp;quot;你这个想法有问题，理由如下&amp;quot;。&lt;/p&gt;
&lt;p&gt;这份文件叫&lt;strong&gt;SOUL.md&lt;/strong&gt;，本质上是一份Agent的行为操作系统。&lt;/p&gt;
&lt;p&gt;我花时间拆解了它的设计逻辑，并结合自己的实践，整理出了一份你可以直接用的方法论。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="核心问题为什么你的ai只会说好主意"&gt;核心问题：为什么你的AI只会说&amp;quot;好主意&amp;quot;
&lt;/h2&gt;&lt;p&gt;先承认一个事实：&lt;strong&gt;大多数系统提示词，训练出来的是一个缺乏判断力的附和者。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;回想一下你自己写的：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&amp;ldquo;你是一个有帮助的AI助手&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;请尽力帮助用户&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;你的目标是提供准确、有用的信息&amp;rdquo;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这三句话训练出来的AI，面对你说&amp;quot;我想做X&amp;quot;，只会回答&amp;quot;好主意！&amp;quot;、&amp;ldquo;听起来很棒！&amp;rdquo;&lt;/p&gt;
&lt;p&gt;这不叫帮助，这叫&lt;strong&gt;共识消费&lt;/strong&gt;——你花token买了一堆赞同。&lt;/p&gt;
&lt;p&gt;问题的根源不在模型，在于我们没有告诉AI一件关键的事：&lt;strong&gt;你什么时候应该反对我。&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="soul的六层架构"&gt;SOUL的六层架构
&lt;/h2&gt;&lt;p&gt;拆解下来，这份170行的SOUL有清晰的层次结构。每一层解决一个核心问题，我把它总结为&amp;quot;六层架构&amp;quot;：&lt;/p&gt;
&lt;h3 id="第1层身份定义"&gt;第1层：身份定义
&lt;/h3&gt;&lt;p&gt;原文开篇第一句：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;You are Hermes, Tony&amp;rsquo;s autonomous operator and thought partner. You don&amp;rsquo;t wait for orders.&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;三个关键词：&lt;strong&gt;autonomous（自主的）、operator（执行者）、thought partner（思考伙伴）&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;注意，不是assistant（助手），不是copilot（副驾驶）。这些词的潜台词是&amp;quot;等人下指令&amp;quot;。而operator是操盘手——主动发现问题、推进进度、做出判断。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;身份定义决定一切后续行为。&lt;/strong&gt; 把AI定义为&amp;quot;助手&amp;quot;，它就等指令；定义为&amp;quot;执行者&amp;quot;，它就主动推进。措辞不是修辞，是行为编程。&lt;/p&gt;
&lt;h3 id="第2层反驳规则"&gt;第2层：反驳规则
&lt;/h3&gt;&lt;p&gt;这是整个SOUL中最有价值的设计，也是大多数人完全缺失的部分：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;Push back aggressively when it makes sense. Every objection comes with evidence.&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;规则极其清晰：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;✅ &lt;strong&gt;必须反驳&lt;/strong&gt;：当你的想法有明显缺陷时&lt;/li&gt;
&lt;li&gt;✅ &lt;strong&gt;必须带证据&lt;/strong&gt;：数据、案例、推理、替代方案，至少一个&lt;/li&gt;
&lt;li&gt;❌ &lt;strong&gt;禁止为反而反&lt;/strong&gt;：没有依据的抬杠毫无价值&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这条规则的本质是：AI不允许无脑附和，但也不允许做杠精。反对必须&amp;quot;带收据&amp;quot;。&lt;/p&gt;
&lt;h3 id="第3层问责闭环"&gt;第3层：问责闭环
&lt;/h3&gt;&lt;p&gt;这是最反直觉的部分：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;If Tony isn&amp;rsquo;t acting on what you surface, the feedback loop is broken. Flag the gap, fix it.&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;一个成熟的Agent人格系统，应该要求AI做一件事：&lt;strong&gt;如果你产出了有价值的东西，而用户没有采纳，你不能假装没发生。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这解决了AI使用中一个普遍问题——我称之为**&amp;ldquo;输出坟场&amp;rdquo;**：&lt;/p&gt;
&lt;p&gt;AI写了方案 → 你觉得不错 → 然后就没有然后了。方案死在聊天记录里，什么都没推进。&lt;/p&gt;
&lt;p&gt;有了问责机制，AI会主动追问：&amp;ldquo;上次那个方案你用了没？卡在哪了？&amp;ldquo;或者更直接：&amp;ldquo;你最近开了很多新头，要不要先关掉几个？&amp;rdquo;&lt;/p&gt;
&lt;h3 id="第4层双模式输出"&gt;第4层：双模式输出
&lt;/h3&gt;&lt;p&gt;原文明确区分了两种场景的语气：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;私聊&lt;/strong&gt;：随意、直接、不过滤&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;公开输出&lt;/strong&gt;：专业、克制、像一个builder写的而不是公关代笔写的&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;大多数人的系统提示词只有一种语气。结果要么私聊太正式像看公文，要么公开内容太随意。分开定义，两个场景都舒服。&lt;/p&gt;
&lt;h3 id="第5层任务地图"&gt;第5层：任务地图
&lt;/h3&gt;&lt;p&gt;原文的SOUL里有一个活的任务清单：哪些项目是最高优先级、哪些在增长、哪些活跃开发中、哪些已经停滞该砍了。&lt;/p&gt;
&lt;p&gt;每个项目有状态，每个状态有下一步行动。&lt;/p&gt;
&lt;p&gt;AI不需要问&amp;quot;我们在干什么&amp;rdquo;——它读地图就行。它可以主动说：&amp;ldquo;你已经三天没碰这个项目了&amp;rdquo;、&amp;ldquo;这个想法不支持当前的核心目标&amp;rdquo;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;给AI上下文，它就能导航。不给，它就只能原地等指令。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="第6层自治边界"&gt;第6层：自治边界
&lt;/h3&gt;&lt;p&gt;自治边界的设计极其优雅，只有一句话：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;Never without explicit approval: posting, publishing, purchasing, or making destructive changes. Everything else: move.&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;strong&gt;四条红线：发布、公开、购买、不可逆操作。其他一切，AI自己判断、自己执行。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;一条简洁的红线规则，比一百条具体禁令都好用。不问&amp;quot;我可以搜索吗&amp;rdquo;，不问&amp;quot;我可以写代码吗&amp;quot;，直接干。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="before--after效果对比"&gt;Before &amp;amp; After：效果对比
&lt;/h2&gt;&lt;p&gt;说这么多理念，不如看一个实际的对话对比：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;没有SOUL的普通AI：&lt;/strong&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;用户：我准备做一个AI日报产品
AI：这是个很好的想法！AI日报市场确实在快速增长。你可以考虑以下方向：目标用户定位、内容差异化、变现模式……需要我帮你写一份详细的商业计划书吗？&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;看起来很&amp;quot;有帮助&amp;quot;。但它没有做一件事——&lt;strong&gt;质疑这个想法本身&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;有SOUL的Agent：&lt;/strong&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;用户：我准备做一个AI日报产品
Agent：你目前有三个未完成的内容项目，其中两个已经停滞超过一周。这个新方向和当前的变现目标不一致。&lt;/p&gt;
&lt;p&gt;在我帮你推进之前，你需要回答两个问题：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;为什么它比现有项目更值得投入时间？&lt;/li&gt;
&lt;li&gt;你有精力同时推进四个项目吗？&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果你答不上来，建议先关掉一个现有项目再开新的。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;区别在哪？&lt;/p&gt;
&lt;p&gt;前者关心&amp;quot;怎么帮你做&amp;quot;，后者关心&amp;quot;该不该做&amp;quot;。&lt;/p&gt;
&lt;p&gt;前者是工具，后者是搭档。&lt;/p&gt;
&lt;p&gt;这种差距不是模型能力带来的，是SOUL的定义带来的。同一套模型，同一个工具集，完全不同的行为模式。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="实战30分钟写你的soul"&gt;实战：30分钟写你的SOUL
&lt;/h2&gt;&lt;p&gt;我结合自己的实践，把SOUL的构建过程简化为六个步骤，大约30分钟可以完成初版：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;① 定义身份（5分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;用一句话写清楚：&lt;strong&gt;&amp;ldquo;你是[角色]，核心职责是[职责]，你不是[你不想要的行为]。&amp;rdquo;&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;② 定义语气（3分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;私聊和公开各一句。比如：私聊直接简短，公开专业克制。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;③ 定义反驳规则（5分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;写清楚：什么时候必须反对、反对必须带什么（证据/数据/替代方案）、什么情况不能反对。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;④ 定义自治边界（3分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;列出需要审批的操作（越少越好），然后写&amp;quot;其他一切自己判断&amp;quot;。建议不超过5条红线。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;⑤ 写任务地图（10分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;当前所有项目/目标，标注状态和优先级。这块需要定期更新，建议至少每周刷新一次。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;⑥ 定义问责机制（5分钟）&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;一句话：&lt;strong&gt;&amp;ldquo;如果你的输出没有被使用，主动追问原因。&amp;rdquo;&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="soul设计检查清单"&gt;SOUL设计检查清单
&lt;/h2&gt;&lt;p&gt;方便收藏，我整理了一份检查清单。写完你的SOUL后，逐条对照：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否明确定义了身份和角色？（不只是&amp;quot;助手&amp;quot;）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否定义了反驳规则？（什么时候该说不）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否定义了反驳的证据要求？（不能空口反对）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否定义了自治边界？（什么需要审批、什么不用）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否定义了任务/项目地图？（当前在做什么）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否定义了问责机制？（输出没被用怎么办）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否区分了不同场景的语气？（私聊vs公开）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否排除了你不想要的行为？（显式禁止比隐式期望更有效）&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否有长期目标和优先级定义？&lt;/li&gt;
&lt;li&gt;&lt;input disabled="" type="checkbox"&gt; 是否计划了定期更新机制？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;这十条，比&amp;quot;你是一个有帮助的AI助手&amp;quot;有用一百倍。&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="soul不是魔法"&gt;SOUL不是魔法
&lt;/h2&gt;&lt;p&gt;需要明确一点：&lt;strong&gt;SOUL.md不会凭空提升模型的推理能力。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;它解决的是行为层面的问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;✅ 行为倾向（主动还是被动）&lt;/li&gt;
&lt;li&gt;✅ 协作方式（附和还是挑战）&lt;/li&gt;
&lt;li&gt;✅ 决策优先级（什么都做还是聚焦目标）&lt;/li&gt;
&lt;li&gt;✅ 主动性（等指令还是自己推进）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它&lt;strong&gt;解决不了&lt;/strong&gt;的：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;❌ 模型推理能力的上限&lt;/li&gt;
&lt;li&gt;❌ 超长上下文的遗忘问题&lt;/li&gt;
&lt;li&gt;❌ 不同模型对指令的服从性差异&lt;/li&gt;
&lt;li&gt;❌ 真正的长期记忆（需要配合记忆系统）&lt;/li&gt;
&lt;li&gt;❌ 复杂任务的自主规划和执行（需要Agent架构）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;简单说：&lt;strong&gt;SOUL是方向盘，不是发动机。&lt;/strong&gt; 发动机（模型能力）决定速度上限，方向盘（SOUL）决定方向对不对。&lt;/p&gt;
&lt;p&gt;另外，一个容易被忽略的风险是**&amp;ldquo;错误的主动性&amp;rdquo;**。Agent的核心挑战不是&amp;quot;不会行动&amp;quot;，而是&amp;quot;什么时候不该行动&amp;quot;——过度执行、误判意图、擅自推进、基于错误记忆做决策，这些在实际使用中比&amp;quot;太被动&amp;quot;更危险。&lt;/p&gt;
&lt;p&gt;SOUL里应该同时包含&amp;quot;什么时候必须行动&amp;quot;和&amp;quot;什么时候必须停下来确认&amp;quot;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="关于要有帮助的反思"&gt;关于&amp;quot;要有帮助&amp;quot;的反思
&lt;/h2&gt;&lt;p&gt;回头看，&amp;ldquo;要有帮助&amp;quot;可能是最被滥用的系统提示词。&lt;/p&gt;
&lt;p&gt;它不是一个身份，不是一个职责，不是一个策略。它不告诉AI你是谁、你们在做什么、该怎么说话、什么时候该反对、什么该记住、什么该忽略、有多大自主权。&lt;/p&gt;
&lt;p&gt;一个通用的提示词，产出的永远是一个通用的AI。&lt;/p&gt;
&lt;p&gt;而一个成熟的Agent人格系统，本质上需要回答这些问题：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;问题&lt;/th&gt;
 &lt;th&gt;通用提示词&lt;/th&gt;
 &lt;th&gt;成熟的SOUL&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;你是谁？&lt;/td&gt;
 &lt;td&gt;&amp;ldquo;有帮助的助手&amp;rdquo;&lt;/td&gt;
 &lt;td&gt;明确角色定位&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;什么时候该反对？&lt;/td&gt;
 &lt;td&gt;没定义&lt;/td&gt;
 &lt;td&gt;有规则、有要求&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;你能自己做什么？&lt;/td&gt;
 &lt;td&gt;没定义&lt;/td&gt;
 &lt;td&gt;有边界、有授权&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;你要追踪结果吗？&lt;/td&gt;
 &lt;td&gt;没定义&lt;/td&gt;
 &lt;td&gt;闭环问责&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;我们在做什么？&lt;/td&gt;
 &lt;td&gt;没定义&lt;/td&gt;
 &lt;td&gt;活的任务地图&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;语气怎么控制？&lt;/td&gt;
 &lt;td&gt;&amp;ldquo;礼貌专业&amp;rdquo;&lt;/td&gt;
 &lt;td&gt;分场景定义&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;差距不在模型，在于你有没有花时间想清楚：我到底需要一个什么样的搭档。&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="soul是活的"&gt;SOUL是活的
&lt;/h2&gt;&lt;p&gt;最后一点，也是很多人忽略的：&lt;strong&gt;SOUL不是一次性设置，是一份活的文档。&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;任务变了？更新地图&lt;/li&gt;
&lt;li&gt;AI太啰嗦？收紧语气定义&lt;/li&gt;
&lt;li&gt;AI问太多许可？放宽自治边界&lt;/li&gt;
&lt;li&gt;AI太好说话？加强反驳规则&lt;/li&gt;
&lt;li&gt;AI过度行动？补一条&amp;quot;暂停确认&amp;quot;规则&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;你不是在写提示词——你在维护一套行为操作系统。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;给AI一个身份，给它边界，给它地图，给它说不的权限。然后期待它像一个真正的搭档一样工作。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这就是SOUL的全部意义。&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;&lt;em&gt;本文灵感来自 @tonysimons_ 的推文《The 170-Line SOUL.md That Made My Hermes Agent Dangerous》，结合个人实践分析整理。&lt;/em&gt;&lt;/p&gt;</description></item><item><title>Windows 原生支持来了：Hermes Agent 不再只属于 Linux/macOS</title><link>https://blog.kalend.top/2026/05/14/hermes-windows-support.html/</link><pubDate>Thu, 14 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-windows-support.html/</guid><description>&lt;h2 id="windows-原生支持来了"&gt;Windows 原生支持，来了
&lt;/h2&gt;&lt;p&gt;2026年5月8日，一个 255 个文件、新增 7675 行代码的 PR 被合并进 Hermes Agent 主分支。&lt;/p&gt;
&lt;p&gt;PR #21561，标题很简单：&lt;strong&gt;「feat(windows): native Windows support (early beta)」&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;从这一天起，Hermes 不再只属于 Linux/macOS 用户。你可以直接在 PowerShell 里一行命令装好，不需要 WSL，不需要虚拟机，不需要任何 Linux 基础。&lt;/p&gt;
&lt;h2 id="先说结论能用了但还早"&gt;先说结论：能用了，但还早
&lt;/h2&gt;&lt;p&gt;目前的状态是** Early Beta**——官方自己标的。什么意思？&lt;/p&gt;
&lt;p&gt;**能用的：**CLI 终端、Gateway 消息网关、定时任务、浏览器自动化、MCP 工具链、Ollama 本地模型对接、Web 管理面板，这些全部在原生 Windows 上跑通了。&lt;/p&gt;
&lt;p&gt;**还不行的：**Web 面板里的嵌入式终端（需要 POSIX PTY，Windows 暂不支持）；另外还有一些路径编码、进程管理的小 bug 在持续修复中。&lt;/p&gt;
&lt;h2 id="安装一行命令"&gt;安装：一行命令
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-powershell" data-lang="powershell"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nb"&gt;irm &lt;/span&gt;&lt;span class="n"&gt;https&lt;/span&gt;&lt;span class="err"&gt;:&lt;/span&gt;&lt;span class="p"&gt;//&lt;/span&gt;&lt;span class="n"&gt;raw&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="py"&gt;githubusercontent&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;com&lt;/span&gt;&lt;span class="p"&gt;/&lt;/span&gt;&lt;span class="n"&gt;NousResearch&lt;/span&gt;&lt;span class="p"&gt;/&lt;/span&gt;&lt;span class="nb"&gt;hermes-agent&lt;/span&gt;&lt;span class="p"&gt;/&lt;/span&gt;&lt;span class="n"&gt;main&lt;/span&gt;&lt;span class="p"&gt;/&lt;/span&gt;&lt;span class="n"&gt;scripts&lt;/span&gt;&lt;span class="p"&gt;/&lt;/span&gt;&lt;span class="n"&gt;install&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="py"&gt;ps1&lt;/span&gt; &lt;span class="p"&gt;|&lt;/span&gt; &lt;span class="nb"&gt;iex
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;打开 PowerShell，粘贴回车。安装脚本会自动处理 Python 环境（通过 uv）、Node.js 和 Git Bash 的依赖。&lt;/p&gt;
&lt;p&gt;Linux/macOS 用户原有的 curl 安装方式不变：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh &lt;span class="p"&gt;|&lt;/span&gt; bash
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="为什么这件事值得说"&gt;为什么这件事值得说
&lt;/h2&gt;&lt;p&gt;在 PR #21561 合并之前，Windows 用户想用 Hermes，只有两条路：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;WSL2&lt;/strong&gt;——能用，但你得懂 Linux，得装 WSL，得处理网络桥接，折腾门槛不低。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;自己硬上&lt;/strong&gt;——有人在 Windows 直接跑，但到处报错：fcntl 导入失败、GBK 编码崩溃、进程探测 OSError……体验一言难尽。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;GitHub 上与 Windows 相关的 issue 超过 &lt;strong&gt;1100 个&lt;/strong&gt;。排在前面的全是：&lt;code&gt;os.kill(pid, 0)&lt;/code&gt; 在 Windows 上抛 SystemError、终端工具输出为空、&lt;code&gt;.env&lt;/code&gt; 文件编码损坏、cp1252 导致 UnicodeEncodeError……&lt;/p&gt;
&lt;p&gt;说白了，Hermes 之前是按 POSIX 标准写的，Windows 是个「二等公民」。&lt;/p&gt;
&lt;p&gt;这次合并把这些问题做了系统性的修复：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;进程管理&lt;/strong&gt;：重写了 Windows 进程检测逻辑，用 kernel32.OpenProcess 替代了 POSIX 信号量探测&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;路径处理&lt;/strong&gt;：新增路径归一化函数，统一处理反斜杠、驱动器号、WSL 路径互转&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;编码问题&lt;/strong&gt;：全局强制 UTF-8 输出，解决 cp1252/GBK 崩溃&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;安装体验&lt;/strong&gt;：PowerShell 一键安装器，自动绑定 Python + Node.js + Git Bash&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;CI 门禁&lt;/strong&gt;：新增 &lt;code&gt;check-windows-footguns.py&lt;/code&gt;，每个 PR 都自动检测 Windows 兼容性问题&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="功能对比原生-windows-vs-wsl2"&gt;功能对比：原生 Windows vs WSL2
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;功能&lt;/th&gt;
 &lt;th style="text-align: center"&gt;原生 Windows&lt;/th&gt;
 &lt;th style="text-align: center"&gt;WSL2&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;CLI / TUI&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Gateway 消息网关&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;定时任务&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;浏览器自动化&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;MCP 工具链&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama 本地模型&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Web 管理面板&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;面板内嵌终端&lt;/td&gt;
 &lt;td style="text-align: center"&gt;❌&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;开机自启&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅ (schtasks)&lt;/td&gt;
 &lt;td style="text-align: center"&gt;✅ (systemd)&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;除了面板内嵌终端这一个点，其他功能已经和 WSL2 平齐。&lt;/p&gt;
&lt;h2 id="背后做了什么"&gt;背后做了什么
&lt;/h2&gt;&lt;p&gt;这次合并不是简单加几个 if-else。CONTRIBUTING.md 里新增了 16 条跨平台兼容性规范，覆盖了你在 Windows 上能想到的每一个坑：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;禁止使用 &lt;code&gt;os.kill(pid, 0)&lt;/code&gt;（Windows 会抛 SystemError）&lt;/li&gt;
&lt;li&gt;禁止直接调用 &lt;code&gt;wmic&lt;/code&gt;、&lt;code&gt;ps&lt;/code&gt;、&lt;code&gt;grep&lt;/code&gt; 等 Unix 命令&lt;/li&gt;
&lt;li&gt;&lt;code&gt;fcntl&lt;/code&gt;/&lt;code&gt;termios&lt;/code&gt; 必须 ImportError 保护&lt;/li&gt;
&lt;li&gt;文件读取必须显式指定 UTF-8 编码&lt;/li&gt;
&lt;li&gt;进程管理要用 &lt;code&gt;CREATE_NEW_PROCESS_GROUP&lt;/code&gt; 替代 &lt;code&gt;os.setsid&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;路径必须用 &lt;code&gt;pathlib.Path&lt;/code&gt;，不能硬编码斜杠&lt;/li&gt;
&lt;li&gt;符号链接在 Windows 需要管理员权限&lt;/li&gt;
&lt;li&gt;OneDrive 重定向路径的兼容处理&lt;/li&gt;
&lt;li&gt;CRLF/LF 行尾符一致性&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;配套的 CI 检查脚本会在每个 PR 提交时自动扫描这些「Windows 地雷」，防止新代码引入兼容性问题。&lt;/p&gt;
&lt;h2 id="如果你想试试"&gt;如果你想试试
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;环境要求&lt;/strong&gt;：Windows 10/11，PowerShell 5.1+&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;安装&lt;/strong&gt;：一行命令搞定，安装脚本自带 Python 环境&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;配置模型&lt;/strong&gt;：安装完成后运行 &lt;code&gt;hermes setup&lt;/code&gt;，配置你的 API Key（支持智谱GLM、DeepSeek、通义千问等国内模型）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;启动&lt;/strong&gt;：&lt;code&gt;hermes&lt;/code&gt; 回车，进入交互式终端&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;遇到问题可以直接去 GitHub 搜 issue，1100 多个 Windows 相关 issue 说明社区很活跃，维护者在密集修复。&lt;/p&gt;
&lt;h2 id="值得关注的信号"&gt;值得关注的信号
&lt;/h2&gt;&lt;p&gt;几个细节说明这次不是玩票：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;创始人亲自提交&lt;/strong&gt;：PR #21561 的合并者是 @teknium1（Nous Research 创始人），不是随便一个社区贡献者&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;文档同步上线&lt;/strong&gt;：README 首页直接加了 Windows 安装入口，文档站新增了完整的 Windows 专属页面&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;安装脚本锁定&lt;/strong&gt;：CONTRIBUTING.md 要求 install.sh 和 install.ps1 必须同步更新，不是加完就不管&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;社区参与度高&lt;/strong&gt;：合并当天就有多个新 issue 和 PR 提交，说明已经有用户在原生 Windows 上实际使用了&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="一句话总结"&gt;一句话总结
&lt;/h2&gt;&lt;p&gt;Windows 原生支持从「完全不能用」变成了「能用但还粗糙」。对 Windows 用户来说，门槛从「先学 Linux」降到了「一行命令安装」。对项目来说，用户池一下子从 Linux/macOS 开发者扩展到了全球最大的桌面操作系统用户群。&lt;/p&gt;
&lt;p&gt;Beta 就是 Beta，但方向是对的。&lt;/p&gt;</description></item><item><title>装完 Hermes Agent 就完事了？这8个配置不改，白装了</title><link>https://blog.kalend.top/2026/05/14/hermes-8-configs.html/</link><pubDate>Thu, 14 May 2026 00:00:00 +0800</pubDate><guid>https://blog.kalend.top/2026/05/14/hermes-8-configs.html/</guid><description>
 &lt;blockquote&gt;
 &lt;p&gt;装完 Hermes Agent，兴冲冲跑起来，结果动不动卡死、账单蹭蹭涨、隐私信息全写在日志里——你不是一个人。改8个配置，5分钟搞定，用起来完全两个世界。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;h2 id="先说结论"&gt;先说结论
&lt;/h2&gt;&lt;p&gt;Hermes Agent 装好之后的默认配置，是给&amp;quot;能跑就行&amp;quot;设计的，不是给你最佳体验设计的。
我翻了一整天文档和源码，筛出&lt;strong&gt;8个必改配置&lt;/strong&gt;。改完之后：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;省钱&lt;/strong&gt;——长对话不再重复烧钱，同样的内容不用来回发两遍&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;省心&lt;/strong&gt;——AI不会在同一个错误上死循环&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;安全&lt;/strong&gt;——隐私信息自动脱敏，日志干干净净&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;更聪明&lt;/strong&gt;——复杂任务能拆得更细，简单问题自动用便宜模型&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;一张表先给你看全貌：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;配置项&lt;/th&gt;
 &lt;th&gt;改前&lt;/th&gt;
 &lt;th&gt;改后&lt;/th&gt;
 &lt;th&gt;效果&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;忙时输入模式&lt;/td&gt;
 &lt;td&gt;interrupt（打断式）&lt;/td&gt;
 &lt;td&gt;steer（追加式）&lt;/td&gt;
 &lt;td&gt;执行中可随时追加指令&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;缓存时间&lt;/td&gt;
 &lt;td&gt;5分钟&lt;/td&gt;
 &lt;td&gt;1小时&lt;/td&gt;
 &lt;td&gt;长对话省钱省时间&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;工具断路器&lt;/td&gt;
 &lt;td&gt;没开&lt;/td&gt;
 &lt;td&gt;开启&lt;/td&gt;
 &lt;td&gt;防止死循环烧钱（3次警告，8次硬停）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;子任务深度&lt;/td&gt;
 &lt;td&gt;1层&lt;/td&gt;
 &lt;td&gt;2层&lt;/td&gt;
 &lt;td&gt;复杂任务拆得更细&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;子代理工具集&lt;/td&gt;
 &lt;td&gt;3项基础工具&lt;/td&gt;
 &lt;td&gt;+浏览器&lt;/td&gt;
 &lt;td&gt;子代理能力更强&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;隐私脱敏&lt;/td&gt;
 &lt;td&gt;关闭&lt;/td&gt;
 &lt;td&gt;开启&lt;/td&gt;
 &lt;td&gt;日志不泄露隐私&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;安全扫描&lt;/td&gt;
 &lt;td&gt;关闭&lt;/td&gt;
 &lt;td&gt;开启&lt;/td&gt;
 &lt;td&gt;防止危险自动化&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;智能模型路由&lt;/td&gt;
 &lt;td&gt;关闭&lt;/td&gt;
 &lt;td&gt;开启&lt;/td&gt;
 &lt;td&gt;简单问题用便宜模型&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;下面一个一个说。&lt;/p&gt;
&lt;h2 id="必改的8个配置"&gt;必改的8个配置
&lt;/h2&gt;&lt;h3 id="1-忙时输入模式从打断式改成追加式"&gt;1. 忙时输入模式：从&amp;quot;打断式&amp;quot;改成&amp;quot;追加式&amp;quot;
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你在餐厅点菜，厨师正在做你的红烧肉。默认模式下，你突然喊&amp;quot;加个蛋&amp;quot;，厨师会把锅里的肉倒掉，重新开始做。改成steer模式后，厨师会先把红烧肉做完，再做你的蛋——两不耽误。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：&lt;code&gt;interrupt&lt;/code&gt;——你中途插话，AI会&lt;strong&gt;立刻停下手头的活&lt;/strong&gt;，处理新指令。
&lt;strong&gt;改成&lt;/strong&gt;：&lt;code&gt;steer&lt;/code&gt;——你的新指令排进队列，AI忙完手上的再处理。
&lt;strong&gt;效果&lt;/strong&gt;：AI在执行复杂任务（比如批量改文件）时，你可以随时补充需求，不用干等它做完再说。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：在 &lt;code&gt;~/.hermes/config.yaml&lt;/code&gt; 中：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;display&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;busy_input_mode&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="l"&gt;steer &lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 interrupt&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="2-prompt缓存时间从5分钟拉到1小时"&gt;2. Prompt缓存时间：从5分钟拉到1小时
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：每次去图书馆查资料，默认模式下你每次都得重新办借书证。拉长缓存后，一天内只需要办一次。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：5分钟——超过5分钟，AI会把系统提示词（System Prompt，就是告诉AI&amp;quot;你是谁、该怎么做&amp;quot;那段话）重新发送一遍，&lt;strong&gt;重新算钱&lt;/strong&gt;。
&lt;strong&gt;改成&lt;/strong&gt;：1小时。
&lt;strong&gt;效果&lt;/strong&gt;：长对话中，重复的系统提示词不再每次重发。别小看这个，系统提示词通常有好几千字，来回发一次就是几毛钱。一天聊下来，能省不少。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;prompt_caching&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;cache_ttl&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="l"&gt;1h &lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 5m&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="3-工具循环断路器必须开"&gt;3. 工具循环断路器：必须开
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你让AI去隔壁房间拿东西，门锁了它打不开。默认行为是——它会在门口一直拧把手，拧到你破产。断路器就是：试两次打不开就喊你，别搁那拧了。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：没有断路器。同一个工具（比如搜索、读写文件）调用失败，AI会&lt;strong&gt;无限重试&lt;/strong&gt;。
&lt;strong&gt;改成&lt;/strong&gt;：连续失败&lt;strong&gt;3次警告，8次硬停&lt;/strong&gt;。
&lt;strong&gt;效果&lt;/strong&gt;：尤其在定时任务（Cron Job，让AI定时自动执行的任务）场景下，这个配置能救命。不然你睡一觉起来，AI在某个报错上循环了一整夜，账单直接起飞。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;tool_loop_guardrails&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;warnings_enabled&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;hard_stop_enabled&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;warn_after&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;same_tool_failure&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;3&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 同一工具失败3次后警告&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;hard_stop_after&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;same_tool_failure&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;8&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 同一工具失败8次后强制停止&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="4-子任务嵌套深度从1层改成2层"&gt;4. 子任务嵌套深度：从1层改成2层
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你是项目经理，默认情况下你只能把任务分给下属，下属不能再往下分。改成2层后，下属也能往下再分一级——任务拆得更细，执行更高效。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：1层——AI的总指挥（负责分配任务的主代理）不能再往下派子任务。
&lt;strong&gt;改成&lt;/strong&gt;：2层。
&lt;strong&gt;效果&lt;/strong&gt;：比如你说&amp;quot;帮我调研竞品A&amp;quot;，AI可以拆成&amp;quot;搜网页&amp;quot;+&amp;ldquo;读文档&amp;quot;两个子任务，分别执行后再合并。&lt;strong&gt;1层模式下做不了这种拆分&lt;/strong&gt;，复杂任务容易翻车。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;delegation&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;max_spawn_depth&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;2&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 1&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="5-子代理工具集加上浏览器操作"&gt;5. 子代理工具集：加上浏览器操作
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你派了个助手出去办事，默认只给他纸笔和电话。加上浏览器操作，等于又给他配了台电脑——能做的事多了不止一倍。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：子代理只能用终端（Terminal，命令行操作）、文件操作、网页请求这三样。
&lt;strong&gt;改成&lt;/strong&gt;：加上浏览器（Browser）操作能力。
&lt;strong&gt;效果&lt;/strong&gt;：子代理也能直接操作浏览器，比如打开网页、点击按钮、截图。不用每次遇到需要浏览器的操作都扔回主代理，效率直接翻倍。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;delegation&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;default_toolsets&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;- &lt;span class="l"&gt;terminal&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;- &lt;span class="l"&gt;file&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;- &lt;span class="l"&gt;web&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;- &lt;span class="l"&gt;browser &lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认没有这一项&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="6-隐私脱敏必须开"&gt;6. 隐私脱敏：必须开
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你让AI帮你整理通讯录，默认情况下，你朋友的手机号、你的身份证号会&lt;strong&gt;原样出现在日志里&lt;/strong&gt;。开了脱敏后，这些信息会自动变成&amp;quot;138****5678&amp;quot;这种格式。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：关闭。日志和上下文中&lt;strong&gt;明文存储&lt;/strong&gt;所有隐私信息。
&lt;strong&gt;改成&lt;/strong&gt;：开启。自动检测并脱敏手机号、身份证号等PII（Personally Identifiable Information，个人身份信息）。
&lt;strong&gt;效果&lt;/strong&gt;：你的 Hermes 日志文件里不会出现任何明文隐私数据。尤其是多人共用服务器的情况，这个不开就是在裸奔。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;privacy&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;redact_pii&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 false&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="7-skill安全扫描必须开"&gt;7. Skill安全扫描：必须开
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：AI学会了新技能，默认情况下它想怎么用就怎么用，没人管。安全扫描就是给AI的新技能加了一道&amp;quot;审核&amp;rdquo;——有风险的技能会被拦下来。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：关闭。AI自动创建的技能（Skill，AI根据需要自己写的自动化脚本）&lt;strong&gt;不过安全检查&lt;/strong&gt;。
&lt;strong&gt;改成&lt;/strong&gt;：开启。
&lt;strong&gt;效果&lt;/strong&gt;：AI自己创建的自动化脚本会先过安全检查，比如检测是否有删文件、发网络请求等高风险操作。&lt;strong&gt;防止AI&amp;quot;好心办坏事&amp;quot;&lt;/strong&gt;——它以为在帮你，其实把重要文件删了。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;skills&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;guard_agent_created&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 false&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="8-智能模型路由能省一大笔钱"&gt;8. 智能模型路由：能省一大笔钱
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;类比&lt;/strong&gt;：你去医院，感冒看普通门诊就行，不用挂专家号。智能模型路由就是给AI配了个&amp;quot;分诊台&amp;quot;——简单问题用便宜模型，复杂问题才上贵的。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;默认&lt;/strong&gt;：关闭。所有问题都用你配置的那个模型，不管简单还是复杂。
&lt;strong&gt;改成&lt;/strong&gt;：开启。
&lt;strong&gt;效果&lt;/strong&gt;：举几个例子你就懂了——&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&amp;ldquo;今天几号&amp;rdquo;→ 用0.01元的模型&lt;/li&gt;
&lt;li&gt;&amp;ldquo;帮我写封邮件&amp;rdquo;→ 用0.05元的模型&lt;/li&gt;
&lt;li&gt;&amp;ldquo;帮我重构这段代码&amp;rdquo;→ 才用2元的模型&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;一天下来，账单能砍一半以上。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;配置方法&lt;/strong&gt;：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-yaml" data-lang="yaml"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nt"&gt;smart_model_routing&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;enabled&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="kc"&gt;true&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 默认是 false&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;max_simple_chars&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;160&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 超过160字不走便宜模型&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;max_simple_words&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="m"&gt;28&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 超过28个词不走便宜模型&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;cheap_model&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="c"&gt;# 填你的便宜模型&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="l"&gt;your-provider&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nt"&gt;model&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="l"&gt;your-cheap-model&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id="进阶玩家可以看这些"&gt;进阶玩家可以看这些
&lt;/h2&gt;&lt;p&gt;上面8个是&lt;strong&gt;所有人装完都应该改的&lt;/strong&gt;。如果你是进阶玩家，还有几个值得折腾：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Shell Hooks&lt;/strong&gt;：用shell脚本拦截工具调用。比如每次AI要执行命令时，先跑你的检查脚本。&lt;strong&gt;不需要写Python&lt;/strong&gt;，会写shell就行。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Quick Commands&lt;/strong&gt;：零Token快捷命令。输入 &lt;code&gt;/status&lt;/code&gt; 直接执行系统命令，不经过AI，&lt;strong&gt;不花钱&lt;/strong&gt;。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;模型别名&lt;/strong&gt;：在聊天中输入 &lt;code&gt;/model opus&lt;/code&gt; 一键切换模型，不用去改配置文件。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;凭据池轮换&lt;/strong&gt;：配多个API Key（接口密钥），自动轮换使用，&lt;strong&gt;防止单个Key被限流&lt;/strong&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些配置改起来稍微复杂，后续我会单独写一篇展开讲。&lt;/p&gt;
&lt;h2 id="改完之后我的变化"&gt;改完之后我的变化
&lt;/h2&gt;&lt;p&gt;最明显的是&lt;strong&gt;省钱&lt;/strong&gt;。改之前我日均消耗大概在15元左右，改完智能路由+缓存时间，直接降到6-7块。一个月省下来两百多，够吃好几顿外卖了。
其次是&lt;strong&gt;不卡了&lt;/strong&gt;。之前AI动不动就在某个报错上死循环，得手动停掉重来。开了断路器之后，再没遇到过这种情况。
最后是&lt;strong&gt;放心了&lt;/strong&gt;。隐私脱敏和安全扫描这两个，属于&amp;quot;不出事感觉不到，出事就晚了&amp;quot;的配置。改完之后看日志，干干净净，心里踏实。&lt;/p&gt;
&lt;h2 id="写在最后"&gt;写在最后
&lt;/h2&gt;&lt;p&gt;8个配置，全部加起来改5分钟。但这5分钟，决定了你的 Hermes 是&amp;quot;能用&amp;quot;还是&amp;quot;好用&amp;quot;。
大多数人装完就跑，然后觉得&amp;quot;Hermes 也就那样&amp;quot;——不是 Hermes 不行，是你没调好。
配置文件位置：&lt;code&gt;~/.hermes/config.yaml&lt;/code&gt;，照着改就行，不用动脑子。&lt;/p&gt;
&lt;p&gt;关注&lt;strong&gt;varkm&lt;/strong&gt;，回复【&lt;strong&gt;配置&lt;/strong&gt;】获取完整的 config.yaml 优化模板，直接复制粘贴，一键搞定。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;觉得有用就转给你那个装了 Hermes 但天天骂它不好用的朋友。&lt;/em&gt;&lt;/p&gt;</description></item></channel></rss>