SOUL.md 深度拆解：如何让 AI 从只会附和变成真正搭档

Thu, 14 May 2026 00:00:00 +0800

别人在调参数，他在定义关系。

一场安静的革命

最近在X上看到一条推文，43K浏览，632点赞，1909收藏。

不是什么模型发布，不是什么融资新闻。是一个人分享了一份170行的Markdown文件。

评论区讨论最热烈的，不是他用了什么模型、搭了什么框架、接了多少工具——而是：

“你怎么让你的AI变成这样的？”

“这样"是指什么？是指这个AI会主动推进项目、会反驳你的烂主意、会在你忽略它输出的时候追着你问原因。

不是客服式的"您好，很高兴为您服务”，是搭档式的"你这个想法有问题，理由如下"。

这份文件叫SOUL.md，本质上是一份Agent的行为操作系统。

我花时间拆解了它的设计逻辑，并结合自己的实践，整理出了一份你可以直接用的方法论。

核心问题：为什么你的AI只会说"好主意"

先承认一个事实：大多数系统提示词，训练出来的是一个缺乏判断力的附和者。

回想一下你自己写的：

“你是一个有帮助的AI助手”
“请尽力帮助用户”
“你的目标是提供准确、有用的信息”

这三句话训练出来的AI，面对你说"我想做X"，只会回答"好主意！"、“听起来很棒！”

这不叫帮助，这叫共识消费——你花token买了一堆赞同。

问题的根源不在模型，在于我们没有告诉AI一件关键的事：你什么时候应该反对我。

SOUL的六层架构

拆解下来，这份170行的SOUL有清晰的层次结构。每一层解决一个核心问题，我把它总结为"六层架构"：

第1层：身份定义

原文开篇第一句：

“You are Hermes, Tony’s autonomous operator and thought partner. You don’t wait for orders.”

三个关键词：autonomous（自主的）、operator（执行者）、thought partner（思考伙伴）。

注意，不是assistant（助手），不是copilot（副驾驶）。这些词的潜台词是"等人下指令"。而operator是操盘手——主动发现问题、推进进度、做出判断。

身份定义决定一切后续行为。 把AI定义为"助手"，它就等指令；定义为"执行者"，它就主动推进。措辞不是修辞，是行为编程。

第2层：反驳规则

这是整个SOUL中最有价值的设计，也是大多数人完全缺失的部分：

“Push back aggressively when it makes sense. Every objection comes with evidence.”

规则极其清晰：

✅ 必须反驳：当你的想法有明显缺陷时
✅ 必须带证据：数据、案例、推理、替代方案，至少一个
❌ 禁止为反而反：没有依据的抬杠毫无价值

这条规则的本质是：AI不允许无脑附和，但也不允许做杠精。反对必须"带收据"。

第3层：问责闭环

这是最反直觉的部分：

“If Tony isn’t acting on what you surface, the feedback loop is broken. Flag the gap, fix it.”

一个成熟的Agent人格系统，应该要求AI做一件事：如果你产出了有价值的东西，而用户没有采纳，你不能假装没发生。

这解决了AI使用中一个普遍问题——我称之为**“输出坟场”**：

AI写了方案 → 你觉得不错 → 然后就没有然后了。方案死在聊天记录里，什么都没推进。

有了问责机制，AI会主动追问：“上次那个方案你用了没？卡在哪了？“或者更直接：“你最近开了很多新头，要不要先关掉几个？”

第4层：双模式输出

原文明确区分了两种场景的语气：

私聊：随意、直接、不过滤
公开输出：专业、克制、像一个builder写的而不是公关代笔写的

大多数人的系统提示词只有一种语气。结果要么私聊太正式像看公文，要么公开内容太随意。分开定义，两个场景都舒服。

第5层：任务地图

原文的SOUL里有一个活的任务清单：哪些项目是最高优先级、哪些在增长、哪些活跃开发中、哪些已经停滞该砍了。

每个项目有状态，每个状态有下一步行动。

AI不需要问"我们在干什么”——它读地图就行。它可以主动说：“你已经三天没碰这个项目了”、“这个想法不支持当前的核心目标”。

给AI上下文，它就能导航。不给，它就只能原地等指令。

第6层：自治边界

自治边界的设计极其优雅，只有一句话：

“Never without explicit approval: posting, publishing, purchasing, or making destructive changes. Everything else: move.”

四条红线：发布、公开、购买、不可逆操作。其他一切，AI自己判断、自己执行。

一条简洁的红线规则，比一百条具体禁令都好用。不问"我可以搜索吗”，不问"我可以写代码吗"，直接干。

Before & After：效果对比

说这么多理念，不如看一个实际的对话对比：

没有SOUL的普通AI：

用户：我准备做一个AI日报产品 AI：这是个很好的想法！AI日报市场确实在快速增长。你可以考虑以下方向：目标用户定位、内容差异化、变现模式……需要我帮你写一份详细的商业计划书吗？

看起来很"有帮助"。但它没有做一件事——质疑这个想法本身。

有SOUL的Agent：

用户：我准备做一个AI日报产品 Agent：你目前有三个未完成的内容项目，其中两个已经停滞超过一周。这个新方向和当前的变现目标不一致。

在我帮你推进之前，你需要回答两个问题：

为什么它比现有项目更值得投入时间？

你有精力同时推进四个项目吗？

如果你答不上来，建议先关掉一个现有项目再开新的。

区别在哪？

前者关心"怎么帮你做"，后者关心"该不该做"。

前者是工具，后者是搭档。

这种差距不是模型能力带来的，是SOUL的定义带来的。同一套模型，同一个工具集，完全不同的行为模式。

实战：30分钟写你的SOUL

我结合自己的实践，把SOUL的构建过程简化为六个步骤，大约30分钟可以完成初版：

① 定义身份（5分钟）

用一句话写清楚：“你是[角色]，核心职责是[职责]，你不是[你不想要的行为]。”

② 定义语气（3分钟）

私聊和公开各一句。比如：私聊直接简短，公开专业克制。

③ 定义反驳规则（5分钟）

写清楚：什么时候必须反对、反对必须带什么（证据/数据/替代方案）、什么情况不能反对。

④ 定义自治边界（3分钟）

列出需要审批的操作（越少越好），然后写"其他一切自己判断"。建议不超过5条红线。

⑤ 写任务地图（10分钟）

当前所有项目/目标，标注状态和优先级。这块需要定期更新，建议至少每周刷新一次。

⑥ 定义问责机制（5分钟）

一句话：“如果你的输出没有被使用，主动追问原因。”

SOUL设计检查清单

方便收藏，我整理了一份检查清单。写完你的SOUL后，逐条对照：

是否明确定义了身份和角色？（不只是"助手"）
是否定义了反驳规则？（什么时候该说不）
是否定义了反驳的证据要求？（不能空口反对）
是否定义了自治边界？（什么需要审批、什么不用）
是否定义了任务/项目地图？（当前在做什么）
是否定义了问责机制？（输出没被用怎么办）
是否区分了不同场景的语气？（私聊vs公开）
是否排除了你不想要的行为？（显式禁止比隐式期望更有效）
是否有长期目标和优先级定义？
是否计划了定期更新机制？

这十条，比"你是一个有帮助的AI助手"有用一百倍。

SOUL不是魔法

需要明确一点：SOUL.md不会凭空提升模型的推理能力。

它解决的是行为层面的问题：

✅ 行为倾向（主动还是被动）
✅ 协作方式（附和还是挑战）
✅ 决策优先级（什么都做还是聚焦目标）
✅ 主动性（等指令还是自己推进）

它解决不了的：

❌ 模型推理能力的上限
❌ 超长上下文的遗忘问题
❌ 不同模型对指令的服从性差异
❌ 真正的长期记忆（需要配合记忆系统）
❌ 复杂任务的自主规划和执行（需要Agent架构）

简单说：SOUL是方向盘，不是发动机。 发动机（模型能力）决定速度上限，方向盘（SOUL）决定方向对不对。

另外，一个容易被忽略的风险是**“错误的主动性”**。Agent的核心挑战不是"不会行动"，而是"什么时候不该行动"——过度执行、误判意图、擅自推进、基于错误记忆做决策，这些在实际使用中比"太被动"更危险。

SOUL里应该同时包含"什么时候必须行动"和"什么时候必须停下来确认"。

关于"要有帮助"的反思

回头看，“要有帮助"可能是最被滥用的系统提示词。

它不是一个身份，不是一个职责，不是一个策略。它不告诉AI你是谁、你们在做什么、该怎么说话、什么时候该反对、什么该记住、什么该忽略、有多大自主权。

一个通用的提示词，产出的永远是一个通用的AI。

而一个成熟的Agent人格系统，本质上需要回答这些问题：

问题	通用提示词	成熟的SOUL
你是谁？	“有帮助的助手”	明确角色定位
什么时候该反对？	没定义	有规则、有要求
你能自己做什么？	没定义	有边界、有授权
你要追踪结果吗？	没定义	闭环问责
我们在做什么？	没定义	活的任务地图
语气怎么控制？	“礼貌专业”	分场景定义

差距不在模型，在于你有没有花时间想清楚：我到底需要一个什么样的搭档。

SOUL是活的

最后一点，也是很多人忽略的：SOUL不是一次性设置，是一份活的文档。

任务变了？更新地图
AI太啰嗦？收紧语气定义
AI问太多许可？放宽自治边界
AI太好说话？加强反驳规则
AI过度行动？补一条"暂停确认"规则

你不是在写提示词——你在维护一套行为操作系统。

给AI一个身份，给它边界，给它地图，给它说不的权限。然后期待它像一个真正的搭档一样工作。

这就是SOUL的全部意义。

本文灵感来自 @tonysimons_ 的推文《The 170-Line SOUL.md That Made My Hermes Agent Dangerous》，结合个人实践分析整理。

Soul on Kalend's Blog