5分钟理解 Subagent 架构

张开发
2026/4/8 14:15:46 15 分钟阅读

分享文章

5分钟理解 Subagent 架构
一、为什么 AI 做复杂任务总是越做越偏很多人用 Claude Code 或 OpenClaw 处理复杂任务时都遇到过这个现象任务开始时表现不错但越往后越离谱忽略之前的约束、重复已经做过的步骤、把早期提到的细节搞错。直觉上会觉得是模型变差了但其实不是。这是架构问题。二、一次典型的失败设想一个多步骤任务抓取今日 AI 新闻 → 筛选整理 → 写成日报草稿 → 审核修改 → 转换成各平台格式 → 提交发布。让单个主 Agent 从头跑到尾大概从第三步开始就会出现漂移。原因很简单上下文窗口是有限的。任务执行过程中产生的中间输出——思考过程、代码片段、报错信息——会持续塞进同一个窗口。200K token 听起来很大但当窗口达到三分之二的容量时最开始的需求细节、约束条件、关键背景就会被稀释到注意力触及不到的地方。三、解决办法老板与员工解法是 Subagent 架构。一句话概括主 Agent 是老板Subagent 是有干净脑子的员工。干净的上下文每个 Subagent 启动时都带着一个全新的上下文窗口只装这次任务需要的信息不背负主 Agent 积累的所有历史。这就是干净脑子的含义——不是更聪明而是没有包袱。任务书而非对话主 Agent 给 Subagent 分配任务时靠的是一份明确的任务书而不是共享上下文。Subagent 完成后把结果摘要汇报回来主 Agent 只需要消化结论不需要重放整个执行过程。这和普通的工具调用Tool Call不同——工具调用只是函数执行上下文还是同一个Subagent 是独立进程有自己的推理空间。对应关系管理概念Subagent 架构老板拆解项目分配任务主 Agent 规划并派发子任务员工只知道自己负责的那块Subagent 持有独立上下文员工汇报结果不汇报过程Subagent 返回摘要不暴露中间状态多个员工并行工作多个 Subagent 并发执行找专人做专事为不同子任务定制不同 Prompt给 Subagent 一份干净且精准的任务书核心逻辑分层委派不是 AI 特有的发明。人类组织几千年来用层级结构处理复杂问题本质上也是在应对个体注意力的上限军事指挥罗马军团的士兵 → 百夫长 → 千人队长 → 将军每层只需盯住直属下级皇帝不需要知道每个士兵的动向。宗教组织天主教会的教皇 → 红衣主教 → 主教 → 神父 → 信徒梵蒂冈一个人管不了全球十几亿信众但通过层级可以做到。封建制度国王 → 诸侯 → 骑士 → 农民国王只需管几十个诸侯诸侯管几十个骑士把注意力分摊到各层。现代企业CEO 的认知带宽有限所以有 VP、Director、Manager——每层管理者只关注大约 5–8 个直接下属。Subagent 架构只是把同样的逻辑搬到了 AI 系统里。真实案例以我自己搭的 AI 日报工作流为例简化后的结构长这样Step 1数据采集主 Agent 自己跑脚本Step 2撰写 Newsletter 草稿主 Agent 自己写Step 3启动 newsletter-editor专门负责内容审查和修改的 Subagent传入草稿路径等修改完成Step 4同时启动 twitter-formatter专门负责转换为 Twitter Thread 格式的 Subagent和 wechat-formatter专门负责转换为微信公众号格式的 Subagent各自传入 newsletter 路径单条消息并行调用等全部完成后继续Step 5提交发布对照上面的表格逐行验证员工只知道自己负责的那块newsletter-editor只收到草稿路径twitter-formatter只收到 newsletter 路径它们都对主流程一无所知。多个员工并行工作Step 4 的两个 Subagent 同时启动互不依赖总耗时取决于较慢的那个。员工汇报结果不汇报过程每个 Subagent 把结果写回文件主 Agent 只检查输出是否存在不重放任何中间状态。整个过程下来主 Agent 的上下文窗口始终保持干净——它只装自己的规划和各步骤的结论三个 Subagent 产生的所有中间内容审查意见、格式转换过程都在各自的窗口里消化不会回流污染主流程。四、用法与边界什么时候该派活什么时候别派任务书写清楚信息不会自动传递老板脑子里装着所有背景但员工入职第一天什么都不知道。你觉得这还用说的前提条件对员工来说可能是盲区。Subagent 也一样。它启动时只有你给它的任务书主 Agent 积累的所有上下文不会自动流过去。任务书写得含糊它不会追问背景——或者追问了也问不到——只能靠猜然后跑偏。派活之前先想清楚换一个什么都不知道的新员工拿到这份任务书能不能干派活本身有成本雇人、培训、开会对齐都需要时间。如果只是确认一个会议时间发条消息自己问比委托员工问快得多。Subagent 也有启动延迟汇报摘要也会损耗细节。任务足够简单的时候这些成本完全不值得。什么任务适合派什么不适合适合派给 Subagent不适合任务性质模块清晰边界明确步骤之间高度耦合协作方式员工可以自己闷头干完再汇报需要频繁和老板对齐中间状态任务规模足够大值得专人负责太小管理成本大于执行成本一句话判断标准这个任务能不能写成一份清晰的任务书交出去之后不管它等结果就行能就派不能就自己做。五、最后好的组织设计和好的 Agent 架构本质上解决的是同一个问题——如何让一个注意力有限的决策者驾驭远超其上限的复杂任务。答案都是分层、委派、摘要汇报。人类几千年管理智慧和 AI Agent 架构竟然殊途同归。

更多文章