04|量体裁衣:从Sub-Agents到Multi-Agent的工程指南
黄佳

你好,我是黄佳。
了解子代理的来龙去脉之后,我们这一讲接着深入聊相关的工程实践和设计模式。
正式开讲前,我想先抛出一个很多同学都比较困扰的地方:为什么我们有时很快就能“看懂”某些新出来的 AI 产品,而对另一些却始终感觉云里雾里?
上周直播时,就有同学提到一个当下讨论度很高的开源项目 OpenClaw(Clawdbot)。在讨论群里,有人一眼就能说清它的核心设计取舍,而初学者却只能停留在“它好像用了 Agent / Tool / Workflow”的层面。
这背后的差别,往往不在于你有没有把源码读完, 而在于你脑子里有没有一套稳定的“架构式思维框架”。
当你具备这种整体架构模式的认知时,面对一个陌生但热门的 AI 产品,你不再是从零开始理解,而是会下意识地问几个问题:
它解决的核心工程问题是什么?
它选择的是单 Agent,还是某种多 Agent 结构?
它是在用上下文换智能,还是用架构换可控性?
今天这一讲,虽然不在课程原有大纲之内,但我非常建议你在后续子代理工程实操之前,先把这一套“架构视角”建立起来。还是那句老话:站得高,看得远。
这节课的目标,并不是教你某一个具体框架、某一个流行用法, 而是帮你建立一种可以立刻用于拆解当下热门产品,也能长期指导工程设计的通用方法论。学完今天的内容,你不仅能更好地理解 Sub-Agent、Skills 这些概念, 也会更清楚:什么时候该用,什么时候不该用,为什么。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Claude Code 工程化实战》,新⼈⾸单¥59
《Claude Code 工程化实战》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(3)
- 最新
- 精选
hao-kuai置顶光是这篇文章的分析就已经值回票价了,对于编码用户来说优化工程结构才是写代码的人能操作的范围。思考题1和2无法回答,主要是使用claude code 完成编码工作;思考题3,选择方案 C,现象描述就是主上下文撑满导致注意力分散了,Sub-Agent隔离上下文刚好就是解决这个问题的;有问题是老师的视角是更好的提升claude code 完成开发任务的表现还是借助claude code 打造自己的agent工作流啊?作者回复: 谢谢肯定! 回答同学的问题:架构层面 并不矛盾,分布走。 第一步,先通过架构思维来提升Claude Code大型项目的开发能力,让它和人类都不乱。 第二步,再通过Headless和SDK等方式调用Claude Code形成AI原生的Agent工作流。
2026-02-04归属地:江苏
jssfyhandoff agent的定义一般放哪,skill.md还是subagent定义,还是其他地方?作者回复: 它是一个工程设计流程,它的具体实现要通过提示词的规划来完成。也就是放在提升词中,或者整体性的放在CLAUD.md中。
2026-02-04归属地:北京
jssfysub-agent为何会有额外的token开销,不都是用提示词问吗,在主agent提问上下文的开销不一样?作者回复: 我觉得这个问题很值得讨论。从内存管理的角度,会有额外开销,每一次初始化sub-agent,需要:1.重新载入CLAUD.md 2.传入所需要的提示词也就是上下文。3. 传回SubAgent的任务完成结果 —— 而这个过程很可能是多次循环(并行)调用Sub-Agents。 如果这些都是一个主会话来弄,只需要占用同一份单独的上下文空间即可,不存在额外上下文的传递。因此开销较少。 但是如同你所说,内存不等同于Token用量。每次主对话不也是要传入所需要的上下文吗? 我猜测,Token的计数是否和Prompt Caching 机制,上下文压缩,RAG,等方面导致主对话传入的提示词也比每次开多一个SubAgent来的少。是不。而且,不开启SubAgents,对话轮次也少。 总而言之,在主会话和子代理的交互过程中,还是引入了额外的Token。然而就每个提问来说,每次提问都需要给够足够的上下文。—— 因为大模型没有记忆。 大家可以说说自己的观点吗??
2026-02-04归属地:北京
收起评论