

从 0 开始构建 Agent Harness

Tony Bai

资深架构师

5643 人已学习

新⼈⾸单¥59



登录后，你可以任选4讲全文学习

课程目录

已更新 22 讲/共 24 讲

开篇词 (1讲)



时长 11:59

第一章：认知与核心引擎 (4讲)



时长 09:01

02｜核心心脏：手写 Agent 的 Main Loop

时长 12:26

03｜慢思考与自省：在 ReAct 循环中剥离独立的 Thinking 阶段

时长 10:05

04｜大脑接入：抽象 Provider 接口，适配 Claude 与 OpenAI 兼容大模型

时长 08:43

第二章：极简工具与物理交互 (5讲)



05｜动作延伸：构建强扩展性的 Tool Registry 与分发机制

时长 09:41

06｜大道至简：解密 OpenClaw 最简工具集法则与 YOLO 执行哲学

时长 12:22

时长 07:45

08｜并发提效：如何让 Agent 在单轮中并行调用多个互相独立的工具？

时长 15:09

09｜飞书集成：打通真实世界，将 go-tiny-claw 接入飞书机器人的事件流

时长 10:08

第三章：上下文工程体系 (5讲)



10｜提示词组装：告别面条代码，动态加载 AGENTS.md 与外挂 Skills

时长 11:37

11｜会话管理：Session 物理隔离与 Working Memory 的底层实现

时长 13:10

时长 12:39

13｜记忆沉淀：状态外部化，基于文件系统的持久化记忆与待办管理

时长 18:13

14｜错误自愈：上下文感知的 Error Recovery 提示模板注入机制

时长 09:17

第四章：稳定性控制与多智能体 (3讲)



15｜行为干预：防止 Agent 陷入“死循环”的 System Reminders 机制

时长 10:11

时长 11:41

17｜任务委派：引入 Subagent 隔离复杂探索任务的上下文瓶颈

时长 11:04

第五章：可观测性与科学度量 (3讲)



时长 08:30

19｜洞察黑盒：为 Agent 引入 Tracing 机制复盘失败决策路径

时长 11:22

20｜科学度量：如何构建 Benchmark 自动化评估脚本，科学量化 Harness 引擎性能？

时长 12:33

课程跟练，逐步扩展你的 Agent (1讲)



阶段作业｜让你的 Agent 学会“慢思考 + 动手做事”

时长 06:05



从 0 开始构建 Agent Harness





00:00/00:00

登录|注册

20｜科学度量：如何构建 Benchmark 自动化评估脚本，科学量化 Harness 引擎性能？

Tony Bai

你好，我是 Tony Bai。欢迎来到《从 0 开始构建 Agent Harness》专栏的第二十讲。
在过去的 19 讲中，我们为 go-tiny-claw 打造了完善的基础设施。它能慢思考、能防内存溢出、能挂起审批，甚至在上一讲，我们还为它装上了“X 光机”，让你能看到它每一步运转的 Token 与耗时。
但是，作为一名严谨的架构师，你肯定会面临这样一个极其现实的考验：当你把 Compactor (上下文压缩器) 的阈值从 20000 字符调整到了 10000 字符；或者你在 AGENTS.md 里新加了一条“务必写单元测试”的规矩。你如何向老板证明，你的这些改动让 Agent 变“聪明”了，而不是变“笨”了？
在传统的 Web 开发中，我们有 QPS、延迟和单元测试来衡量代码的质量与执行性能。但在充满概率与黑盒的 AI Agent 开发中，如果你只能靠“每次改完代码，去终端里跟它聊几句，看看感觉还行”这种玄学方式来测试，你的引擎永远无法走向工业级应用。
这就是顶级驾驭工程与其他开源玩具的最核心区别：建立可被科学量化的自动评估体系（Benchmark & Evaluation）。今天，我们将通过纯 Go 语言，构建一个极其硬核但又极其简单的自动化 Benchmark 跑分框架，让你真正体会到用“工程方法”调优 AI 的快感！

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《从 0 开始构建 Agent Harness》，新⼈⾸单¥59

立即购买

© 版权归极客邦科技所有，未经许可不得传播售卖。页面已增加防盗追踪，如有侵权极客邦将依法追究其法律责任。

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论



显示
设置



留言



收藏



沉浸
阅读



分享



手机端



快捷键



回顶部



文章页面操作

MAC

windows

作用

esc

esc

退出沉浸式阅读

shift + f

f11

进入/退出沉浸式

command + ⬆️

home

滚动到页面顶部

command + ⬇️

end

滚动到页面底部

⬅️ (仅针对订阅）

⬅️ (仅针对订阅）

上一篇

➡️ (仅针对订阅）

➡️ (仅针对订阅）

下一篇

command + j

page up

向下滚动一屏

command + k

page down

向上滚动一屏

p

p

音频播放/暂停

j

j

向下滚动一点

k

k

向上滚动一点

空格

空格

向下滚动一屏

播放器操作

MAC

windows

作用

esc

esc

退出全屏

⬅️

⬅️

快退

➡️

➡️

快进

空格

空格

视频播放/暂停(视频全屏时生效)