16|防御纵深:利用 Middleware 实现高危命令拦截与飞书人工审批
Tony Bai

你好,我是 Tony Bai。欢迎来到《从 0 开始构建 Agent Harness》专栏的第十六讲。
在前面的讲解中,我们已经为 go-tiny-claw 构建了一套极其聪明的自驱体系:它拥有强大的“极简工具集”,遇到错误懂得自我“疗愈”(Error Recovery),陷入死胡同能被系统“当头棒喝”(System Reminders)。
如果在开发者的个人电脑上运行(本地环境),这套体系配合我们在第 6 讲探讨的 YOLO(You Only Live Once,全权信任)模式,可以说是将效率拉满。因为即便 Agent 改错了代码,你也可以用 git checkout 或 git reset 轻松回滚。
但是,一旦你把 Agent 接入企业 IM(如飞书群)并赋予它操作远端服务器或生产数据库的能力时,情况就完全不同了。
想象一下:在一个深夜的运维群里,你让 Agent 帮忙清理一下某台机器上无用的日志。Agent “聪明”地组合出了一条命令:bash: "rm -rf /var/log/*"。
如果此时系统依然处于 YOLO 模式,它会瞬间清空这台机器的日志目录,第二天你可能就会收到公司的严重警告。
在驾驭工程中,安全性绝对不能依赖于大模型的“理智”,更不能寄希望于写在 System Prompt 里的那句“千万别删库”。 我们必须在底层的执行节点,构筑一道坚不可摧的物理防线。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《从 0 开始构建 Agent Harness》,新⼈⾸单¥59
《从 0 开始构建 Agent Harness》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论