欢迎回来!在上一节课中,我们深入探讨了 MCP(模型上下文协议),它让我们能够用极低的代码成本,将 Agent 与各种外部系统连接起来。有了 MCP 这条“高速公路”,今天我们就要为 Agent 装载真正重量级的“武器”了。
如果说普通的工具让 Agent 勉强算个“实习生”,那么赋予它这节课要讲的三大王牌超能力,你的 Agent 将瞬间进化为全能的“数字白领”。这三大能力分别是:文件操作、代码解释器(Code Interpreter)和无头浏览器(Headless Browser)。
要让 Agent 在复杂的真实世界中独立完成闭环任务,它必须具备以下三种递进的核心能力:

这是最基础的超能力。Agent 不仅需要能读取(Read)和写入(Write)文件,更关键的是具备局部编辑(Edit/Diff)的能力。
就像我们在使用 Cursor 或 Claude 时经常看到的,面对一个庞大的代码文件或几万字的报告,Agent 不需要每次都全量重写,而是通过生成 Diff 差异来进行精准的局部修改。一旦掌握了这个能力,Agent 就具备了极强的条理性和规划性,能够从容应对复杂的文档编辑与代码重构任务。
