欢迎大家来到工程篇的第二大模块——Agent 工具生态!
在前面的课程中,我们完成了小红书爆款笔记生成项目的实战,主要是让 Agent 在“脑力”层面进行思考、规划和写作。但是,一个真正强大的 AI 应用,绝不能仅仅停留在“纸上谈兵”。如果说大模型是 Agent 的“大脑”,那么工具(Tools)就是 Agent 探索世界、改变外部状态的“手和脚”。

有了工具,Agent 就可以去查询数据库、读取本地文件、操作浏览器、甚至调用企业内部的微服务,真正帮你完成有价值的闭环任务。今天这节课,我们将从底层的设计哲学出发,探讨如何为大模型打造真正好用、不出错的专属工具。
在让 Agent 使用工具之前,我们需要先理解它底层到底是怎么跑通的。目前业界主流的工具调用范式主要有两种:

Native Function Calling(原生函数调用):这是目前大部分先进大模型(如 GPT-4, Qwen-Max 等)在底层 API 原生支持的能力。你在请求大模型时,不仅传入 Message List,还会传入一个 Tools List(包含工具的名称、描述和参数 JSON Schema)。大模型在理解语义后,会直接在其底层输出特殊的标记,告诉框架:“我要停下来,请帮我调用某个工具,参数是 XXX”。
ReAct 范式:我们在第 2 节课解剖 Agent 时详细讲过,基于 Thought -> Action -> Action Input -> Observation 的文本推演循环。
