欢迎回来!在上一节课,我们为 Agent 装上了真正的"王牌超能力"——AIO-Sandbox 沙盒环境赋予了它代码解释器和无头浏览器,让它能在安全隔离的环境里自主执行任务、抓取数据、操控浏览器。可以说,Agent 的"手脚"问题彻底解决了。
但一个新的问题接踵而至:工具有了,Agent 知道怎么用吗?
拿我们熟悉的文档处理场景举例。PDF 文件有很多坑:有些 PDF 有文字层可以直接提取,有些则是扫描图片需要 OCR;有些 PDF 有密码保护;有些中文内容直接用 pypdf 提取会乱码,需要特殊处理。这些"最佳实践",Agent 并不天然知道——它只知道"我有 sandbox_execute_code 工具可以执行代码",但它不知道"执行什么代码、按什么步骤执行,才是处理 PDF 的正确姿势"。
这就是本节课要解决的问题。Skills 的出现,就是为了让 Agent 不光能用工具,还能按说明书用工具。
先把一个可能的误区拿出来说清楚:Skills 不是 API,不是 MCP Server,更不是某种插件格式。

Skills 的本质,是"给 LLM 读的结构化操作手册"。
就像新员工入职,HR 会给他一本《操作手册》,里面写着"处理客户退款时,第一步先核实订单状态,第二步……"。Skills 就是面向 AI 的操作手册——告诉 Agent 在特定场景下,应该按照什么步骤、使用哪些工具、规避哪些陷阱来完成任务。
