企业级多智能体设计实战
晓寒
前百度资深架构师
3536 人已学习
新⼈⾸单¥59
课程目录
已更新 18 讲/共 42 讲
工程落地篇:从0构建生产级多智能体系统 (2讲)
直播回放 (1讲)
企业级多智能体设计实战
登录|注册
留言
收藏
沉浸
阅读
分享
手机端
回顶部
当前播放: 16|Skills生态:让Agent接入大量工具
00:00 / 00:00
字幕已开启
高清
  • 高清
1.0x
  • 3.0x
  • 2.5x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.75x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
课程介绍|告别“野路子”:转型企业级多智能体架构师
01|拨开迷雾:AI 应用开发的四种架构范式
02|解构智能体:Agent 的解剖学与 ReAct 范式
03|Multi-Agent系统:Agent、Task、Process的协作美学
04|架构师的决断:AI 应用开发选型工具
05|工程全景图:构建企业级多智能体系统的“施工蓝图”
06|工欲善其器:课程学习的基础代码环境准备
07|定义Agent:从“提示词工程”到“人设工程”
08|定义Task——从“步骤控制”到“契约驱动”
09|定义 Process——任务调度与信息传递
10|多模态模型:让你的 Agent 拥有“眼睛”
11|项目实践(一):小红书爆款笔记生成项目
12|工具设计哲学:从 API 到 Agent-Native 的范式跃迁
13|自定义工具封装:构建 Tools 的五步标准 SOP
14|MCP协议:标准化定义工具接口
15|王牌超能力:代码解释器与无头浏览器
16|Skills生态:让Agent接入大量工具
直播回放|爆火全网的OpenClaw强在哪儿?
本节摘要

欢迎回来!在上一节课,我们为 Agent 装上了真正的"王牌超能力"——AIO-Sandbox 沙盒环境赋予了它代码解释器和无头浏览器,让它能在安全隔离的环境里自主执行任务、抓取数据、操控浏览器。可以说,Agent 的"手脚"问题彻底解决了。

但一个新的问题接踵而至:工具有了,Agent 知道怎么用吗?

拿我们熟悉的文档处理场景举例。PDF 文件有很多坑:有些 PDF 有文字层可以直接提取,有些则是扫描图片需要 OCR;有些 PDF 有密码保护;有些中文内容直接用 pypdf 提取会乱码,需要特殊处理。这些"最佳实践",Agent 并不天然知道——它只知道"我有 sandbox_execute_code 工具可以执行代码",但它不知道"执行什么代码、按什么步骤执行,才是处理 PDF 的正确姿势"。

这就是本节课要解决的问题。Skills 的出现,就是为了让 Agent 不光能用工具,还能按说明书用工具


一、 认知原点:Skills 的本质是什么?

先把一个可能的误区拿出来说清楚:Skills 不是 API,不是 MCP Server,更不是某种插件格式。

图片
Skills 的本质,是"给 LLM 读的结构化操作手册"。

就像新员工入职,HR 会给他一本《操作手册》,里面写着"处理客户退款时,第一步先核实订单状态,第二步……"。Skills 就是面向 AI 的操作手册——告诉 Agent 在特定场景下,应该按照什么步骤、使用哪些工具、规避哪些陷阱来完成任务。

登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论