极客时间-轻松学习，高效学习-极客邦

最后的风之子
置顶
2025-03-03 来自山东
作者官方补充说明：由于r1自带思维链，与Agent产生了冲突，所以Agent不能使用r1等慢速思考模型，而是要使用v3等老老实实执行命令，没有自己想法的模型；r1适合做的是单项的任务。比如用r1做一个生成财报的工具，然后让v3做Agent去调用该工具
作者回复: https://github.com/xingyunyang01/Geek02/tree/main/achievement-agent，链接为我在直播中演示的员工绩效管理系统Agent，这份代码演示了我上面的补充说明，并且换了一套REACT模板，大家可以下载测试一下
4
张申傲
2025-03-04 来自北京
Agent是Function Calling的升级版。 Agent的本质是一个由LLM驱动的智能系统，内部包含了多个子模块，包括Planning、Memory、Tools和Execution等等，而Function Calling只是Agent诸多能力中的一项。此外，按照OpenAI对于Function Calling或Tool Calling的原始定义，它的作用仅仅是按照规范化的格式生成函数调用参数，而实际的调用还是需要我们自己的应用来执行，相较之下，Agent则是把整个流程都给封装好了。
作者回复: 说对了一半哈，不管是FC还是Agent，大模型都只能选择工具，真正执行工具的永远是人类写的程序。Agent与FC相比，主要是在于如何让大模型思考的过程是我们自己可控的，而不是像FC一样，完全让大模型自己判断
2
一路前行
2025-03-04 来自北京
通俗讲agent其实就是大模型的一种能力吧。其实跟用户普通问题没啥区别。区别在于流程：用户提出一个问题(渲染agent的调用模版）---大模型根据问题判断要调用的工具列表和参数----用户根据函数工具和参数去调用真实的api----结果返回给大模型进行总结----大模生成最终答复。
作者回复: 嗯嗯你的思路是没什么问题的但大模型的能力指的是你不对大模型做任何干预大模型就能给出期望的效果
zhihai.tu
2025-03-04 来自上海
应该是升级吧，Function calling 只是 Agents的一项能力，要实现 Agents，还需要大模型+规划+上下文等等。
作者回复: 嗯嗯算是平替之上的小升级吧。FC是大模型自带的能力，是否能合理调用工具，取决于大模型自身的思考能力。而Agent可以让没有FC功能的大模型也能调用工具，且大模型如何思考，完全由我们怎么写prompt决定，这样会更开放。
jun
2025-03-04 来自广东
这是使用自己的代码，来调用三方的Api来实现一个agent，可以做一个页面出来，对话可以看到效果，这里调用的是阿里部署的大模型；
作者回复: 调用三方API只是为了与大模型对话哦，对话页面可以随便用cursor加streamlit搞一个出来
Apple_968715
2025-03-04 来自广东
更新太慢，半夜放毒
编辑回复: 今天继续更新，先放出前几篇方便大伙儿跟练
神宫寺的鲸
2025-03-03 来自广东
妈呀没懂，这些代码是放在python运行还是直接丢给deep seek
作者回复: 就是普通的python代码哦，可以理解为deepseek是一个API 服务器，你调用SDK就是在和服务器交互
共 3 条评论
xzy
2025-03-03 来自北京
不太理解老师说的Agent是一种设计模式，我理解的Agent是这样子的：大模型中的Agent概念指的是一种基于大模型（如大语言模型）的自动化实体，它具备感知、决策、行动和学习的能力。Agent可以被视为大模型的上层应用，负责将大模型的智能转化为具体的行动和结果。 Agent的核心特征感知环境：Agent通过传感器或其他方式感知周围的环境，这个环境可以是虚拟的，也可以是物理的13。自主决策：Agent能够根据感知到的信息自主做出决定15。执行行动：Agent通过执行器或效应器采取行动以实现目标13。学习和优化：Agent可以通过学习和获取知识来提高其性能，并根据结果进行自我优化16。 Agent的组成和功能 Agent通常由以下组成部分构成： LLM（大模型）：作为Agent的核心大脑，提供智能和决策能力24。记忆：帮助Agent记住过去的经验和知识，分为短期记忆和长期记忆24。规划：Agent根据目标和环境进行任务分解和路径规划24。工具使用：Agent利用各种工具来执行任务，例如API、搜索引擎等24。 Agent的应用 Agent在多个领域发挥着重要作用，例如： RPA（机器人流程自动化）：Agent可以理解人类意图并操作软件以实现自动化1。任务规划：Agent能够根据提示词和知识库进行决策和规划4。总之，Agent是大模型的重要应用形式，它通过感知、决策、行动和学习来实现智能化和自动化。
展开
作者回复: 同学你好，这是论文级别的理论哈。对于我们实际写代码，理解代码为啥这么写，没有任何帮助。那些理论我以前也在其他场合讲过，但讲完了我自己都忘了，哈哈。我们做应用开发，重要是分析其本质，并应用起来。通过这节课的代码，其实你应该也看到了，Agent 就是人类强行通过prompt给了大模型思维链+选择工具的能力，这样大模型就能按照我们设计的预期进行返回了，这是不是就相当于给大模型下套了呢。为啥说Agent相当于设计模式呢，注意重点在于‘’相当于‘’，是因为我们要设计prompt，这是一门很大的学问，设计不好，幻觉就会很严重。
Grack
2025-03-03 来自江苏
老师，您讲的Agent“是一种AI设计模式，一种让大模型变得更聪明的套路”，这里我有些疑惑，我之前学习其他资料，OpenAI对Agent的定义是具有Memory,Planning,Tools和Action能力的"智能系统"。我理解Agent是一个小到deepseek chat对话框的prompt引导的结果，大到未来课程的一个作业帮，可以当作一个Agent，大概可以理解为传统的自动化应用+大模型的大脑后的一个系统。如果说Agent是一个设计模式，那么这个设计模式应该包含什么、怎么解释呢？请老师答疑解惑，谢谢！
作者回复: 同学你好，千万别掉进模型供应商精心包装的概念中去哈，那些理论我以前也在其他场合讲过，但讲完了我自己都忘了，哈哈。我们做应用开发，重要是分析其本质，并应用起来。通过这节课的代码，其实你应该也看到了，Agent 就是人类强行通过prompt给了大模型思维链+选择工具的能力，这样大模型就能按照我们设计的预期进行返回了，这是不是就相当于给大模型下套了呢。为啥说Agent相当于设计模式呢，注意重点在于相当于，是因为我们要设计prompt，这是一门很大的学问，设计不好，幻觉就会很严重。
共 2 条评论
xzy
2025-03-03 来自北京
ReAct 是一种用于构建 AI Agent 的框架，主要目的是让大语言模型（LLM）能够通过推理和行动与外部环境进行交互。ReAct 的核心思想是通过“观察、思考、规划、行动”的循环过程来实现智能体的决策和执行。 ReAct 的核心组件和工作流程思维链（Chain of Thought）：将复杂任务拆解为多个思维步骤。推理（Reasoning）：分析输入数据，生成有效的决策。行动（Action）：执行具体操作，如搜索或执行代码。观察（Observation）：监控和收集环境反馈，为下一步提供依据。 ReAct 的优势增强的动作空间：通过与外部工具交互，提供更可靠和实际的回应。动态推理和适应：能够处理复杂任务和环境，提升用户体验和执行效率。应用场景 ReAct 框架广泛应用于 AI Agent 的开发，例如使用 LangChain 构建 AI Agent，以实现更智能化的任务处理和决策