• 最后的风之子
    置顶
    2025-03-03 来自山东
    作者官方补充说明:由于r1自带思维链,与Agent产生了冲突,所以Agent不能使用r1等慢速思考模型,而是要使用v3等老老实实执行命令,没有自己想法的模型;r1适合做的是单项的任务。比如用r1做一个生成财报的工具,然后让v3做Agent去调用该工具

    作者回复: https://github.com/xingyunyang01/Geek02/tree/main/achievement-agent,链接为我在直播中演示的员工绩效管理系统Agent,这份代码演示了我上面的补充说明,并且换了一套REACT模板,大家可以下载测试一下

    
    4
  • 张申傲
    2025-03-04 来自北京
    Agent是Function Calling的升级版。 Agent的本质是一个由LLM驱动的智能系统,内部包含了多个子模块,包括Planning、Memory、Tools和Execution等等,而Function Calling只是Agent诸多能力中的一项。 此外,按照OpenAI对于Function Calling或Tool Calling的原始定义,它的作用仅仅是按照规范化的格式生成函数调用参数,而实际的调用还是需要我们自己的应用来执行,相较之下,Agent则是把整个流程都给封装好了。

    作者回复: 说对了一半哈,不管是FC还是Agent,大模型都只能选择工具,真正执行工具的永远是人类写的程序。Agent与FC相比,主要是在于如何让大模型思考的过程是我们自己可控的,而不是像FC一样,完全让大模型自己判断

    
    2
  • 一路前行
    2025-03-04 来自北京
    通俗讲agent其实就是大模型的一种能力吧。其实跟用户普通问题没啥区别。区别在于流程:用户提出一个问题(渲染agent的调用模版)---大模型根据问题判断要调用的工具列表和参数----用户根据函数工具和参数去调用真实的api----结果返回给大模型进行总结----大模生成最终答复。

    作者回复: 嗯嗯 你的思路是没什么问题的 但大模型的能力指的是你不对大模型做任何干预 大模型就能给出期望的效果

    
    
  • zhihai.tu
    2025-03-04 来自上海
    应该是升级吧,Function calling 只是 Agents的一项能力,要实现 Agents,还需要大模型+规划+上下文等等。

    作者回复: 嗯嗯 算是平替之上的小升级吧。FC是大模型自带的能力,是否能合理调用工具,取决于大模型自身的思考能力。而Agent可以让没有FC功能的大模型也能调用工具,且大模型如何思考,完全由我们怎么写prompt决定,这样会更开放。

    
    
  • jun
    2025-03-04 来自广东
    这是使用自己的代码,来调用三方的Api来实现一个agent,可以做一个页面出来,对话可以看到效果,这里调用的是阿里部署的大模型;

    作者回复: 调用三方API只是为了与大模型对话哦,对话页面可以随便用cursor加streamlit搞一个出来

    
    
  • Apple_968715
    2025-03-04 来自广东
    更新太慢,半夜放毒

    编辑回复: 今天继续更新,先放出前几篇方便大伙儿跟练

    
    
  • 神宫寺的鲸
    2025-03-03 来自广东
    妈呀没懂,这些代码是放在python运行还是直接丢给deep seek

    作者回复: 就是普通的python代码哦,可以理解为deepseek是一个API 服务器,你调用SDK就是在和服务器交互

    共 3 条评论
    
  • xzy
    2025-03-03 来自北京
    不太理解老师说的Agent是一种设计模式,我理解的Agent是这样子的: 大模型中的Agent概念指的是一种基于大模型(如大语言模型)的自动化实体,它具备感知、决策、行动和学习的能力。Agent可以被视为大模型的上层应用,负责将大模型的智能转化为具体的行动和结果。 Agent的核心特征 感知环境:Agent通过传感器或其他方式感知周围的环境,这个环境可以是虚拟的,也可以是物理的13。 自主决策:Agent能够根据感知到的信息自主做出决定15。 执行行动:Agent通过执行器或效应器采取行动以实现目标13。 学习和优化:Agent可以通过学习和获取知识来提高其性能,并根据结果进行自我优化16。 Agent的组成和功能 Agent通常由以下组成部分构成: LLM(大模型):作为Agent的核心大脑,提供智能和决策能力24。 记忆:帮助Agent记住过去的经验和知识,分为短期记忆和长期记忆24。 规划:Agent根据目标和环境进行任务分解和路径规划24。 工具使用:Agent利用各种工具来执行任务,例如API、搜索引擎等24。 Agent的应用 Agent在多个领域发挥着重要作用,例如: RPA(机器人流程自动化):Agent可以理解人类意图并操作软件以实现自动化1。 任务规划:Agent能够根据提示词和知识库进行决策和规划4。 总之,Agent是大模型的重要应用形式,它通过感知、决策、行动和学习来实现智能化和自动化。
    展开

    作者回复: 同学你好,这是论文级别的理论哈。对于我们实际写代码,理解代码为啥这么写,没有任何帮助。那些理论我以前也在其他场合讲过,但讲完了我自己都忘了,哈哈。我们做应用开发,重要是分析其本质,并应用起来。通过这节课的代码,其实你应该也看到了,Agent 就是人类强行通过prompt给了大模型思维链+选择工具的能力,这样大模型就能按照我们设计的预期进行返回了,这是不是就相当于给大模型下套了呢。为啥说Agent相当于设计模式呢,注意重点在于‘’相当于‘’,是因为我们要设计prompt,这是一门很大的学问,设计不好,幻觉就会很严重。

    
    
  • Grack
    2025-03-03 来自江苏
    老师,您讲的Agent“是一种AI设计模式,一种让大模型变得更聪明的套路”,这里我有些疑惑,我之前学习其他资料,OpenAI对Agent的定义是具有Memory,Planning,Tools和Action能力的"智能系统"。我理解Agent是一个小到deepseek chat对话框的prompt引导的结果,大到未来课程的一个作业帮,可以当作一个Agent,大概可以理解为传统的自动化应用+大模型的大脑后的一个系统。如果说Agent是一个设计模式,那么这个设计模式应该包含什么、怎么解释呢? 请老师答疑解惑,谢谢!

    作者回复: 同学你好,千万别掉进模型供应商精心包装的概念中去哈,那些理论我以前也在其他场合讲过,但讲完了我自己都忘了,哈哈。我们做应用开发,重要是分析其本质,并应用起来。通过这节课的代码,其实你应该也看到了,Agent 就是人类强行通过prompt给了大模型思维链+选择工具的能力,这样大模型就能按照我们设计的预期进行返回了,这是不是就相当于给大模型下套了呢。为啥说Agent相当于设计模式呢,注意重点在于相当于,是因为我们要设计prompt,这是一门很大的学问,设计不好,幻觉就会很严重。

    共 2 条评论
    
  • xzy
    2025-03-03 来自北京
    ReAct 是一种用于构建 AI Agent 的框架,主要目的是让大语言模型(LLM)能够通过推理和行动与外部环境进行交互。ReAct 的核心思想是通过“观察、思考、规划、行动”的循环过程来实现智能体的决策和执行。 ReAct 的核心组件和工作流程 思维链(Chain of Thought):将复杂任务拆解为多个思维步骤。 推理(Reasoning):分析输入数据,生成有效的决策。 行动(Action):执行具体操作,如搜索或执行代码。 观察(Observation):监控和收集环境反馈,为下一步提供依据。 ReAct 的优势 增强的动作空间:通过与外部工具交互,提供更可靠和实际的回应。 动态推理和适应:能够处理复杂任务和环境,提升用户体验和执行效率。 应用场景 ReAct 框架广泛应用于 AI Agent 的开发,例如使用 LangChain 构建 AI Agent,以实现更智能化的任务处理和决策
    
    