如何构建一个生产级的AI Agent？

陈旭

分享嘉宾：陈旭，中兴通讯软件研发资深专家
 Sorry, your browser doesn't support embedded videos. 
00:00 / 00:00
1.0x
 3.0x 
 2.5x 
 2.0x 
 1.5x 
 1.25x 
 1.0x 
 0.75x 
 0.5x 
音量
网页全屏
全屏
00:00
你好，我是陈旭，现任中兴通讯软件研发资深专家、AIM  平台系统架构师，同时负责低代码平台  Awade  的架构设计与研发，亦是《说透低代码》专栏作者。目前核心精力聚焦于  AI  平台系统架构工作。
本次分享将结合低代码场景，探讨生产级  AI Agent  的构建路径。
从技术趋势来看，AI  应用正从  Copilot  模式向更强大的  Agent  模式演进，2024  年被称为  “Agent  元年”。但当前多数所谓  “Agent”  仅停留在  API  调用或提示词封装的初级阶段，难以自主完成复杂任务的理解、规划与执行。本次分享聚焦低代码平台的  Agent  化演进，围绕“如何构建具备开发属性的生产级  Agent”展开，通过三个核心部分拆解实践路径。
自然语言与  GUI  的协同：互补而非替代破除  “AI  万能论”  迷思2023  年  ChatGPT  推出后，“自然语言可彻底颠覆所有交互”的观点盛行，但实践表明，AI  在短期内难以实现全场景覆盖。GUI  历经二三十年发展，已形成成熟的用户习惯与应用价值，二者必然走向协同而非替代。我们应摒弃“非此即彼”的思维，让自然语言与可视化工具发挥各自优势，实现  1+1>2  的协同效应。
两种交互方式的优劣势对比

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. AI应用正从Copilot模式向更强大的Agent模式演进，需要具备开发属性的生产级Agent。 2. 自然语言与GUI应该形成互补关系，实现1+1>2的协同效应，根据任务属性自动匹配高效工具。 3. Agent需要具备“观察-规划-执行-反思”的闭环能力，包括全局扫描、局部放大、条件筛选等观察能力。 4. 规划器需要将复杂目标拆解为可执行的子任务，并处理指令分流，支持修改与二次确认。 5. Agent的执行阶段核心是工具调用与中间结果传递，需要保存关键中间结果，支持操作回退能力。 6. 上下文感知能力决定Agent的智能上限，视野应涵盖内部状态和外部环境，实现目标驱动的AI搜索机制。 7. 交互模式：协同优于替代自然语言与可视化 GUI 需发挥各自优势：自然语言侧重“从 0 到 1 的框架搭建”与“复杂逻辑表达”，GUI 侧重“从 1 到 N 的精细打磨”与“精确操作”，通过互补实现高效交互。 8. 核心能力：闭环决定智能观察（感知状态）、规划（拆解目标）、执行（落地计划）、反思（修正优化）的闭环能力，是区分真 Agent 与伪 Agent 的关键。其中，观察是前提，反思是实现“自愈”与信任建立的核心。 9. 上下文：视野决定上限 Agent 需突破“自我观察”局限，扩展至外部环境与多源信息，通过目标驱动的搜索与信息整合，为决策提供更全面的背景，减少错误率，提升用户信任度.

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《极客时间 VIP · 干货直播稿精选》

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论