极客时间 VIP · 干货直播稿精选
极客时间
讲师团队
292 人已学习
立即订阅
登录后,你可以任选4讲全文学习
课程目录
已更新 27 讲/共 58 讲
RAG 专项应用与实践 (2讲)
极客时间 VIP · 干货直播稿精选
15
15
1.0x
00:00/00:00
登录|注册

RAG十大组件剖析及MCP快速入门

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00
    分享嘉宾:黄佳,新加坡科研局资深研发工程师
    今天的分享,我们就先从 RAG 开始。在分享之前先请大家思考两个问题:
    第一,你觉得 RAG 系统中有哪些环节是值得优化的?因为这是出发点。简单的 RAG 系统非常容易搭建,但里面的细节太多了。
    第二,我们如何在日常工作和项目实践中真正去应用 RAG,用它来做什么?
    这是我在工作中经常遇到的两个重要问题。学新知识最重要的还是看它具体怎么用,RAG 如此,Agent 也是如此。当我们看到一个新组件或新技术出现时,要思考它能怎样应用到我们的实践和项目中去。如果听完今天的直播,大家对这两个问题有了更具体的思考,那我们的这一个小时就是值得的。
    还有一点我想告诉大家的是,一定要把大模型和 AI 技术运用到具体工作中去。在工作中,刚开始拿到一个项目时,我可能并不知道要用什么技术解决它,经过一番研究之后,我确定 RAG 是合适的技术,或者 Agent 是合适的技术,那之后就可以在项目中学以致用了。
    好,那现在开始进入正题。今天要讲的第一部分是 RAG 系统的十大组件。这十大组件都是优化 RAG 系统的方向,每一个组件都有优化的余地。
    整个大图就是我要把 RAG 系统拆解出来的十个大组件。如果你用手机看,这个图可能有点小。你可能需要从电脑上才能看清楚我是怎样设计这一系列流程的。
    我是从文档加载这里起步的,右下角是文档加载。文档加载这个组件的重点和难点是什么?是我们企业的文档有各种各样的类型,其中最复杂也最常见的就是 PDF。PDF 里面可能有图有表,我们怎么样把它解析出来,然后再导入到 RAG 系统里去?我们得先把图表解析出来,才能到进一步分块的问题。所以文档加载在 RAG 里是个大主题,是我们做 RAG 系统第一步就会面对的主题。这部分的难点在于复杂格式的解析。解析之后是不是要统一转化成某种形式?比如 Markdown。有一部分人在做 RAG 项目时喜欢把所有文件格式都转成 Markdown,这背后有它的逻辑:因为大模型很懂 Markdown,大模型基本上都是通过 Markdown 这种网页格式训练出来的,它输出的东西也很清楚,有要点、有标题、有细节文本,都非常清晰。
    说完文档加载,我们就过渡到第二个大环节:文本文档的分块。这部分比较简单,策略并不多,主要就是按字符、递归段落、语义分块等。
    第三个是嵌入:如何选择一个合适的嵌入模型做嵌入。嵌入的时候还有稀疏嵌入、密集嵌入,还可以做专有的嵌入,可以微调你的嵌入模型——如果你有大量数据准备的话。
    确认放弃笔记?
    放弃后所记笔记将不保留。
    新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
    批量公开的笔记不会为你同步至部落
    公开
    同步至部落
    取消
    完成
    0/2000
    荧光笔
    直线
    曲线
    笔记
    复制
    AI
    • 深入了解
    • 翻译
      • 英语
      • 中文简体
      • 法语
      • 德语
      • 日语
      • 韩语
      • 俄语
      • 西班牙语
    • 解释
    • 总结

    1. RAG系统的十大组件,包括文档加载、文本文档的分块、嵌入、索引、向量数据库、查询等,每个组件都有优化的余地。 2. 文档加载和文档分块是RAG系统的第一步,解析各种类型的企业文档并按字符、递归段落、语义分块等策略进行分块。 3. 嵌入环节需要选择合适的嵌入模型进行文本转化成向量的格式,为向量搜索做准备。 4. 索引环节强调数据结构和算法的设计,包括建立索引的父子文档关系、索引层次、以及多种索引的表示方式。 5. 向量数据库位于RAG系统的核心位置,内部包含各种优化算法,如FLAT、IVF倒排、量化、HNSW等。 6. 查询部分是解决问题的关键,需要对自然语言进行理解,构建Text-to-SQL等方法来解决结构化数据查询的问题。 7. Function Calling和MCP协议的存在,让大模型不需要自己写出完整的SQL,通过调用函数和传递参数来完成查询翻译构建。 8. MCP协议连接了大模型和RAG系统,通过客户端和服务器的交互,实现了自然语言查询转换成关系数据库能够理解的语言。 9. 检索后处理包括重排、压缩、校正等模块,以及生成环节,其中生成环节相对简单,因为现在大语言模型生成能力强。 10. MCP协议作为连接大模型的协议,简化了大模型应用开发人员的工作,使得调用外部工具更加方便。

    仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
    《极客时间 VIP · 干货直播稿精选》
    立即购买
    登录 后留言

    精选留言

    由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
    收起评论
    显示
    设置
    留言
    收藏
    沉浸
    阅读
    分享
    手机端
    快捷键
    回顶部