跟月影学前端智能体开发
月影
波波熊科技联合创始人
3300 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 44 讲/共 48 讲
跟月影学前端智能体开发
15
15
1.0x
00:00/00:00
登录|注册

37|如何构建并使用RAG技术(一)

你好,我是月影。
我们课程更新到现在,大部分探讨的内容是大模型本身。而作为智能体来说,大模型推只是其中核心的环节,而不是全部。
这一点在我们前面课程中,大家也能体会到,比如波波熊学伴的智能体工作流,既包括主要的大模型推理,也包括了前置的资料搜索等环节,这些环节和大模型最终协同完成用户的任务。
今天我们就来系统聊一个在智能体中非常重要的环节,你可能在 AI 相关技术领域已经听到过这个概念,我们前面的课程也偶尔有提及,那就是 RAG,全称是 Retrieval-Augmented Generation,中文一般叫做检索增强生成,其实更准确的说法应该是生成式检索增强

实现 RAG 的几种可选方案

从原理上来讲,在不提供外部信息的情况下,大模型的推理只能基于自身训练的语料库,这些语料库构成大模型所具有的全部知识,那么对于最新发生的事情,大模型本身不知道,所以也就无法准确回答了。
我们要让大模型知道最近发生的事情,回答一些最新的东西,有几个办法。

使用搜索引擎

我们在前面的课程中,尝试过用 serpdev 这样的搜索引擎 SaaS 服务,也尝试过 Coze 智能体中的搜索工具,这些搜索引擎根据用户的内容搜索答案,将答案通过提示词提供给大模型作为参考,大模型就可以根据搜索结果里的内容进行回答。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. RAG技术是一种结合信息检索与语言生成的人工智能架构,通过向量数据库和检索实现语义搜索,而不是依赖传统的搜索引擎的关键词匹配。 2. RAG技术的应用场景包括构建AI智能员工服务机器人、企业内部的搜索服务以及AI Coding工具。 3. 在构建向量检索系统时,需要一个构建向量的embedding模型和一个存储向量数据的向量数据库。 4. 具体实现中,可以使用ollama的nomic-embed-text模型来构建向量,同时使用vectra作为向量数据库。 5. 通过实现SimpleRag类,可以实现基于文本内容创建数据,并进行大模型的使用.

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《跟月影学前端智能体开发》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部