37｜如何构建并使用RAG技术（一）

月影

你好，我是月影。
我们课程更新到现在，大部分探讨的内容是大模型本身。而作为智能体来说，大模型推只是其中核心的环节，而不是全部。
这一点在我们前面课程中，大家也能体会到，比如波波熊学伴的智能体工作流，既包括主要的大模型推理，也包括了前置的资料搜索等环节，这些环节和大模型最终协同完成用户的任务。
今天我们就来系统聊一个在智能体中非常重要的环节，你可能在 AI 相关技术领域已经听到过这个概念，我们前面的课程也偶尔有提及，那就是 RAG，全称是 Retrieval-Augmented Generation，中文一般叫做检索增强生成，其实更准确的说法应该是生成式检索增强。
实现 RAG 的几种可选方案从原理上来讲，在不提供外部信息的情况下，大模型的推理只能基于自身训练的语料库，这些语料库构成大模型所具有的全部知识，那么对于最新发生的事情，大模型本身不知道，所以也就无法准确回答了。
我们要让大模型知道最近发生的事情，回答一些最新的东西，有几个办法。
使用搜索引擎我们在前面的课程中，尝试过用 serpdev 这样的搜索引擎 SaaS 服务，也尝试过 Coze 智能体中的搜索工具，这些搜索引擎根据用户的内容搜索答案，将答案通过提示词提供给大模型作为参考，大模型就可以根据搜索结果里的内容进行回答。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. RAG技术是一种结合信息检索与语言生成的人工智能架构，通过向量数据库和检索实现语义搜索，而不是依赖传统的搜索引擎的关键词匹配。 2. RAG技术的应用场景包括构建AI智能员工服务机器人、企业内部的搜索服务以及AI Coding工具。 3. 在构建向量检索系统时，需要一个构建向量的embedding模型和一个存储向量数据的向量数据库。 4. 具体实现中，可以使用ollama的nomic-embed-text模型来构建向量，同时使用vectra作为向量数据库。 5. 通过实现SimpleRag类，可以实现基于文本内容创建数据，并进行大模型的使用.

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《跟月影学前端智能体开发》，新⼈⾸单¥59

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论