37|如何构建并使用RAG技术(一)
月影

你好,我是月影。
我们课程更新到现在,大部分探讨的内容是大模型本身。而作为智能体来说,大模型推只是其中核心的环节,而不是全部。
这一点在我们前面课程中,大家也能体会到,比如波波熊学伴的智能体工作流,既包括主要的大模型推理,也包括了前置的资料搜索等环节,这些环节和大模型最终协同完成用户的任务。
今天我们就来系统聊一个在智能体中非常重要的环节,你可能在 AI 相关技术领域已经听到过这个概念,我们前面的课程也偶尔有提及,那就是 RAG,全称是 Retrieval-Augmented Generation,中文一般叫做检索增强生成,其实更准确的说法应该是生成式检索增强。
实现 RAG 的几种可选方案
从原理上来讲,在不提供外部信息的情况下,大模型的推理只能基于自身训练的语料库,这些语料库构成大模型所具有的全部知识,那么对于最新发生的事情,大模型本身不知道,所以也就无法准确回答了。
我们要让大模型知道最近发生的事情,回答一些最新的东西,有几个办法。
使用搜索引擎
我们在前面的课程中,尝试过用 serpdev 这样的搜索引擎 SaaS 服务,也尝试过 Coze 智能体中的搜索工具,这些搜索引擎根据用户的内容搜索答案,将答案通过提示词提供给大模型作为参考,大模型就可以根据搜索结果里的内容进行回答。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. RAG技术是一种结合信息检索与语言生成的人工智能架构,通过向量数据库和检索实现语义搜索,而不是依赖传统的搜索引擎的关键词匹配。 2. RAG技术的应用场景包括构建AI智能员工服务机器人、企业内部的搜索服务以及AI Coding工具。 3. 在构建向量检索系统时,需要一个构建向量的embedding模型和一个存储向量数据的向量数据库。 4. 具体实现中,可以使用ollama的nomic-embed-text模型来构建向量,同时使用vectra作为向量数据库。 5. 通过实现SimpleRag类,可以实现基于文本内容创建数据,并进行大模型的使用.
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《跟月影学前端智能体开发》,新⼈⾸单¥59
《跟月影学前端智能体开发》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论