10｜RAG：让大模型知道更多东西

郑晔

你好，我是郑晔！
上一讲，我们讲了如何实现一个自己的聊天机器人，通过调整提示词，你就可以打造出各种各样的聊天机器人，相信你一定和它聊得不亦乐乎。
但在度过了最初的快乐时光，你打算让你的聊天机器人和你聊一下有用的东西时，你就会发现，它知道东西并不像你想象得那么多。
虽然我们说大模型的特点之一是知识丰富，但这里的知识仅限于通用的知识，也就是网上能够很容易找到的知识。对于一些特定的知识，比如你所在业务领域的知识，它就一无所知了。个中缘由，不言而喻，大模型训练时，根本不可能拿到你们公司的数据。
如果我打算为自己的业务开发一个聊天机器人，也就是说，让聊天机器人知道我的业务，该怎么办呢？抛开训练一个属于自己的大模型这种成本高昂的办法，常见的解决方案有两种：
模型微调：使用业务信息对已经训练好的模型进行微调。
RAG：在上下文中带有业务信息，让大模型据此进行整合。
相比于模型微调，RAG 的方案成本要低一些，而且更加灵活，实现起来也更简单一些，所以，它也成为了现在解决这个问题的首选。这一讲，我们就来了解一下 RAG。
RAGRAG 是 Retrieval-Augmented Generation 的缩写，也就是检索增强生成。这是什么意思呢？就是通过检索的方式，对要处理的内容进行增强之后再去生成。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. RAG 是 Retrieval-Augmented Generation 的缩写，通过检索的方式对内容进行增强后再进行生成，结合大模型应用和检索增强，使大模型了解特定领域的业务知识。 2. RAG 系统处理用户请求的流程包括用户发起请求、在相关资料中进行查询、获取相关内容、组成完整提示词发给大模型，将大模型的回复发给用户。 3. 使用向量进行文本内容的匹配，将问题转换为向量，计算向量之间的距离，找到与问题向量最接近的文档向量，实现“语义”的匹配。 4. 向量数据库是存储和查询高维向量的数据库，与传统数据库的匹配方式是语义上的接近，需要针对性的优化处理，如利用 CPU 缓存机制加速、采用高效的数据压缩技术等. 5. RAG 应用的主要流程包括索引、检索和生成。 6. RAG 技术依赖于将文本转换成向量，以实现语义上的匹配。 7. RAG 旨在让大模型了解更多的业务知识，解决大模型本身知识匮乏的问题。 8. RAG 技术的发展方向包括混合搜索概念、重排序模型以及基于知识图谱的 RAG。 9. RAG 应用的实现并不容易，但在一些技术框架支持下，上手编写一个 RAG 应用却不是什么难事。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《程序员的 AI 开发第一课》，新⼈⾸单¥59

立即购买

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论