10|RAG:让大模型知道更多东西
郑晔

你好,我是郑晔!
上一讲,我们讲了如何实现一个自己的聊天机器人,通过调整提示词,你就可以打造出各种各样的聊天机器人,相信你一定和它聊得不亦乐乎。
但在度过了最初的快乐时光,你打算让你的聊天机器人和你聊一下有用的东西时,你就会发现,它知道东西并不像你想象得那么多。
虽然我们说大模型的特点之一是知识丰富,但这里的知识仅限于通用的知识,也就是网上能够很容易找到的知识。对于一些特定的知识,比如你所在业务领域的知识,它就一无所知了。个中缘由,不言而喻,大模型训练时,根本不可能拿到你们公司的数据。
如果我打算为自己的业务开发一个聊天机器人,也就是说,让聊天机器人知道我的业务,该怎么办呢?抛开训练一个属于自己的大模型这种成本高昂的办法,常见的解决方案有两种:
模型微调:使用业务信息对已经训练好的模型进行微调。
RAG:在上下文中带有业务信息,让大模型据此进行整合。
相比于模型微调,RAG 的方案成本要低一些,而且更加灵活,实现起来也更简单一些,所以,它也成为了现在解决这个问题的首选。这一讲,我们就来了解一下 RAG。
RAG
RAG 是 Retrieval-Augmented Generation 的缩写,也就是检索增强生成。这是什么意思呢?就是通过检索的方式,对要处理的内容进行增强之后再去生成。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. RAG 是 Retrieval-Augmented Generation 的缩写,通过检索的方式对内容进行增强后再进行生成,结合大模型应用和检索增强,使大模型了解特定领域的业务知识。 2. RAG 系统处理用户请求的流程包括用户发起请求、在相关资料中进行查询、获取相关内容、组成完整提示词发给大模型,将大模型的回复发给用户。 3. 使用向量进行文本内容的匹配,将问题转换为向量,计算向量之间的距离,找到与问题向量最接近的文档向量,实现“语义”的匹配。 4. 向量数据库是存储和查询高维向量的数据库,与传统数据库的匹配方式是语义上的接近,需要针对性的优化处理,如利用 CPU 缓存机制加速、采用高效的数据压缩技术等. 5. RAG 应用的主要流程包括索引、检索和生成。 6. RAG 技术依赖于将文本转换成向量,以实现语义上的匹配。 7. RAG 旨在让大模型了解更多的业务知识,解决大模型本身知识匮乏的问题。 8. RAG 技术的发展方向包括混合搜索概念、重排序模型以及基于知识图谱的 RAG。 9. RAG 应用的实现并不容易,但在一些技术框架支持下,上手编写一个 RAG 应用却不是什么难事。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的 AI 开发第一课》,新⼈⾸单¥59
《程序员的 AI 开发第一课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论