程序员的 AI 开发第一课
郑晔
开源项目 Moco 作者
1340 人已学习
新⼈⾸单¥59
程序员的 AI 开发第一课
15
15
1.0x
00:00/00:00
登录|注册

10|RAG:让大模型知道更多东西

你好,我是郑晔!
上一讲,我们讲了如何实现一个自己的聊天机器人,通过调整提示词,你就可以打造出各种各样的聊天机器人,相信你一定和它聊得不亦乐乎。
但在度过了最初的快乐时光,你打算让你的聊天机器人和你聊一下有用的东西时,你就会发现,它知道东西并不像你想象得那么多。
虽然我们说大模型的特点之一是知识丰富,但这里的知识仅限于通用的知识,也就是网上能够很容易找到的知识。对于一些特定的知识,比如你所在业务领域的知识,它就一无所知了。个中缘由,不言而喻,大模型训练时,根本不可能拿到你们公司的数据。
如果我打算为自己的业务开发一个聊天机器人,也就是说,让聊天机器人知道我的业务,该怎么办呢?抛开训练一个属于自己的大模型这种成本高昂的办法,常见的解决方案有两种:
模型微调:使用业务信息对已经训练好的模型进行微调。
RAG:在上下文中带有业务信息,让大模型据此进行整合。
相比于模型微调,RAG 的方案成本要低一些,而且更加灵活,实现起来也更简单一些,所以,它也成为了现在解决这个问题的首选。这一讲,我们就来了解一下 RAG。

RAG

RAG 是 Retrieval-Augmented Generation 的缩写,也就是检索增强生成。这是什么意思呢?就是通过检索的方式,对要处理的内容进行增强之后再去生成。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. RAG 是 Retrieval-Augmented Generation 的缩写,通过检索的方式对内容进行增强后再进行生成,结合大模型应用和检索增强,使大模型了解特定领域的业务知识。 2. RAG 系统处理用户请求的流程包括用户发起请求、在相关资料中进行查询、获取相关内容、组成完整提示词发给大模型,将大模型的回复发给用户。 3. 使用向量进行文本内容的匹配,将问题转换为向量,计算向量之间的距离,找到与问题向量最接近的文档向量,实现“语义”的匹配。 4. 向量数据库是存储和查询高维向量的数据库,与传统数据库的匹配方式是语义上的接近,需要针对性的优化处理,如利用 CPU 缓存机制加速、采用高效的数据压缩技术等. 5. RAG 应用的主要流程包括索引、检索和生成。 6. RAG 技术依赖于将文本转换成向量,以实现语义上的匹配。 7. RAG 旨在让大模型了解更多的业务知识,解决大模型本身知识匮乏的问题。 8. RAG 技术的发展方向包括混合搜索概念、重排序模型以及基于知识图谱的 RAG。 9. RAG 应用的实现并不容易,但在一些技术框架支持下,上手编写一个 RAG 应用却不是什么难事。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《程序员的 AI 开发第一课》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部