RAG 系统实战课
叶伟民
盛安德人工智能应用研究院总工程师,RAG 技术专家
1672 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 20 讲/共 26 讲
RAG 系统实战课
15
15
1.0x
00:00/00:00
登录|注册

18|动手实战:改造实战案例1

你好,我是叶伟民。
学习了模糊检索知识最基本的概念之后,这节课我们开始动手实战,改造前面的实战案例 1。目前实战案例 1 不支持模糊检索,也就是说用户只有输入公司全名,才能检索到该公司的相关数据。
等我们完成改造之后,用户在提问时即使没有输入公司全名,系统也能够模糊检索到相关数据。例如用户输入“广州神机妙算的款项到账了多少?”,系统将会检索到“广州神机妙算有限公司”的数据。

搭建向量编码服务

在改造之前,我们需要先打造一个基础设施,就是搭建向量编码服务。
看到这你可能有个疑问,为什么需要搭建向量编码服务,而不是直接在 MIS 系统里面进行向量编码呢?因为加载向量模型很耗时间和内存资源,将这部分代码单独拆分出一个服务更容易扩展和维护。

安装依赖

我们新建一个 Anaconda Prompt Powershell 激活实战案例 1 的虚拟环境。然后输入以下命令安装相关依赖。
pip install sentence_transformers
pip install langchain==0.0.306
pip install fastapi
pip install uvicorn
需要注意的是,以上命令的第二行需要指定 LangChain 的版本,不然会导致配套代码跑不通。LangChain 改得太频繁了,这不是重点,重点是不向前兼容。这也是我诟病 LangChain,不选择 LangChain 作为这门课基础框架的原因。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 搭建向量编码服务,实现模糊检索,使用户在提问时即使没有输入公司全名,系统也能够模糊检索到相关数据。 2. 建立向量编码服务的基础设施,进行向量编码和检索相关数据。 3. 对知识批量进行向量编码并存进数据库,实现对尚未编码的知识进行编码,并将结果存进数据库。 4. 对查询参数进行向量编码,对查询参数里的客户名称进行向量编码,以便进行相似度检索。 5. 根据查询参数的向量编码按相似度进行检索,通过计算余弦距离来检索与查询参数最相似的数据。 6. 未修改RAG流程,模糊检索知识与精确检索知识相比,本质上只是增强了检索知识的部分。 7. 没有将查询参数的向量编码保存进数据库,需要思考是否有必要将查询参数的向量编码保存进数据库,以及这么做的意义。 8. 建议回顾和巩固整个RAG流程,以便更好地理解和实践相关概念和代码。 9. 下节课将基于类似的概念和代码实现实战案例3:工单辅助系统,敬请期待。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《RAG 系统实战课 》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部
文章页面操作
MAC
windows
作用
esc
esc
退出沉浸式阅读
shift + f
f11
进入/退出沉浸式
command + ⬆️
home
滚动到页面顶部
command + ⬇️
end
滚动到页面底部
⬅️ (仅针对订阅)
⬅️ (仅针对订阅)
上一篇
➡️ (仅针对订阅)
➡️ (仅针对订阅)
下一篇
command + j
page up
向下滚动一屏
command + k
page down
向上滚动一屏
p
p
音频播放/暂停
j
j
向下滚动一点
k
k
向上滚动一点
空格
空格
向下滚动一屏
播放器操作
MAC
windows
作用
esc
esc
退出全屏
⬅️
⬅️
快退
➡️
➡️
快进
空格
空格
视频播放/暂停(视频全屏时生效)