18|动手实战:改造实战案例1
叶伟民
你好,我是叶伟民。
学习了模糊检索知识最基本的概念之后,这节课我们开始动手实战,改造前面的实战案例 1。目前实战案例 1 不支持模糊检索,也就是说用户只有输入公司全名,才能检索到该公司的相关数据。
等我们完成改造之后,用户在提问时即使没有输入公司全名,系统也能够模糊检索到相关数据。例如用户输入“广州神机妙算的款项到账了多少?”,系统将会检索到“广州神机妙算有限公司”的数据。
搭建向量编码服务
在改造之前,我们需要先打造一个基础设施,就是搭建向量编码服务。
看到这你可能有个疑问,为什么需要搭建向量编码服务,而不是直接在 MIS 系统里面进行向量编码呢?因为加载向量模型很耗时间和内存资源,将这部分代码单独拆分出一个服务更容易扩展和维护。
安装依赖
我们新建一个 Anaconda Prompt Powershell 激活实战案例 1 的虚拟环境。然后输入以下命令安装相关依赖。
需要注意的是,以上命令的第二行需要指定 LangChain 的版本,不然会导致配套代码跑不通。LangChain 改得太频繁了,这不是重点,重点是不向前兼容。这也是我诟病 LangChain,不选择 LangChain 作为这门课基础框架的原因。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. 搭建向量编码服务,实现模糊检索,使用户在提问时即使没有输入公司全名,系统也能够模糊检索到相关数据。 2. 建立向量编码服务的基础设施,进行向量编码和检索相关数据。 3. 对知识批量进行向量编码并存进数据库,实现对尚未编码的知识进行编码,并将结果存进数据库。 4. 对查询参数进行向量编码,对查询参数里的客户名称进行向量编码,以便进行相似度检索。 5. 根据查询参数的向量编码按相似度进行检索,通过计算余弦距离来检索与查询参数最相似的数据。 6. 未修改RAG流程,模糊检索知识与精确检索知识相比,本质上只是增强了检索知识的部分。 7. 没有将查询参数的向量编码保存进数据库,需要思考是否有必要将查询参数的向量编码保存进数据库,以及这么做的意义。 8. 建议回顾和巩固整个RAG流程,以便更好地理解和实践相关概念和代码。 9. 下节课将基于类似的概念和代码实现实战案例3:工单辅助系统,敬请期待。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《RAG 系统实战课 》,新⼈⾸单¥59
《RAG 系统实战课 》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论