RAG 系统实战课
叶伟民
盛安德人工智能应用研究院总工程师,RAG 技术专家
1613 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已更新 18 讲/共 26 讲
RAG 系统实战课
15
15
1.0x
00:00/00:00
登录|注册

16|概念详解:使用向量数据库管理向量值

你好,我是叶伟民。
上一节课我们讲解了如何通过嵌入模型来获取知识的向量编码表示。
但是你可能有这样的疑惑——我们每次查询知识的时候,都必须调用嵌入模型来获取所有知识的向量编码表示吗?
显然是不合理的。一般来说,我们会在获取了向量编码表示之后,将它保存起来。这节课,我们就来解决这个问题。

保存向量编码的工具选择

能够保存向量编码的工具有很多。这里我仅列出我研究过的:
Faiss
Pinecone
Chroma
Milvus
LanceDB
PostgreSQL
研究过以上这么多工具之后,我依次在项目中应用过这三个向量编码保存工具。
FAISS
Milvus
PostgreSQL
在掉过 N 次坑之后,最终我选择安装了 pgvector 插件之后的 PostgreSQL,到今天(2024/10/09)为止,已经在实际项目中稳定运行 12 个月了,所以现在我才敢推荐给大家使用。为了和默认的 Postgres 区分开来,在这门课的后续内容中,我将把安装了 pgvector 插件之后的 PostgreSQL 简称为 pgvector

PostgreSQL 和 pgvector

PostgreSQL 是与 MySQL 齐名的开源关系数据库。PostgreSQL 默认是不支持存储向量的。只有安装了 pgvector 插件之后,PostgreSQL 才能支持存储向量,才能变成向量数据库。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. 向量数据库管理工具的选择:介绍了Faiss、Pinecone、Chroma、Milvus、LanceDB和PostgreSQL等向量编码保存工具,并推荐了安装了pgvector插件的PostgreSQL作为向量数据库的选择。 2. 安装与运行pgvector:详细介绍了使用docker安装和运行pgvector的步骤。 3. 安装pgadmin:介绍了使用pgadmin作为图形化管理工具来管理pgvector的数据库。 4. 创建表:介绍了在pgadmin中创建表来存储向量编码数据的步骤。 5. 增删改查数据:详细介绍了使用SQL语句的方法来进行数据操作,包括插入、修改、删除和查询向量编码数据的步骤。 6. 使用pgvector管理向量编码数据的相似文本查询:介绍了下一节课要讲的内容,即如何根据指定文本找到最相似的文本。 7. 向量数据库的管理与关系数据库管理的相似性:指出使用pgvector来管理向量编码数据与使用关系数据库管理其他数据并没有太大不同,强调向量数据库并没有神秘之处。 8. 下一节课的内容预告:提到了下一节课将讲解如何根据指定文本找到最相似的文本,即相似文本查询的内容。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《RAG 系统实战课 》
新⼈⾸单¥59
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部