16|概念详解:使用向量数据库管理向量值
叶伟民
你好,我是叶伟民。
上一节课我们讲解了如何通过嵌入模型来获取知识的向量编码表示。
但是你可能有这样的疑惑——我们每次查询知识的时候,都必须调用嵌入模型来获取所有知识的向量编码表示吗?
显然是不合理的。一般来说,我们会在获取了向量编码表示之后,将它保存起来。这节课,我们就来解决这个问题。
保存向量编码的工具选择
能够保存向量编码的工具有很多。这里我仅列出我研究过的:
Faiss
Pinecone
Chroma
Milvus
LanceDB
PostgreSQL
研究过以上这么多工具之后,我依次在项目中应用过这三个向量编码保存工具。
FAISS
Milvus
PostgreSQL
在掉过 N 次坑之后,最终我选择安装了 pgvector 插件之后的 PostgreSQL,到今天(2024/10/09)为止,已经在实际项目中稳定运行 12 个月了,所以现在我才敢推荐给大家使用。为了和默认的 Postgres 区分开来,在这门课的后续内容中,我将把安装了 pgvector 插件之后的 PostgreSQL 简称为 pgvector。
PostgreSQL 和 pgvector
PostgreSQL 是与 MySQL 齐名的开源关系数据库。PostgreSQL 默认是不支持存储向量的。只有安装了 pgvector 插件之后,PostgreSQL 才能支持存储向量,才能变成向量数据库。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. 向量数据库管理工具的选择:介绍了Faiss、Pinecone、Chroma、Milvus、LanceDB和PostgreSQL等向量编码保存工具,并推荐了安装了pgvector插件的PostgreSQL作为向量数据库的选择。 2. 安装与运行pgvector:详细介绍了使用docker安装和运行pgvector的步骤。 3. 安装pgadmin:介绍了使用pgadmin作为图形化管理工具来管理pgvector的数据库。 4. 创建表:介绍了在pgadmin中创建表来存储向量编码数据的步骤。 5. 增删改查数据:详细介绍了使用SQL语句的方法来进行数据操作,包括插入、修改、删除和查询向量编码数据的步骤。 6. 使用pgvector管理向量编码数据的相似文本查询:介绍了下一节课要讲的内容,即如何根据指定文本找到最相似的文本。 7. 向量数据库的管理与关系数据库管理的相似性:指出使用pgvector来管理向量编码数据与使用关系数据库管理其他数据并没有太大不同,强调向量数据库并没有神秘之处。 8. 下一节课的内容预告:提到了下一节课将讲解如何根据指定文本找到最相似的文本,即相似文本查询的内容。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《RAG 系统实战课 》,新⼈⾸单¥59
《RAG 系统实战课 》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论