38|如何构建并使用RAG技术(二)
月影

你好,我是月影。
上一节课,我们实现了一个基于简单的向量数据库的检索器(Retriever),这是实现 RAG 的第一步。
接下来我们将通过实战,把文档内容通过 SimpleRAG 写入到向量数据库,然后通过大模型进行对话。这正是一个标准的构建和使用 RAG 的过程,我们用如下的流程图来表示。

实现项目数据的向量化
在过去,传统的技术里面,要把一个项目的文档提取出来进行向量化,本身也不是很困难,无非就是根据规则遍历文件夹,找到文件夹中的特定格式文件,比如 markdown 文档,然后将文档中的文本内容写入到向量数据库。
这么做肯定是可以的,但这么做不够灵活。
首先它必须按照规则存放文档,AI 也没法判断文档的重要性。其次,如果项目代码更新了,文档没有及时整理,那么 AI 也无法获得最新的内容。第三,现在的 VibeCoding 工具本身分析文件目录的能力比较强,完全可以将整个项目的关键内容提取出来,可能甚至不需要文档。
所以我们可以首先实现这样的一个功能——通过 Trae 或 Cursor 的 AI 智能体,将任意开发项目的数据向量化,存储到 vectra 向量数据库中。
通过 MCP Server 来构建向量数据
要实现这个功能,我们可以构建一个 MCP Server:
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. RAG Demo 是通过检索知识增强生成能力的实用工具,广泛应用于问答、文档处理、多语言支持等领域。 2. RAG Demo 的核心价值在于结合外部信息,提升回答的准确性与实用性。 3. 通过 RAG 技术,可以解决大模型回答问题不准确或出现幻觉的问题,对于特定知识的问题有着重要作用。 4. 通过 MCP 工具的指定参数,可以让 MCP 在其他项目中正确构建向量数据。 5. 在实际使用过程中,可以尝试改写提示词,增加更明确的指示和步骤,让大模型生成更详尽的内容。 6. 可以通过 MCP 工具让 AI Coding 的智能体通过读取项目信息后进行回答,这对 AI 运用项目生成代码很有帮助。 7. 通过 MCP 工具让智能体直接获取项目最新的第一手资料,解决了 AI 使用老版本 API 导致代码出 bug 的问题。 8. 可以尝试实现让 AI Coding 智能体通过查找依赖包内的 .vectra 了解最新 API 的功能,从而解决依赖库 API 版本更新导致的问题。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《跟月影学前端智能体开发》,新⼈⾸单¥59
《跟月影学前端智能体开发》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论