20|RAG 知识库(上):用 Claude Code 快速搞懂 RAG 和向量数据库
Robert

你好,我是 Robert。
从这一讲开始进入高级篇。
基础篇做完了 Hify 的核心链路,模型管理、Agent 配置、流式对话、前端界面。但你和智能客服聊几轮就会发现一个天花板:它的回答全靠模型自身的知识。你问“你们的退换货政策是什么”,它只能给一段泛泛的通用回答,引用不了公司真实的退换货条款。
这不是 Agent 配置的问题,也不是 Prompt 写得不够好,是因为模型根本不知道你的私有数据。
解决这个问题需要 RAG。在开始做之前,假设我们对 RAG 的了解仅限于“听说过这个词”。不过这一讲的核心不是 RAG 本身,而是:当你要给一个跑通的系统加入一个你完全不了解的技术能力,怎么做?
答案不是去读文档、去找教程,而是用你现在已有的工具 Claude Code,一步一步把陌生的东西变熟悉。这个方法论,以后遇到任何陌生技术都能复用。
先搞清楚要解决什么问题
碰到陌生技术,很多人的第一反应是去查“XXX 是什么”。这个问题太宽泛,答案往往是一大段定义,读完还是不知道和自己的场景有什么关系。
更好的方式是从业务痛点出发,用自己的场景问:
我的智能客服 Agent 现在只能靠模型的通用知识回答问题,无法引用公司的产品手册和政策文档。我听说 RAG 可以解决这个问题。帮我解释:RAG 的核心思路是什么?它是怎么让 LLM 能引用私有文档的?
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Claude Code 企业级全链路开发实战》,新⼈⾸单¥59
《Claude Code 企业级全链路开发实战》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论