22|RAG技术:如何利用RAG技术提升题目解答准确率?
邢云阳

你好,我是邢云阳。
在上节课的总结部分,我提到了“作业帮”发展了这么多年,它解答习题的准确率非常高,核心在于其背后有强大的题库作为支撑。
我们想单纯依靠一个视觉模型就想达到它的能力是不现实的。因此,这节课我会带你利用 RAG 技术,也搭建一个简单的题库,来模拟一下这个过程。这节课用到的文档和图片可以在我的 Github 上取到,地址是:Geek02/class22 at main · xingyunyang01/Geek02
RAG 原理
在上一章节我们浓缩简历时,其实曾经使用 LangChain + Qdrant 向量数据库实现过一个简单的 RAG,我们也简单探讨过 RAG 的原理,不知道你是否还有印象。
最近呢,我在微博上看到了这样一副画得很漂亮的图(图片来自 join.DailyDoseofDS.com),想借助这张图再带你梳理一下 RAG 原理。

传统 RAG
这张图分为两个部分,上半部分讲的是传统的 RAG。RAG 分为前置的数据导入工作和后续的用户检索提问两个环节。
图中的 1 和 2 两个步骤就是前置数据导入步骤。过程很简单。第一步是将数据,比如文档、图片等内容通过向量大模型(Embedding Model)转成向量,第二步是将向量存入到向量数据库中。不过我觉得这里其实少了一步,应该加一个第 0 步,将原始数据进行切片。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. RAG技术通过建立简单的题库来提升题目解答准确率的关键。 2. RAG技术的原理包括传统RAG和Agentic RAG两种方法,后者通过引入Agent来解决传统RAG存在的问题,提高回答问题的准确率。 3. RAG技术的实操阶段包括使用半开源产品进行部署,设置模型和进行数据清洗,以提高向量搜索的命中率。 4. 文档入库和数据清洗的重要性,以及利用DeepSeek-R1的能力进行数据清洗的方法和效果。 5. 创建知识库助手应用,设置问答所使用的大语言模型以及管理知识库。 6. 实际应用场景中,根据自己的数据量以及业务等具体因素,在做了命中测试后,再确定使用何种检索方式。 7. RAG过程成功,大模型具备举一反三的能力,通过一个例题解答了新的题目。 8. 文档入库需要根据业务场景做设计,规划好文档清洗和切片,以满足业务需要。 9. 学会根据不同业务场景配置知识库,比学会开发知识库还重要。 10. 在使用RAG做业务时,灵活调整文档格式以适应知识库的设计逻辑。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《DeepSeek 应用开发实战》,新⼈⾸单¥59
《DeepSeek 应用开发实战》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论