RAG 快速开发实战
常扬
复旦 AI 博士,某知名 AI 公司产品研发总监
174 人已学习
立即订阅
RAG 快速开发实战
15
15
1.0x
00:00/00:00
登录|注册

02|从0到1快速搭建RAG应用

本门课程为精品小课,不标配音频
你好,我是常扬。
上节课我们详细探讨了 RAG(Retrieval-Augmented Generation, 检索增强生成)的技术背景、应用场景以及技术流程。这节课我们将进入代码实战,从 0 到 1 开始快速搭建 RAG 应用。我们会使用广泛流行的开源库搭建核心框架,完成 RAG 流程的代码构建。后续课程将基于这节课的实战项目,进一步深入分析各流程的核心技术细节及应用优化,提供更多技术选型的建议和实战代码。
这节课代码实战内容包括技术框架的介绍与选型、开发环境搭建与技术库安装、RAG 流程的代码实现。所有相关代码我都会公开在 Gitee 平台上,供你参考和使用。

技术框架与选型

我们先来探讨 RAG 技术的框架与选型问题。我们课程中的选型并非适用于所有场景的最佳方案,而是基于当前广泛应用和流行的技术模块。关于这些模块的具体特点以及可能的替代选型,我们会在后续课程中进行详细分析与解读。
RAG 技术框架:LangChain
LangChain 是专为开发基于大型语言模型(LLM)应用而设计的全面框架,其核心目标是简化开发者的构建流程,使其能够高效创建 LLM 驱动的应用。
索引流程 - 文档解析模块:pypdf
pypdf 是一个开源的 Python 库,专门用于处理 PDF 文档。pypdf 支持 PDF 文档的创建、读取、编辑和转换操作,能够有效提取和处理文本、图像及页面内容。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. RAG应用的快速搭建和技术框架选型 2. PDF文档的加载和预处理 3. 文本分割和嵌入向量转化 4. 基于余弦相似度的Faiss索引库存储 5. 用户查询的嵌入向量转化和相似文本块检索 6. Qwen大模型云端API的调用和生成响应内容 7. RAG过程的测试脚本执行 8. 代码中的模块库引入和大模型参数配置 9. 索引、检索和生成流程的实现细节 10. RAG流程中的技术选型和优化方向

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《RAG 快速开发实战》
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部
文章页面操作
MAC
windows
作用
esc
esc
退出沉浸式阅读
shift + f
f11
进入/退出沉浸式
command + ⬆️
home
滚动到页面顶部
command + ⬇️
end
滚动到页面底部
⬅️ (仅针对订阅)
⬅️ (仅针对订阅)
上一篇
➡️ (仅针对订阅)
➡️ (仅针对订阅)
下一篇
command + j
page up
向下滚动一屏
command + k
page down
向上滚动一屏
p
p
音频播放/暂停
j
j
向下滚动一点
k
k
向上滚动一点
空格
空格
向下滚动一屏
播放器操作
MAC
windows
作用
esc
esc
退出全屏
⬅️
⬅️
快退
➡️
➡️
快进
空格
空格
视频播放/暂停(视频全屏时生效)