AI 大模型实战高手课
独行
前阿里巴巴高级技术专家,国内某大型互联网公司首席技术官
1421 人已学习
新⼈⾸单¥59
AI 大模型实战高手课
15
15
1.0x
00:00/00:00
登录|注册

06|RAG实战:基于ChatGLM3-6B+LangChain+Faiss搭建企业内部知识库

你好,我是独行。
上一节课,我们通过一个企业内部小助手的案例,学习了 6B 的微调过程。其中,除了微调,还有一种模式就是知识库,用来增强大模型信息检索的能力,我们称之为检索增强生成(RAG),这是目前非常流行的一种做法,知识库模式相比于微调有 2 个好处。
知识准确:先把知识进行向量化,存储到向量数据库里,使用的时候通过向量检索从向量库把知识检索出来,这样可以确保知识的准确性。
更新频率快:当你发现知识库里的知识不全的时候,可以随时补充,不需要像微调一样,重新跑微调任务、验证结果、重新部署等。
这节课我们就通过外挂向量库的方式,继续完善法律小助手案例。除了大模型 6B 外,你还需要了解 LangChain、向量化、向量库等组件及概念。ChatGLM3 官方提供了一个和 LangChain 结合的 demo:Langchain-Chatchat,还带有 UI 界面,我们可以直接拿过来使用。如果你理解了这个演示项目,那么智能体的原理也就学得差不多了,剩下的就是工程化的事情了。

Langchain-Chatchat 架构

Langchain-Chatchat 主要包含几个模块:大语言模型、Embedding 模型、分词器、向量数据库、Agent Tools、API、WebUI。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. RAG模式是一种流行的知识库模式,相比微调有两个好处:知识准确性和更新频率快。 2. Langchain-Chatchat架构包含大语言模型、Embedding模型、分词器、向量数据库、Agent Tools、API、WebUI。 3. 系统部署需要安装依赖、下载模型、参数配置和初始化向量库数据。 4. 知识管理包括知识库的上传、删除、更新操作,以及通过API进行知识库管理、对话及查看服务器信息等操作。 5. 工具使用包括开发配置,如天气查询、搜索引擎查询等,通过API调用第三方服务,扩大信息检索范围。 6. 文本向量在自然语言处理中,通过训练得到,常见的Word2Vec模型会生成几百维的向量,可用于相似度计算。 7. 向量数据库是专门用于存储和检索向量数据的数据库,适合处理词向量、图像特征向量等高维数据。 8. 向量数据库的应用可以扩展到企业内部数据或产品数据,通过API喂给大模型,为产品增加AI能力,提升产品竞争力。 9. 知识库模式可以用在相对固定的场景做推理,比如企业内部使用的员工小助手,包含考勤制度、薪酬制度、报销制度等。 These key points summarize the main concepts and applications of RAG mode, Langchain-Chatchat architecture, system deployment, knowledge management, tool usage, text vectors, and vector databases, as well as the application scenarios of knowledge base mode.

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 大模型实战高手课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • 泡泡龙
    老师,对于RAG是否可以这样理解,它是增加了大模型的知识储备,可以基于这些知识做出更准确和全面的回答。而要提高大模型的能力,例如逻辑推理能力,还是需要训练和微调来解决。

    作者回复: 没错,RAG可以理解为知识库外挂,这个知识库可以是任何信息来源,向量数据库,接口,mysql数据库等等都可以。提高大模型推理能力,需要通过各种训练任务,微调是一种。

    2024-06-14归属地:山西
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部