聊一聊企业落地RAG过程中的痛点和难点
黄佳

分享嘉宾:黄佳,新加坡科研局资深研发工程师
00:00 / 00:00
1.0x
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
今天的分享,我主要聚焦三个问题:
第一,在 2025 年这个大模型技术爆发的一年,Agent、MCP、Manus 等智能体相关的话题显然更受关注,那为什么我们仍要花大力气学习 RAG?
第二,为什么现阶段我们还没能真正做好 RAG?背后的原因是什么?我会拆解这些问题,并串联起 RAG 的十大核心组件。
第三,在大模型发展的当下,RAG 作为一种新的开发范式,未来还会有哪些演变?
我们先来谈第一个问题,为什么我们仍要花大力气学习 RAG?
我相信很多同学对这个流程都不会陌生:当我们向大模型提问时,需要先提供相关的文档片段。具体怎么做?先对文件做嵌入(Embedding),再通过检索找到相关片段,最后交给大模型生成答案。流程看似简单,但细节非常多。

广义来说,凡是能有效实现信息检索的技术,都可以归为 RAG 技术。大模型时代让 RAG 发生了巨大变化——过去信息检索很难,现在有了嵌入模型,我们能把非结构化数据转化为向量,大模型就能快速定位所需信息,这是第一步。
第二步,拿到检索到的信息后,它会辅助生成模型输出更准确的答案,这就解决了大模型可能产生的“幻觉”问题。所以,只要涉及信息检索或知识库构建,相关技术栈都属于 RAG 的范畴。

在 AI 时代的应用开发中,常见模式有三类:检索(比如搜索文件)、生成(比如生成图片或文章)、行动(比如结合检索与生成,通过 Agent 完成特定任务)。在这些模式中,RAG 技术几乎都能在某个环节发挥作用,是一种广泛使用的基础技术。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. RAG技术在大模型时代的应用开发中发挥重要作用,能够有效实现信息检索,是一种广泛使用的基础技术。 2. RAG技术在企业中建设知识库方面具有重要意义,能够为业务人员提供直接的支持,解决业务问题,创造商业价值。 3. RAG技术的落地存在一些难点,需要深入学习和深刻认知RAG技术栈,以及构建性能评估的指标,才能做出真正有用的RAG系统。 4. RAG技术的难点可以通过拆解成清晰的组件,并逐一讲解来解决,需要业务人员对问题有清晰的定义,技术人员对RAG技术栈有深刻的认知,以及构建性能评估的指标。 5. RAG技术的评估环节至关重要,需要根据具体业务场景设计个性化指标,结合实践完善评估体系。 6. 高级RAG的典型范式与发展方向包括图谱增强RAG、基于上下文的检索、模块化RAG、自主化RAG和多模态RAG,这些模式对RAG技术的发展具有重要意义。 7. 落地RAG项目需要与业务人员共建评估体系,从业务问题出发定义需求,以及正确认知AI的定位,这些是项目成功的关键经验分享。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《极客时间 VIP · 干货直播稿精选》
《极客时间 VIP · 干货直播稿精选》
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论