下一代 RAG 技术来了!微软正式开源GraphRAG:大模型行业将迎来新的升级?
Tina、可薇

编译 | Tina、可薇
这是增强大语言模型能力的一大进步,也是一种彻底改变企业私有数据分析的技术。
7 月 2 日,微软开源了 GraphRAG,一种基于图的检索增强生成 (RAG) 方法,可以对私有或以前未见过的数据集进行问答。在 GitHub 上推出后,该项目快速获得了 2700 颗 star!
通过 LLM 构建知识图谱结合图机器学习,GraphRAG 极大增强 LLM 在处理私有数据时的性能,同时具备连点成线的跨大型数据集的复杂语义问题推理能力。普通 RAG 技术在私有数据,如企业的专有研究、商业文档表现非常差,而 GraphRAG 则基于前置的知识图谱、社区分层和语义总结以及图机器学习技术可以大幅度提供此类场景的性能。
微软在其博客上介绍说,他们在大规模播客以及新闻数据集上进行了测试,在全面性、多样性、赋权性方面,结果显示 GraphRAG 都优于朴素 RAG(70~80% 获胜率)。
与我们传统的 RAG 不同,GraphRAG 方法可以归结为:利用大型语言模型 (LLMs) 从您的来源中提取知识图谱;将此图谱聚类成不同粒度级别的相关实体社区;对于 RAG 操作,遍历所有社区以创建“社区答案”,并进行缩减以创建最终答案。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. 微软开源了 GraphRAG,一种基于图的检索增强生成 (RAG) 方法,可以对私有或以前未见过的数据集进行问答。 2. GraphRAG 利用大型语言模型 (LLMs) 从数据源中提取知识图谱,聚类成不同粒度级别的相关实体社区,以提供对私有数据集的性能改进。 3. GraphRAG 在私有数据集中的测试结果显示优于朴素 RAG,具有更好的全面性、多样性、赋权性。 4. GraphRAG 方法通过 LLM 生成的知识图谱大幅改善了 RAG 的“检索”能力,提供更为优质的答案。 5. GraphRAG 能够处理需要汇总全部数据集信息才能得出答案的查询,对私有数据集也能进行预总结,提供更准确的结果。 6. GraphRAG 每次生成回答时都提供出处或源基础信息,以验证结果的事实性正确性和连贯一致性。 7. GraphRAG 方法在回应用户查询时,使用知识图谱结构对主题进行总结,展示了对数据集整体的推理能力。 8. GraphRAG 的应用将为数据调查开拓新的可能性,利用大语言模型没有见过的数据取得可对比的结果,从而提供新的探索能力。 9. GraphRAG 方法在私有数据集中展示了显著的改进,其智能或者说精通的程度远超先前应用私有数据集的其他方法。
该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论