鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析原创

大模型自然语言处理

发布于 2025-3-11 12:30

浏览

0收藏

PathRAG 也是一种新型 Graph-based RAG 方法，通过检索索引图中的关键关系路径，减少噪声并优化 LLM 提示。其核心创新在于基于流的剪枝算法和路径为基础的提示策略，特别适用于捕捉复杂数据集中的关系。（其实可以看做相比GraphRAG假如剪枝算法和路径提示策略，减少噪声并提升性能）

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

三种Graph-based RAG对比总结（PathRAG、GraphRAG、LightRAG）：

• PathRAG：通过从索引图中检索关键的关系路径来减少冗余信息。PathRAG使用基于流的剪枝算法来识别和提取最相关的路径，从而减少噪声并提高生成答案的质量。(专注于关系路径的检索，通过流式剪枝算法识别最可靠的关系路径，并将这些路径转换为文本形式用于提示生成模型。这种方法能够更好地捕捉节点之间的关系。)

• GraphRAG：通常通过社区检测算法对图进行分割，并从子社区中逐步聚合信息。这种方法可能会包含大量冗余信息，因为其使用了所有相关社区的信息。(主要依赖于社区检测和信息聚合，可能无法有效利用复杂的关系路径。)

• LightRAG：采用双阶段检索框架，从局部和全局级别检索相关信息。虽然这种方法提高了检索效率，但仍然可能包含不必要的信息。(虽然也使用图结构，但其检索过程更侧重于快速检索，可能没有深入探索关系路径的潜力。)

下面再来看看PathRAG的方法，供参考。

PathRAG方法

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

包含三个主要阶段。1）节点检索阶段：根据查询中的关键词，从索引图中检索相关节点；2）路径检索阶段：我们设计了一种基于流程的剪枝算法，提取每对检索节点之间的关键关系路径，然后检索可靠性得分最高的路径；3）答案生成阶段：检索到的路径按照可靠性得分升序排列放入提示中，最后输入到大型语言模型中进行答案生成。

PathRAG 的方法论分为三个阶段，具体如下：

节点检索

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

路径检索

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

答案生成

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

这种排序策略解决了“中间丢失”问题，确保 LLM 关注最相关信息（LLM使用 “GPT-4o-mini” 作为所有 LLM 组件，索引图与 GraphRAG相同。）。

实验结果

PathRAG：通过图剪枝的方法优化Graph-based RAG的性能方法浅析-AI.x社区

参考文献：PathRAG: Pruning Graph-based Retrieval Augmented Generation with Relational Paths，https://arXiv.org/abs/2502.14902)

code：https://github.com/BUPT-GAMMA/PathRAG

公众号大模型自然语言处理作者：余俊晖

原文链接：https://mp.weixin.qq.com/s/AuYQB-gofBpN7D_jS32efQ

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

赞

收藏

回复

举报

回复

相关推荐

检索感知微调（RAFT），提升领域RAG效果的新方法

Syrupup • 3423浏览 • 0回复
Nature：通过在仿真中学习的无实验外骨骼辅助方法

AIGC最前线 • 4132浏览 • 0回复
最新研究提出混合动态剪枝方法，升级Transformer推理效率

xuxiangda • 4562浏览 • 0回复
改进RAG管道检索文档质量的五种方法

51CTO内容精选 • 3098浏览 • 0回复
Class-RAG：通过RAG 提高内容审核性能

大语言模型论文跟踪 • 2891浏览 • 0回复
RAG 或 Fine Tume - 为您的用例选择正确方法的权威指南

sulu637 • 2577浏览 • 0回复
提升RAG性能的全攻略：优化检索增强生成系统的策略大揭秘

Halo咯咯 • 7207浏览 • 0回复
一个开源、清晰的本地 Graph RAG UI，支持Graph RAG 和 Hybrid RAG（支持Ollama）

AI博物院 • 7128浏览 • 0回复
NeurIPS 2024 | 全面提升文生图SOTA方法！ToMe:基于token合并的免训练文生图语义绑定

angel • 3612浏览 • 0回复
图数据库的剪枝在大型语言模型中的知识表示

51CTO内容精选 • 2229浏览 • 0回复
提升RAG性能：分块后，Chunk Enrichment的2个关键优化步骤不可错过

凝固的雨_1 • 3217浏览 • 0回复
WebWalker：通过Multi Agent提升RAG在开放域QA的性能

大语言模型论文跟踪 • 2408浏览 • 0回复
Salesforce 新方法让RAG效果飙升

大语言模型论文跟踪 • 2719浏览 • 0回复
allenai开源多模态的文档智能解析大模型（OLMOCR）方法、效果浅析

大模型自然语言处理 • 4562浏览 • 0回复
LLM合集：微软发布基于过程的自奖励方法显著提升数学推理性能

AIPaperDaily • 2092浏览 • 0回复
图RAG统一框架来了，12种RAG方法一网打尽！

NLP前沿1 • 3053浏览 • 0回复
RAG 模型的“灵魂伴侣”：如何挑选最适合的嵌入方法？

Halo咯咯 • 3326浏览 • 0回复
RAG分块优化之语义分块方法CrossFormer模型技术思路

大模型自然语言处理 • 2475浏览 • 0回复
Kimi-VL开源多模态大模型结构、训练方法、训练数据浅析

大模型自然语言处理 • 2250浏览 • 0回复

大模型自然语言处理

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

RAG：7个检索增强生成技术的解析（含实现代码） 0回复

国产视频大模型突破！阿里最新开源Wan2.2，单卡生成电影级画面 0回复

2025智能体大爆发！云计算驱动万亿级市场革命 0回复

2025 年国产大模型淘汰赛：DeepSeek、阿里、字节跳动、清华智谱谁将称王？ 0回复

六大智能体平台深度对比：从技术架构到行业落地，一篇讲透选型关键 0回复

上一篇： RAG常见13种分块策略大总结（一览表）

下一篇：多模态大模型Ovis核心技术点、训练方法、数据细节

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载