鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

GraphRAG优化新思路-开源的ROGRAG框架

大模型自然语言处理

发布于 2025-6-6 09:37

浏览

0收藏

目前的如微软开源的GraphRAG的工作流程都较为复杂，难以孤立地评估各个组件的贡献，传统的检索方法在处理复杂推理任务时可能不够有效，特别是在需要理解实体间关系或多跳知识的情况下。先说结论，看完后感觉这个框架性能上不会比GraphRAG高，仅在单一数据集上进行了评测，不过优化思路可以借鉴下，比如：双层次检索提高图检索准确性等。供参考。

方法

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

整体流程

图构建及索引

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

这一步主要是使用LLM构建知识图谱（KG），涉及预处理（多源异构内容转text）、文本chunk分割、KG构建（命名实体识别（NER）、分割的文本中提取<实体, 关系, 实体>三元组，以及相关的关键词、描述和权重。这些三元组用于构建图，捕捉语料中的复杂多跳依赖关系）、图存储。

图引导检索

这一步是ROGRAG的核心，分为两种主要方法：双层次方法和逻辑形式方法。

1、双层次方法

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

query被分解为两个组成部分：（1）表示实体的低层关键词和（2）高层关系描述。通过模糊匹配将实体与图中的节点匹配，关系关键词与边匹配。检索结果合并后，去除冗余的边、节点和块引用，精炼最终的检索上下文。优势是这种方法利用多粒度特征进行分层模糊匹配，提高了对不规范或复杂查询的检索覆盖率。

2、逻辑形式方法

使用预定义的操作符（如过滤、聚合）将自然语言查询转化为结构化的检索操作序列。利用LLM将自然语言查询转化为结构化的检索操作序列，并通过迭代优化来增强检索上下文。这种方法提供了更精确的检索结果，特别适用于需要结构化推理的任务。

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

逻辑形式方法算法过程：通过LLM将复杂的自然语言查询分解为一系列简单的子查询，然后使用预定义的操作符对这些子查询进行处理，最终得到结构化的检索操作序列。

图增强生成

这里和其他rag方法一致，主要优化输出。

实验性能

整体结果

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

GraphRAG优化新思路-开源的ROGRAG框架-AI.x社区

参考文献：

paper：ROGRAG: A Robustly Optimized GraphRAG Framework，https://arxiv.org/abs/2503.06474
code：https://github.com/tpoisonooo/ROGRAG

本文转载自大模型自然语言处理作者：余俊晖

标签

赞

收藏

回复

举报

回复

相关推荐

LiDAR仿真新思路 | LidarDM：助力4D世界生成，仿真杀器~

qbhua • 2907浏览 • 0回复
字节开源大模型量化新思路，2-bit量化模型精度齐平fp16

轻薄滴假象 • 3872浏览 • 0回复
Advanced RAG 07：在 RAG 系统中进行表格数据处理的新思路

Baihai_IDP • 6037浏览 • 0回复
一文汇总时序预测新思路——图学习视角解决时间序列预测问题

海因斯DK • 6147浏览 • 0回复
LLooM：大语言模型时代文本聚类新思路

大语言模型论文跟踪 • 4921浏览 • 0回复
又来一个RAG：RankRAG，英伟达RAG新思路

大语言模型论文跟踪 • 3139浏览 • 0回复
DSARE：当传统NLP遇到LLM后的关系提取新思路

大语言模型论文跟踪 • 3672浏览 • 0回复
混合模型：HybridLLM、RouterLLM 等优化 LLM 推理成本的新思路

amei2000go • 6390浏览 • 0回复
Unity开源新思路：图像条件结合指令提示

angel • 2412浏览 • 0回复
Unity开源新思路：图像条件结合指令提示

angel • 2495浏览 • 0回复
LLM 合并新思路：进化算法+零训练->新任务

amei2000go • 3463浏览 • 0回复
一文汇总：推荐系统中多任务学习的优化思路

海因斯DK • 2922浏览 • 0回复
HybGRAG：Hit@1 的平均相对提升率达到 51%的新思路

大语言模型论文跟踪 • 2526浏览 • 0回复
从经典到创新，揭秘扩散模型的6大王牌与5大创新思路

智驻未来 • 4621浏览 • 0回复
smolagents：Hugging Face 开源的Agent框架，用代码驱动 Agent 的新思路

Syrupup • 4944浏览 • 0回复
融合时频分析与深度学习的预测新思路

Tang_Lan • 3845浏览 • 0回复
开源：9个GraphRAG框架大一统

大语言模型论文跟踪 • 2986浏览 • 0回复
RAG分块优化之语义分块方法CrossFormer模型技术思路

大模型自然语言处理 • 2239浏览 • 0回复
新思路 | 效果绝佳的组合预测模型！

Tang_Lan • 773浏览 • 0回复

大模型自然语言处理

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

多模态视觉语言模型FILA-细粒度分辨率融合策略 6h前发布
八大LLM架构大比较总结：从DeepSeek-V3->qwen3->Kimi K2看LLM架构设计 1天前发布

热门推荐

RAG：7个检索增强生成技术的解析（含实现代码） 0回复

RAG+大模型怎么玩？这八个项目2025年最火！ 0回复

重磅！英伟达宣布H20芯片即将恢复对华销售，并计划推出全新GPU 0回复

2025年多智能体AI爆发，这五个开源框架太香了！ 0回复

文档太长模型“吃不下”？试试这15种Chunking策略，轻松搞定RAG！ 0回复

上一篇：改进社区检测和检索策略大幅提升GraphRAG性能新框架-ArchRAG

下一篇：什么时候用GraphRAG？RAG VS GraphRAG综合分析

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载