MIRAGE:并行图检索增强推理链扩展Test-Time推理

发布于 2025-8-29 06:55
浏览
0收藏

论文(MIRAGE: Scaling Test-Time Inference with Parallel Graph-Retrieval-Augmented Reasoning Chains)介绍了一个Test-Time(后面使用“测试时”来翻译)推理框架,将单一线性链替换为多个并行的、基于实体的医学知识图谱链。MIRAGE将查询分解为子问题,在锚点和桥接模式下运行自适应图检索,然后通过跨链验证来协调答案,相比线性ToT或以网络为中心的代理RAG,能获得更高的准确性和更清晰的来源追溯。基于图的检索在处理复杂数据的众多应用中都很有用


MIRAGE:并行图检索增强推理链扩展Test-Time推理-AI.x社区图片

新颖之处:在结构化知识图谱上进行并行多链推理,而不仅仅是更长的单链。两种检索模式:锚点(单实体邻域)和桥接(实体对之间的多跳路径)。合成器验证跨链一致性并在输出简洁最终答案前标准化医学术语。


MIRAGE:并行图检索增强推理链扩展Test-Time推理-AI.x社区图片

意义 :线性链会累积早期错误并将证据视为平面文本。基于图的检索保持关系和层次结构,支持精确的多跳医学推理和可追溯路径。

效果: 在三个医学问答基准测试中达到最先进水平。在ExplainCPE上,MIRAGE达到84.8%的准确率和最佳GPT-4o排名;在GenMedGPT-5k和CMCQA上也有类似提升。当替换为DeepSeek-R1-32B作为骨干模型时,鲁棒性依然保持。GenMedGPT-5k上的人类评估也更偏好MIRAGE。


MIRAGE:并行图检索增强推理链扩展Test-Time推理-AI.x社区图片

洞察: 更多子问题有帮助,直到过度分解增加噪音为止,而允许更多检索步骤显示出递减但稳定的收益。调整子问题上限和检索预算是关键。


MIRAGE:并行图检索增强推理链扩展Test-Time推理-AI.x社区图片

可解释性:每个声明都可以追溯到明确的知识图谱链,具有分解、查询和合成的审计记录。案例研究对比了MIRAGE的解耦链与单链网络搜索方法,朝着连贯诊断的方向解决问题。

本文转载自​​​​​​​​​AI帝国​​​​​​​​​,作者:无影寺

已于2025-8-29 07:00:19修改
收藏
回复
举报
回复
相关推荐