DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉 原创

发布于 2025-4-3 07:34
浏览
0收藏

来自fans投稿,提出动态参数化RAG,即插即用无缝和RAG结合,减少RAG幻觉的发生,来看看具体思路。

检索增强生成(RAG)通过从外部源检索相关文档并将其合并到上下文中来增强大语言模型(LLMs)。虽然它通过提供事实文本提高了可靠性,但随着上下文长度的增长,显著增加了推理成本,并引入了具有挑战性的RAG幻觉问题,这主要是由于LLM中缺乏相应的参数知识造成的。

参数化RAG (PRAG)通过离线训练将文档嵌入大模型参数有效地降低推理成本。然而其高昂的训练和存储成本以及有限的泛化能力,极大地限制了其实际应用。

我们提出动态参数化RAG,在推理时将文档知识动态转化为模型参数知识,能有效补充相应知识。并且能即插即用无缝和RAG结合,提升模型知识内化水平同时减少RAG幻觉的发生

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

论文:Better wit than wealth: Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement

链接:https://arxiv.org/pdf/2503.23895

项目:https://github.com/Trae1ounG/DyPRAG

方法

检索增强生成(RAG)

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

参数化RAG(PRAG)

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

然而,PRAG的训练成本较高,且难以适应新文档。因此,我们提出动态参数化RAG(DyPRAG),实现更高效的参数注入。

动态参数化RAG(DyPRAG)

DyPRAG的核心思路在于训练一个轻量的参数转换器来建模从文档->参数的潜在映射,仅需要少量的训练数据就能有效学习到泛化性极强的转换器,在推理时几乎不会引入额外的计算开销且能提升模型性能,最少只需要2MB存储开销

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

DyPRAG对比RAG和PRAG

1. 文档-参数对收集(离线)

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

2. 训练动态参数翻译器(离线)

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

MLP超网络工作流程

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

3. 高效推理(在线)

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

DyPRAG整体框架图

实验

分布内QA实验

在多个问答数据集上训练参数转换器并进行实验,DyPRAG表现出极优的性能:

  • DyPRAG能有效注入参数知识:对比RAG,在没有提供任何文档拼接到上下文的情况下,DyPRAG表现出明显优于RAG的性能同时减少了推理开销。
  • 上下文知识+动态生成参数知识有效促进知识融合:DyPRAG-Combine将文档加入上下文结合动态生成参数知识,在所有情况下取得最好效果,有效促进了模型知识和上下文知识的融合。

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

分布内主实验

分布外QA实验

DyPRAG能有效转换分布外的文档到参数知识,在补充参数知识后始终可以作为相比RAG更强更鲁棒的基线。

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

分布外数据集实现

为什么DyPRAG能减少RAG幻觉?

  • RAG幻觉(或叫知识冲突)经常由于模型内部知识和外部提供上下文知识发生冲突导致发生。可能模型包含正确的参数知识结合上下文知识报错,也可能上下文知识正确模型包含错误参数知识导致模型回答错误。
  • DyPRAG首先动态将检索文档转换为模型参数知识,提前让模型“做足了功课”,在遇到相对应的上下文内容时就能极大程度避免知识冲突发生,这也是DyPRAG-Combine性能提升的直接来源,极低的开销使得DyPRAG有希望成为RAG幻觉的有效解决方式。

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

RAG幻觉示例分析

知识内化实验

基于RAGTruth幻觉数据集衡量DyPRAG-Combine对知识的内化程度(使用GPT-4o打分)。

RAGTruth中的文档来源和训练时完全不同并且大模型训练时完全没有见过——DyPRAG能有效将没有见过知识进行内化,内化程度显著优于RAG方法。

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

RAGTruth数据集验证

计算/存储开销

通过详细的时间复杂度计算和实际运行时间对比,我们提出的DyPRAG能有效提升模型性能,同时减少RAG带来的高推理开销以及PRAG带来的极高训练和存储开销(仅1%),更证明方法即插即用提升性能的高可用性!

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

实际存储和训练开销

DyPRAG:即插即用动态将上下文转化为参数知识,有效缓解RAG幻觉-AI.x社区

理论分析推理、存储、训练开销

结论

  • 我们提出动态参数化RAG (Dynamic Parametric RAG),一个轻量级框架可以以即插即用的方式以最小的成本有效地将文档转换为参数
  • 我们提出了一个强大而实用的RAG范式:有效地将上下文知识与测试时动态生成的参数知识结合起来,实现更强大的知识融合
  • 实验结果表明,DyPRAG具有极优的泛化能力,能够有效地注入参数并无缝地融合上下文知识,在减少RAG幻觉的同时提高了模型性能


公众号大模型自然语言处理  作者:余俊晖

原文链接:​​https://mp.weixin.qq.com/s/d_WS0S3KT4XjbJHBoOFYFA​

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
标签
已于2025-4-3 07:34:15修改
收藏
回复
举报
回复
相关推荐