比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答

PaperAgent

发布于 2025-8-28 07:25

浏览

0收藏

社区问答（CQA）平台（如 Stack Overflow、AskUbuntu）沉淀了大量高质量知识，但在工业界落地时仍面临三大挑战：

静态知识不足：仅靠官方文档难以覆盖真实业务场景的“坑”。
历史 QA 质量参差不齐：早期答案可能已被更好答案取代。
实时性 + 存储爆炸：新问题持续涌入，如何快速检索并控制存储增长？

现有方法要么只检索社区历史，要么只用静态文档，缺少“动态反思 + 高效存储”的机制。ComRAG 正是为了解决这些痛点而生。

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答-AI.x社区

ComRAG 框架概览

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答-AI.x社区

*图 1：ComRAG 实时社区问答（CQA）架构。系统整合了一个静态知识向量库和两个动态 CQA 向量库（高质量与低质量），后者通过基于质心的记忆机制进行管理。

核心思想一句话：“既要官方文档的权威，也要社区历史的经验，还要随时间动态遗忘低质量内容”。

技术拆解

1.1 静态知识向量库

用 embedding 模型把官方文档切成 chunk → 建索引 → 向量检索。
负责兜底：当社区没有相似 QA 时，由官方文档直接生成答案。

1.2 动态 CQA 向量库

为了处理“质量不一致 + 存储无限膨胀”两个问题，作者提出双库 + 质心记忆机制：

组件	作用	更新逻辑
High-Quality Store	存放高质量 QA（得分 ≥ γ）	用质心聚类 + 替换低分旧 QA
Low-Quality Store	存放低质量 QA（得分 < γ）	同样聚类，但仅作为“反面教材”提示 LLM 不要重蹈覆辙

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答-AI.x社区

图 4：利用质心聚类控制存储增长，ProCQA 上 10 轮迭代后 chunk 增长率从 20.23% 降到 2.06%

1.3 三路径查询策略

收到新问题 q 时，ComRAG 按相似度阈值 τ, δ 走三条路径之一：

直接复用：与高质量库中某 QA 几乎一样（sim ≥ δ），直接返回答案。
参考生成：与高质量 QA 有点相似（τ ≤ sim < δ），把相关 QA 作为上下文让 LLM 重写。
避坑生成：高质量库里没类似问题，则拿低质量 QA 做“负面例子”+ 官方文档，让 LLM 生成更可靠答案。

1.4 自适应温度

根据检索到的历史答案得分方差 Δ 动态调整 LLM temperature：

方差小 → 答案一致 → 提高温度增加多样性

方差大 → 答案分歧 → 降低温度保证可靠

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答-AI.x社区

实验验证

2.1 数据集与指标

数据集	领域	KB 片段数	初始 QA 对	测试问题
MSQA	Microsoft 技术	557 k	9 518	571
ProCQA	Lisp 编程	14 k	3 107	346
PolarDBQA	PolarDB 数据库	1.4 k	1 395	153

指标：

语义：BERT-Score F1、SIM（embedding 余弦相似度）
词汇：BLEU、ROUGE-L
效率：Avg Time（秒/问题）

2.2 主实验结果

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答-AI.x社区

表 1：三大数据集上 ComRAG 均显著优于所有基线

质量提升：SIM 提升 2.1 %–25.9 %
延迟降低：比次优方法快 8.7 %–23.3 %
可扩展性：10 轮迭代后延迟最多再降 52.5 %（ProCQA）

图 2：PolarDBQA 上移除任一模组都会显著降低 BERT-Score 或增加延迟

移除高质量库 → BERT-Score −2.6，延迟 +4.9 s
移除质心记忆 → BERT-Score −0.5，延迟 +2.2 s
移除自适应温度 → 直接可复用答案比例下降

关键结论 & 工业落地启示

维度	ComRAG 带来的收益
效果	语义相似度最高提升 25.9 %，显著优于 DPR/BM25/RAG
效率	延迟随时间递减，最多再降 52 %，适合高并发场景
存储	chunk 增长率被压制到 < 2.1 %，节省 90 % 存储
可插拔	LLM、embedding、打分器、向量库全部可替换

“ComRAG 的核心价值不在于模型本身，而在于用质心记忆机制把‘时间’和‘质量’显式建模进了检索-生成流程。”

https://arxiv.org/abs/2506.21098
ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question

本文转载自PaperAgent

标签

RAG

ComRAG

高效存储

已于2025-8-29 06:30:26修改

相关推荐

QOQA：利用TopK文档进行查询改写，平均提升RAG 1.6% 准确率

大语言模型论文跟踪 • 4512浏览 • 0回复
百度也来卷RAG了，Self-Reasoning比Self-RAG最高提升11.8%

PaperAgent • 3769浏览 • 0回复
Agentic RAG Golden-Retriever：显著提升企业知识库问答准确性、检索效率！

PaperAgent • 4205浏览 • 0回复
美国律师协会：ChatGPT等生成式AI，能帮助律师提升效率

Aceryt • 3866浏览 • 0回复
RAG开发新技术：利用语义相似度提升标签过滤质量

51CTO内容精选 • 3970浏览 • 0回复
RAG：如何通过实时数据提升AI准确性并减少“幻觉”

Halo咯咯 • 1.1w浏览 • 0回复
深度解析 REAcT Agent 的实现：利用 LlamaIndex 和 Gemini 提升智能代理工作流

Halo咯咯 • 9441浏览 • 0回复
R²AG:将检索信息融入RAG，提升问答系统准确性

大模型自然语言处理 • 3019浏览 • 0回复
RAG 应用效果不太理想？试试以下RAG优化策略大幅提升问答效果

AI博物院 • 1.1w浏览 • 0回复
ChunkRAG：比CRAG提升10个点准确率

大语言模型论文跟踪 • 3300浏览 • 0回复
聊聊 GPU 监控那些事：利用率 & 故障等

amei2000go • 1.1w浏览 • 0回复
MACT：如何用多Agent框架思路实现表格问答

大语言模型论文跟踪 • 3409浏览 • 0回复
MedRAG：利用知识图谱引导推理提升医疗Copilot的RAG能力 - 新加坡南洋理工等

知识图谱科技 • 6120浏览 • 0回复
如何利用AGI技术实现核聚变？

唐克 • 3034浏览 • 0回复
Graph RAG 迎来记忆革命：“海马体”机制如何提升准确率？

凝固的雨_1 • 4204浏览 • 0回复
EDC²-RAG：利用聚类和压缩技术提升RAG准确性

大语言模型论文跟踪 • 3006浏览 • 0回复
记忆机制、思维模式与跨领域推理

sbf_2000 • 2022浏览 • 0回复
用于实时工业社区问答的RAG新框架-ComRAG

大模型自然语言处理 • 1248浏览 • 0回复
突破AI记忆瓶颈！阿里通义实验室ReSum技术让大模型实现"无限思考"

柏企阅文 • 1526浏览 • 0回复

PaperAgent

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

比RAG提升27.4%，阿里等ComRAG利用“质心式”记忆机制实现实时社区问答

ComRAG 框架概览

技术拆解

1.1 静态知识向量库

1.2 动态 CQA 向量库

1.3 三路径查询策略

1.4 自适应温度

实验验证

2.1 数据集与指标

2.2 主实验结果

关键结论 & 工业落地启示

目录