鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent 原创

大模型自然语言处理

发布于 2025-7-29 10:00

浏览

0收藏

前面笔者介绍了《大模型在知识图谱问答上的核心算法详细思路及实践》，一般的Text2Sparql/Text2SQL技术路线图如下，目标是奖自然语言转话为可查询的SQL语句。

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

目前基于KG+LLM+Agent的KBQA方案，在多语言场景未得到充分探索。下面来看一个智能体框架-mKGQAgent，通过模拟人类推理过程将自然语言问题转化为SPARQL查询。

mKGQAgent架构

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

mKGQAgent 工作流演示（在线阶段）。在评估阶段，mKGQAgent 利用经验池中的实例来优化规划，通过上下文学习训练示例提升 SPARQL 查询生成意识，并借助反馈纠正潜在错误。离线阶段，则是为收集经验池所必需。评估或在线阶段——即 mKGQAgent 各组件及其集成模块的调度过程。

工作流程分为离线阶段和评估（在线）阶段，核心是模块化的子任务分解与协同，结合经验池（Experience Pool）和工具调用提升多语言场景下的性能。

1、离线阶段（Offline Phase）

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

离线阶段的核心是构建经验池（Experience Pool），为在线阶段的推理提供上下文学习的示例。该阶段通过一个简化版代理（SAgent）完成，包括以下步骤：

1.1 命名实体链接工具（Named Entity Linking, NEL Tool）

模拟人类查询知识图谱中资源标识符的行为，将自然语言中的实体和关系候选映射到知识图谱中的URI（统一资源标识符）。例如，将“Angela Merkel”链接到Wikidata的URI（Q567）。

复用现有NEL服务（如Wikidata的实体查询接口）和关系链接工具（如Falcon 2.0），而非提出新算法:

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

输入实体候选（E）和关系候选（R）；
调用NEL服务获取每个候选的URI；
返回链接后的实体和关系字典。

1.2 计划步骤（Plan Step）

将生成SPARQL查询的复杂任务分解为一系列子任务（如实体识别、关系链接、查询优化等），模拟人类分步解决问题的逻辑。

通过LLM生成分步计划：

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

输入自然语言问题（q_i）和系统提示（S_plan）；
LLM输出子任务列表（p_i），作为后续行动的指南。

1.3 无经验池的行动步骤（Action Step without Experience Pool）

按计划步骤顺序执行子任务，结合NEL工具完成实体链接，逐步生成SPARQL查询。

实现：

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

输入计划（p_i）、LLM、NEL工具和系统提示（S_action）；
依次执行每个子任务，必要时调用NEL工具；
保存对话历史（H_i），最终输出初步SPARQL查询（）。

1.4 经验池构建（Experience Pool Construction）

功能：存储的推理过程和结果（包括成功与失败案例），作为在线阶段的上下文学习示例。
实现：

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

1.对训练集中的问题（q_i），生成SPARQL查询并与真实查询（ LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区）对比，计算F1分数；

2.将问题向量、计划、对话历史、F1分数等元数据存入向量数据库；

3.经验池包含成功（F1=1.0）和失败（F1<1.0）的案例，支持后续相似问题的检索。

2、评估阶段（Evaluation Phase）

在线阶段基于离线构建的经验池，通过计划、行动和反馈的协同生成最终SPARQL查询。

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

2.1 带经验池的计划步骤（Plan Step with Experience Pool）

利用经验池中相似问题的成功计划优化当前计划，提升子任务分解的准确性。

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

1.将输入问题（q_i）转换为向量（v_qi）；

2.从经验池中检索Top-N个高F1分数的相似计划；

3.将这些计划融入系统提示（ LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区），引导LLM生成更优计划（p_i）。

2.2 带经验池的行动步骤（Action Step with Experience Pool）

结合经验池中相似问题的SPARQL示例，优化查询生成过程，同时支持反馈步骤的结果整合。

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

1.检索经验池中Top-N个相似SPARQL查询，融入行动阶段的系统提示（ LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区）；

2.按计划执行子任务，调用NEL工具，并可结合反馈结果调整查询。

3.2.3 反馈步骤（Feedback Step）

通过执行初步查询并分析知识图谱的返回结果，修正查询错误，模拟人类“试错-改进”的推理过程。

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

1.将初步生成的SPARQL查询（ LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区）在三元组存储中执行，获取返回结果（A_i）；

2.将结果填入反馈提示模板（ LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区），返回给行动步骤；

3.行动步骤根据反馈优化查询，输出最终结果（仅触发一次，避免无限循环）。

实验性能

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent-AI.x社区

参考文献：Text-to-SPARQL Goes Beyond English: Multilingual Question Answering Over Knowledge Graphs through Human-Inspired Reasoning，https://arxiv.org/pdf/2507.16971v1

本文转载自大模型自然语言处理作者：余俊晖

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2025-7-29 10:02:41修改

赞

收藏

回复

举报

回复

相关推荐

iText2KG：显著降低LLM构建知识图谱时的幻觉现象

大语言模型论文跟踪 • 3874浏览 • 0回复
《自然》期刊：上海交通大学与上海人工智能研究所联合推出医学多语言模型

xuxiangda • 4292浏览 • 0回复
一种将RAG、KG、VS、TF结合增强领域LLM性能的框架

PaperAgent • 3772浏览 • 0回复
图解LLM-Agent大模型智能体

ceesoft • 4180浏览 • 0回复
多语言提示技术：跨越语言障碍的AI应用

芝士AI吃鱼 • 4184浏览 • 0回复
Agent 智能体开发框架选型指南

Baihai_IDP • 5670浏览 • 0回复
Text2SQL 新一代解决方案Tool-SQL，基于LLM和Agent智能体实现，效果提升显著

AI博物院 • 7679浏览 • 0回复
探索 mcdse-2b-v1：全新高效的多语言文档检索模型

Halo咯咯 • 3177浏览 • 0回复
Agent 智能体开发框架如何优雅选型？

玄姐聊AGI • 3454浏览 • 0回复
DB-GPT-Hub:text2sql的微调框架及基准测试套件

大模型自然语言处理 • 3865浏览 • 0回复
颠覆性语音合成：Fish Agent v0.1 3B 引领多语言语音合成新高度

Halo咯咯 • 3777浏览 • 0回复
Meta AI 开源 Llama 3.3：全新 70B 多语言大语言模型 (LLM)

Halo咯咯 • 4331浏览 • 0回复
大规模情感分析：将NLP应用于多语言和特定领域的文本

51CTO内容精选 • 3086浏览 • 0回复
Pydantic AI智能体框架，轻松打造AI Agent

小虎哦哦 • 5472浏览 • 0回复
寻找乐子人｜ “多语言、精准定位”上海导游智能体搭建方案

Wordsworth_Jin • 3456浏览 • 2回复
2025年，AI Agent 智能体开发框架如何优雅选型？

玄姐聊AGI • 5182浏览 • 0回复
北交大清华等高校发布多语言大模型综述

angel • 3672浏览 • 0回复
LangGraph如何轻松搞定多语言模型协同工作

Halo咯咯 • 4505浏览 • 0回复
突破多语言视觉-语言模型的全球化之路

鲁班模锤1 • 908浏览 • 0回复

大模型自然语言处理

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

智能体主流框架深度研究报告：功能特性、用户群体、技术架构与商业化路径分析 0回复

一键搞定补帧+上色！神器ToonComposer让动画“动”起来、“靓”起来！效率飙升！ 1回复

2025年AI Builder 工具箱：20个开源神器让你效率飙升 0回复

迈向 Agent 时代的第一步！DeepSeek-V3.1 重磅发布，多维度升级超惊艳，开启智能推理新体验 0回复

刷爆AI圈！字节Waver 1.0，统一视频生成新里程碑！ 0回复

上一篇： GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路

下一篇：多阶段的多模态RAG幻觉缓解方案：智能眼镜等实时交互场景比赛方案-MM-RAG

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载