可验证GUI数据集;智能体调用中的经济效率平衡;自我进化的GUI智能体,从经验学习;宽频谱人类图片偏好评估
VeriGUI:VerifiableLongChainGUIDataset20250806|🔺117http:arxiv.orgabs2508.04026v1https:huggingface.copapers2508.04026https:github.comVeriGUITeamVeriGUI研究背景与意义问题定义与现状概述当前自主GUI代理的研究已取得初步成果,主要聚焦于短期任务和基于结果的验证,难以满足现实中复杂、长链任务的需求。现有数据集多为短步骤操作,缺乏对多步骤、跨应用复杂流程的支持,且验证方式...