开放指令编辑效果爆表!小米开源Lego-Edit登顶SOTA:用强化学习教MLLM“举一反三”!
论文链接:https:arxiv.orgpdf2509.12883Git链接:https:github.comxiaomiresearchlegoedit图1编辑效果展示亮点直击LegoEdit,这是一种基于指令的图像编辑框架,利用经过强化学习微调的MLLMagent来协调模型级编辑工具,以执行灵活的现实世界指令。引入了一种三阶段渐进式强化学习训练策略,利用无标签数据提供反馈,显著增强了MLLM的推理和工具组合能力。大量实验表明,LegoEdit在GEditBench和ImgBench上达到了SOTA性能。该框架...