400万样本,数据才是AIGC的王道!UltraEdit:基于指令的细粒度图像编辑数据集
一、概述UltraEdit是一种大规模的、自动生成的数据集,专门用于基于指令的图像编辑。该数据集包含了约400万个编辑样本,覆盖了750,000个独特的指令,涵盖了9种以上的编辑类型。UltraEdit的核心优势在于其利用大型语言模型(LLMs)的创造力和人类评估者提供的上下文编辑示例,提供了更广泛的编辑指令;其数据源基于真实图像,包括照片和艺术作品,这比仅由文本到图像模型生成的数据集提供了更大的多样性并减少了偏见;此外,它还...