AI视频生成新突破!字节提出一致性视频生成方法Phantom:通过跨模态对齐生成主题一致的视频,超多应用场景
Phantom是一个统一的视频生成框架,适用于单主题和多主题参考,基于现有的文本转视频和图像转视频架构构建。它通过重新设计联合文本图像注入模型,利用文本图像视频三元组数据实现跨模态对齐。此外,它在人物生成中强调主题一致性,同时增强了身份保留视频生成。相关链接论文:https:arxiv.orgabs2502.11079代码:https:github.comPhantomvideoPhantom主页:https:phantomvideo.github.ioPhantomComfyUI:https:github.comkijaiC...