多模态终极大一统!字节开源BAGEL爆火:图文生成理解双冠王,竟能预测未来画面?
社区头条
热门内容榜 • 最近上榜 论文链接:https:arxiv.orgpdf2505.14683项目链接:https:bagelai.org模型地址:https:huggingface.coByteDanceSeedBAGEL7BMoT亮点直击可扩展生成认知模型(ScalableGenerativeCognitiveModel,BAGEL),一个开源的多模态基础模型,具有7B活跃参数(总计14B),在大规模交错多模态数据上训练。BAGEL在标准多模态理解排行榜上超越了当前顶级的开源视觉语言模型(VLMs),并且在文本到图像质量方面,与领先的公开生成器如SD3和FLU...