DeepSeek-VL2开源,VLM迈入MoE时代!
DeepSeekVL2:一个先进的大型混合专家(MoE)视觉语言模型系列,它显著改进了其前身DeepSeekVL。DeepSeekVL2在多种任务上展现出卓越的能力,包括视觉问题回答、光学字符识别、文档表格图表理解以及视觉定位。图片包括三个变体:DeepSeekVL2Tiny、DeepSeekVL2Small和DeepSeekVL2,分别拥有10亿、28亿和45亿激活参数。与现有的开源密集型和基于MoE的模型相比,DeepSeekVL2在相似或更少的激活参数下实现了竞争性或最先进的性能。...