DeepSeekR1会推理,GPT4o会看。能否让1LLM既能看又能推理?DeepSeekR1取得很大成功,但它有个问题——无法处理图像输入。1.1DeepSeek模型发展自2024.12,DeepSeek已发布:DeepSeekV3(2024.12):视觉语言模型(VLM),支持图像和文本输入,类似GPT4oDeepSeekR1(2025.1):大规模推理模型(LRM),仅支持文本输入,但具备更强的推理能力,类似OpenAIo1我们已领略视觉语言模型(VLM)和大规模推理模型(LRM),下一个是谁?我们...