DeepSeek与Qwen组团开源了模型,冲!

发布于 2025-3-26 09:39
浏览
0收藏

几乎就在同一天,两个国内著名大模型厂商DeepSeek与阿里通义千问组团开源了模型:DeepSeek-V3-0324(更美观的网页和游戏前端),Qwen2.5-VL-32B-Instruct(以小博大):

Qwen2.5-vl-32B模型

  • 72B 对 VLM 来说太大?7B 不够强!那么可以使用32B 模型

DeepSeek与Qwen组团开源了模型,冲!-AI.x社区

  • 响应更符合人类偏好:调整输出样式以提供更详细、格式更好的答案,使其更符合人类偏好。
  • 数学推理:显著提高解决复杂数学问题的准确性。
  • 细粒度图像理解与推理:增强图像解析、内容识别、视觉逻辑推理等任务的准确性和细节分析。

DeepSeek与Qwen组团开源了模型,冲!-AI.x社区

DeepSeek与Qwen组团开源了模型,冲!-AI.x社区

Blog: https://qwenlm.github.io/blog/qwen2.5-vl-32b/
Qwen Chat: https://chat.qwen.ai
HF: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct
ModelScope: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct

DeepSeek-V3-0324模型

  • DeepSeek是在昨晚悄悄开源的新版本V3模型的,此次最大的亮点是编程能力,性能比肩Claude 3.7DeepSeek与Qwen组团开源了模型,冲!-AI.x社区
  • 前端 Web 开发,提高了代码的可执行性,更美观的网页和游戏前端

DeepSeek与Qwen组团开源了模型,冲!-AI.x社区

  • 汉语写作能力,与 DeepSeek-R1 写作风格保持一致中长篇写作质量更高
  • 函数调用,改进提高了函数调用的准确性,工具/MCP调用更加稳健

本文转载自​​PaperAgent​​,作者:PaperAgent


收藏
回复
举报
回复
相关推荐