开源大模型再添猛将!昆仑万维Skywork-OR1系列震撼发布,推理能力比肩640B模型! 原创

发布于 2025-4-16 07:05
浏览
0收藏

在人工智能技术日新月异的今天,昆仑万维再次以惊人的创新力震撼业界——全新升级的Skywork-OR1(Open Reasoner 1)系列中文推理大模型正式发布!这不仅是一次技术迭代,更是一场关于开源精神与AI普惠化的革命性突破。

1/20参数量,比肩640B顶级模型

Skywork-OR1系列最令人惊叹的,莫过于其"以小博大"的卓越性能。据官方数据显示,旗舰版本Skywork-OR1-32B虽然参数量仅为32B,却能在多项基准测试中与参数量高达640B的DeepSeek-R1打得有来有回。这意味着什么?意味着开发者们可以用1/20的计算成本,获得接近顶级商业模型的推理能力!

在专业测试中,Skywork-OR1-32B在美国数学邀请赛(AIME)和LiveCodeBench编程能力评测中表现尤为亮眼,成绩稳居同规模模型榜首。而专精数学领域的Skywork-OR1-Math-7B更是在AIME24与AIME25测试中分别取得了69.8%和52.3%的准确率,远超许多同类产品。

开源大模型再添猛将!昆仑万维Skywork-OR1系列震撼发布,推理能力比肩640B模型!-AI.x社区

开源大模型再添猛将!昆仑万维Skywork-OR1系列震撼发布,推理能力比肩640B模型!-AI.x社区

全栈开源:从权重到数据集,彻底透明

昆仑万维此次的开源策略堪称"业界良心"——不同于许多前沿模型仅开放权重,Skywork-OR1系列实现了真正的全栈开源:

  • 模型权重全面开放
  • 训练数据集完整公开
  • 全套训练代码无保留分享

所有资源均已上传至GitHub和Huggingface平台,配套的技术博客也在Notion平台同步发布,详细阐述了数据处理流程、训练方法和关键技术发现。这种"手把手教学"式的开源,让开发者不仅能直接使用模型,更能理解其内在机制,甚至进行二次开发!

三大模型,各有所长

此次发布的Skywork-OR1系列包含三款针对性极强的模型:

  • Skywork-OR1-Math-7B:数学专项"学霸",在解决复杂数学问题上表现突出,同时具备不俗的代码能力开源大模型再添猛将!昆仑万维Skywork-OR1系列震撼发布,推理能力比肩640B模型!-AI.x社区
  • Skywork-OR1-7B-Preview:全能型选手,数学与代码能力兼备,适合多种应用场景
  • Skywork-OR1-32B-Preview:旗舰"大脑",专为高复杂度任务设计,推理能力最为强悍

值得注意的是,7B和32B版本目前仍处于Preview阶段,官方表示将在两周内发布正式版本,并配套更为详尽的技术报告。

Model

AIME24 (Avg@32)

AIME25 (Avg@32)

LiveCodeBench (8/1/24-2/1/25) (Avg@4)

DeepSeek-R1-Distill-Qwen-7B

55.5

39.2

37.6

Light-R1-7B-DS

59.1

44.3

39.5

DeepSeek-R1-Distill-Qwen-32B

72.9

59.0

57.2

TinyR1-32B-Preview

78.1

65.3

61.6

QwQ-32B

79.5

65.3

61.6

DeepSeek-R1

79.8

70.0

65.9

Skywork-OR1-Math-7B

69.8

52.3

43.6

Skywork-OR1-7B-Preview

63.6

45.8

43.9

Skywork-OR1-32B-Preview

79.7

69.0

63.9

训练效率提升50%的秘诀

Skywork-OR1系列的性能飞跃,离不开昆仑万维在训练策略上的多项创新:

  • 高质量数据集构建:团队精心筛选了11万道数学题目和13.7k条高质量代码问题,通过人类审阅+LLM自动判题双重机制确保数据质量
  • 多阶段训练策略:采用GRPO(Group Relative Policy Optimization)等先进方法,动态剔除低质量样本,使训练效率提升50%
  • 动态数据过滤:通过验证性、正确性和挑战性三重标准严格筛选训练数据

这些技术创新不仅缩短了训练时间,更显著提升了模型在复杂推理任务中的表现。

免费商用

最令人振奋的是,Skywork-OR1系列不仅开源,还支持完全免费商用!这一举措将极大降低AI技术应用门槛,让中小企业和个人开发者也能用上顶级推理模型。

在AI技术日益成为核心竞争力的今天,昆仑万维用实际行动践行了"技术平权"的理念。正如一位开发者所言:"这不仅是模型的开放,更是机会的开放。"


本文转载自公众号AI 博物院 作者:longyunfeigu

原文链接:​​https://mp.weixin.qq.com/s/HWiNKhzlUV08BdEo9eXUxw​


©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
已于2025-4-16 10:22:22修改
收藏
回复
举报
回复
相关推荐