开源大模型再添猛将！昆仑万维Skywork-OR1系列震撼发布，推理能力比肩640B模型！原创

发布于 2025-4-16 07:05

浏览

0收藏

在人工智能技术日新月异的今天，昆仑万维再次以惊人的创新力震撼业界——全新升级的Skywork-OR1(Open Reasoner 1)系列中文推理大模型正式发布！这不仅是一次技术迭代，更是一场关于开源精神与AI普惠化的革命性突破。

1/20参数量，比肩640B顶级模型

Skywork-OR1系列最令人惊叹的，莫过于其"以小博大"的卓越性能。据官方数据显示，旗舰版本Skywork-OR1-32B虽然参数量仅为32B，却能在多项基准测试中与参数量高达640B的DeepSeek-R1打得有来有回。这意味着什么？意味着开发者们可以用1/20的计算成本，获得接近顶级商业模型的推理能力！

在专业测试中，Skywork-OR1-32B在美国数学邀请赛(AIME)和LiveCodeBench编程能力评测中表现尤为亮眼，成绩稳居同规模模型榜首。而专精数学领域的Skywork-OR1-Math-7B更是在AIME24与AIME25测试中分别取得了69.8%和52.3%的准确率，远超许多同类产品。

开源大模型再添猛将！昆仑万维Skywork-OR1系列震撼发布，推理能力比肩640B模型！-AI.x社区

全栈开源：从权重到数据集，彻底透明

昆仑万维此次的开源策略堪称"业界良心"——不同于许多前沿模型仅开放权重，Skywork-OR1系列实现了真正的全栈开源：

模型权重全面开放
训练数据集完整公开
全套训练代码无保留分享

所有资源均已上传至GitHub和Huggingface平台，配套的技术博客也在Notion平台同步发布，详细阐述了数据处理流程、训练方法和关键技术发现。这种"手把手教学"式的开源，让开发者不仅能直接使用模型，更能理解其内在机制，甚至进行二次开发！

三大模型，各有所长

此次发布的Skywork-OR1系列包含三款针对性极强的模型：

Skywork-OR1-Math-7B：数学专项"学霸"，在解决复杂数学问题上表现突出，同时具备不俗的代码能力
Skywork-OR1-7B-Preview：全能型选手，数学与代码能力兼备，适合多种应用场景
Skywork-OR1-32B-Preview：旗舰"大脑"，专为高复杂度任务设计，推理能力最为强悍

值得注意的是，7B和32B版本目前仍处于Preview阶段，官方表示将在两周内发布正式版本，并配套更为详尽的技术报告。

Model	AIME24 (Avg@32)	AIME25 (Avg@32)	LiveCodeBench (8/1/24-2/1/25) (Avg@4)
DeepSeek-R1-Distill-Qwen-7B	55.5	39.2	37.6
Light-R1-7B-DS	59.1	44.3	39.5
DeepSeek-R1-Distill-Qwen-32B	72.9	59.0	57.2
TinyR1-32B-Preview	78.1	65.3	61.6
QwQ-32B	79.5	65.3	61.6
DeepSeek-R1	79.8	70.0	65.9
Skywork-OR1-Math-7B	69.8	52.3	43.6
Skywork-OR1-7B-Preview	63.6	45.8	43.9
Skywork-OR1-32B-Preview	79.7	69.0	63.9

训练效率提升50%的秘诀

Skywork-OR1系列的性能飞跃，离不开昆仑万维在训练策略上的多项创新：

高质量数据集构建：团队精心筛选了11万道数学题目和13.7k条高质量代码问题，通过人类审阅+LLM自动判题双重机制确保数据质量
多阶段训练策略：采用GRPO(Group Relative Policy Optimization)等先进方法，动态剔除低质量样本，使训练效率提升50%
动态数据过滤：通过验证性、正确性和挑战性三重标准严格筛选训练数据

这些技术创新不仅缩短了训练时间，更显著提升了模型在复杂推理任务中的表现。