DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了 精华

发布于 2025-6-4 06:31
浏览
0收藏

Hi,这里是Aitrainee,欢迎阅读本期新文章。

DeepSeek 团队悄无声息地放出了他们推理模型的新升级版:DeepSeek R1。

更准确地说,是 DeepSeek R1-0528

这新模型是今天凌晨在 Hugging Face 上出现的,连个正经官宣都没有,直接 MIT 协议开源。

Hugging Face 页面上,社区已经开始帮忙补 Readme、提调整了,官方的博客估计也快了。

项目地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

但从初步的反馈看,这模型挺猛,比原来的 DeepSeek 在长期推理、智能程度和真实世界应用方面都有提升。

更详细的,扒扒它的配置,大概是这么回事:

  • 还是基于他们DeepSeek-V3-0324模型。
  • 核心还是那个“思维链 (Chain of Thought)”推理,一步步展示逻辑过程,比较透明。
  • 主攻方向没变:数学问题、编程挑战、科学研究。
  • 架构进化了,但没大改:还是混合专家 (MoE) 设计,671B 总参数,每次只激活 37B,效率高。
  • 训练方法有改进:用了大规模强化学习 + 冷启动数据,解决了之前 R1 模型的一些毛病,比如无限重复、可读性差。

从社区曝出的LiveCodeBench基准测试成绩来看

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

新的 Deepseek R1-0528 的性能几乎与 LiveCodeBench 基准测试中的 o3 (High) 相当。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

有网友做了一个精简版的总结,说它:

能像谷歌模型一样深度推理。

文本生成优化了,更自然,格式更好。

推理风格独特:不求快,但更严谨周密。

支持长时间思考:单任务处理时长能达到 30-60 分钟。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

上手实测:

官方说这新模型能在复杂问题上花更长时间思考。

我们来直接上Prompt

第一个测试提示词如下:

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

效果:

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区


DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

挺不错的。

提供一组简单的数据(例如,过去一周每天的AI工具使用时长),要求模型用D3.js或Chart.js生成一个交互式的柱状图或折线图,鼠标悬停时显示具体数值,并带有简单的动画效果和自定义颜色方案。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

这个一步到位,效果很不错。

下面90年代早期个人主页:

我想用 HTML 和 CSS 创建一个具有“90年代早期个人主页”风格的“访客留言板”区域的静态模拟。


风格要求:

背景颜色可以考虑使用亮色或带有简单图案的平铺背景(如果能用 CSS 实现)。

字体选择:使用像素字体或类似 Comic Sans, Times New Roman 的复古字体。

边框:元素边框可以使用明显的 3D 浮雕效果 (inset/outset) 或简单的粗线条。

颜色:可以使用饱和度较高的、略显“刺眼”的颜色组合。

包含元素:一个标题 "Guestbook!",一个“提交留言”按钮。这些都是静态展示,不需要真实功能。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

请用 HTML, CSS, 和 JavaScript 实现一个简单的图片轮播/幻灯片组件。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

 鲁迅文笔仿写:

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区


根据部分信息进行推断和补全 (故事补全):

这是一个故事的开头:
“侦探哈里森站在空荡荡的画廊中央,价值连城的钻石项链‘深海之星’不翼而飞。唯一的线索是地板上散落的几片奇异的蓝色羽毛,以及一个被强行撬开的保险柜,旁边放着一杯还冒着热气的红茶……”
请你根据这个开头,继续把这个故事写下去,尝试推断窃贼可能的作案手法、身份特征,并最终揭开谜底。
故事需要包含悬念、推理过程和合理的结局。字数在 800-1200 字左右。
请注意细节的逻辑性和一致性。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

网友:这是唯一一个能持续正确做对「9.9 - 9.11是多少」的模型。

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

与Claude4对比:不管是光线照射在墙上形成的漫反射,还是球在撞击后的运动方向,R1胜:

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了-AI.x社区

怎么用上这新模型?

可以通过 DeepSeek 官方 API,或者去 OpenRouter 搞个免费 API (也有付费版,没速率限制)。

本文转载自​​​​AI进修生​​​​,作者:Aitrainee

收藏
回复
举报
回复
相关推荐