
迈向 Agent 时代的第一步!DeepSeek-V3.1 重磅发布,多维度升级超惊艳,开启智能推理新体验
2025年8月21日,DeepSeek-V3.1正式发布。它采用混合推理架构,一个模型支持思考与非思考两种模式。相比前代,DeepSeek-V3.1-Think 思考效率大幅提升,能更快作答。经Post-Training优化,其Agent能力增强,工具使用和智能体任务表现更出色。官方App与网页端同步升级,用户用“深度思考”按钮就能切换模式。DeepSeek API也同步更新,deepseek-chat和deepseek-reasoner对应不同模式,上下文扩至128K,还支持strict模式Function Calling。
DeepSeek-V3.1 介绍
DeepSeek-V3.1 的升级包含以下主要变化:
- 混合推理架构:一个模型同时支持思考模式与非思考模式;
- 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
- 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API 此次同步升级可谓诚意满满!在模式对应上,deepseek-chat 精准适配非思考模式,deepseek-reasoner 则完美对应思考模式,且二者上下文容量均大幅扩展至 128K,为复杂交互提供更广阔空间。更值得一提的是,API Beta 接口还创新性地支持了 strict 模式的 Function Calling,有力保障了输出的 Function 严格遵循 schema 定义。
另外,增加了对 Anthropic API 格式的支持,让大家可以轻松将 DeepSeek-V3.1 的能力接入 Claude Code 框架。
工具调用/智能体支持增强
编程智能体
在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
搜索智能体
DeepSeek-V3.1 在多项搜索评测指标方面均实现了显著提升。在涉及多步推理的复杂搜索测试场景(browsecomp)以及涵盖多学科专家级难题的测试项目(HLE)中,DeepSeek-V3.1 所展现出的性能表现,已大幅超越 R1-0528 版本。
思考效率提升
测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。
同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。
unsetunsetAPI & 模型开源unsetunset
V3.1的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。
Base 模型
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1
- 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
DeepSeek-V3.1 运用了 UE8M0 FP8 Scale 这种参数精度。而且,V3.1 对分词器和聊天模板(chat template)进行了比较大的改动,和 DeepSeek-V3 有明显不同
价格调整
2025 年 9 月 6 日凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行调整:
在 9 月 6 日前,所有 API 服务仍按原价格政策计费,可继续享受当前优惠。
相关链接
- 产品试用:https://chat.deepseek.com/
本文转载自AIGC Studio,作者:AIGC Studio
