最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破! 原创

发布于 2025-8-8 07:44
浏览
0收藏

编辑 | 云昭

猜测着,猜测着,GPT-5总算发布了!

带着全球各种猜测、假说,OpenAI 掌舵人奥特曼、带着Mark Chen等一众新旧面孔准时现身直播间,揭晓了姗姗来迟的GPT-5。

奥特曼先秀了OpenAI推出ChatGPT之后的32个月取得的成绩,发布一周,用户突破一百万,而现在平均一周ChatGPT的活跃用户已经达到了7亿人。

随后直截了当开始带货GPT-5!

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

奥特曼称“这是企业和开发人员特别重要的时刻”,并视GPT-5是GPT-4以来的重大升级,也是我们迈向AGI的重要一步。

用奥特曼对GPT5的评价,四个词:有用、快速、智能、直观。

奥特曼还做了一个从GPT3到GPT5的比喻:

  • GPT-3有点像和一个高中生交谈,有一些闪光点,但烦恼也很多
  • 从GPT-4开始,人们开始从中获得一些价值,也许这就像和一个大学生交谈,真正的智慧,真正的效用。
  • 但是现在有了GPT-5,就像与专家交谈一样,一个合法的博士水平的专家,任何你需要的领域,都可以帮助你实现任何你的目标。它可以从头开始编写整个计算机程序,以帮助您处理任何你想要的内容。

“我们认为,软件随需应变的理念将成为GPT 5时代的决定性特征之一。”

“它可以帮助您计划聚会,发送邀请,订购物资。它可以帮助了解你的医疗保健,并在你的旅程中做出决定。它可以为你提供信息,以了解你想要的任何主题以及更多信息。”

您可以访问整个博士级别的专家团队,帮助您做任何您想做的事情,很快任何人都将能够比历史上任何人做更多的事情。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

那么相较GPT-4,GPT-5究竟厉害在哪里?在OpenAI官网博文中写道,GPT‑5 是一个统一的系统,包含:

  • 一个高效、响应迅速的基础模型,适用于大多数问题;
  • 一个更深层次的推理模型(GPT‑5 Thinking),用于处理复杂问题;
  • 一个实时路由器,根据对话类型、复杂度、工具使用需求和用户意图(如提示中包含“认真思考”)等因素,动态决定调用哪个模型。

这个系统的路由器会持续从真实用户行为中学习,例如用户在模型之间的切换、对响应的偏好评分和准确性数据等。达到使用上限后,系统会使用 mini 版模型处理剩余请求。未来,我们计划将所有能力整合到一个单一模型中。

接下来是熟悉研究官Mark Chen带着各位大牛出来详细介绍GPT的几大能力更新。

Mark首先放出了一个推理上面的大招:过去,大模型在提供更智能的响应之前会停下来思考。现在,推理是我们AGI计划的核心,它是我们用于运输ChatGPT代理和深度研究等技术的基础。

“当问题在于,到目前为止,我们的用户不得不在标准GPTs的快速响应和我的推理模型中缓慢、更深思熟虑的响应之间做出选择。但是GPT-5,它消除了这个选择。它旨在用最恰当的思考量来给你完美的答案。现在,像这样的事情需要很多艰苦的工作。大量的研究使GPT-5成为了OpenAI迄今为止推出的最强大/最快、最可靠、最稳健的推理模型。”

比如下面这两个测试场景:对比o3,GPT-5仅需要更少的token就能实现同等的准确率。

这也就意味着,统一精确率的要求下,token账单又可以省下一笔。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

而且,Mark 随之放出第二个大招:任何人都可以免费使用GPT-5。

首先登场的OpenAI主力“讲解员”,是后训练团队的主管Max和工程团队主管Renee。这两位负责讲解新模型的基准测试和模型堆栈方式。

在展示中,不管是,真实软件工程任务SWE-Bench Verified、多语言编程的Aider Polyglot,还是主打逻辑数学难题的基准MMMU和AIME 2025,都取得了新的高度。尤其是SWE-Bench Verified,通过Thinking模式,达到了74.9的成绩。

具体数据如下:

  • 数学:AIME 2025 达到 94.6%;
  • 编程:SWE-bench Verified 达到 74.9%、Aider Polyglot 达到 88%;
  • 多模态理解(图像、视频、图表):MMMU 达到 84.2%;
  • 医疗问答:HealthBench Hard 提升至 46.2%;
  • 推理能力(GPQA 复杂科学问答):GPT‑5 pro 提升至 88.4%。

此外,GPT‑5 比 OpenAI o3 更节省推理时间,且在多语言代码、图表解读、科学论文图注、空间推理等多个任务上表现优越。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

此外,在幻觉、响应错误率方面的基准任务上,GPT-5也罕见地创造史上新低。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

GPT5的发布策略

Renee则介绍了具体的发布策略。

有两个版本:GPT-5和GPT-5 Pro(最强变体版本,适合最复杂、最具挑战性的任务:)。

GPT5的发布策略:

  • 即日起向所有 Plus、Pro、Team 和 Free 用户开放;
  • 一周后向 Enterprise 和 Edu 开放;
  • Free 用户使用量有限,超出后会切换为 GPT‑5 mini;
  • Plus 用户可作为默认主力使用;
  • Pro 用户拥有无限使用及 GPT‑5 Pro 权限;
  • Team 和企业客户有充足配额和速率限制,适合组织级使用。

GPT‑5 Pro 版本的发布策略:

  • 在超过千项真实、经济价值高的推理任务中,专家 67.8% 的情况下更偏爱 GPT‑5 Pro;
  • 主要错误率降低 22%;
  • 在健康、科学、数学、编程等方面表现尤为出色。

如何使用 GPT‑5

GPT‑5 现在已成为 ChatGPT 的默认模型,取代 GPT‑4o、OpenAI o3、o4-mini、GPT‑4.1 和 GPT‑4.5。

你可以:

  • 直接输入问题,系统自动判断是否启用推理;
  • 使用“think hard about this”等提示强制调用推理模式;
  • 在 Pro/Plus 用户界面选择 GPT‑5 Thinking 或 GPT‑5 Pro。

多说一嘴,现在的版本,诸如使用Python画布进行搜索文件和图像上传数据分析,图像生成,内存,自定义指令等等操作,它们都可以在GPT-5上运行。

究竟GPT-5实际用起来如何?

今天凌晨,OpenAI官网同步也放出GPT-5的一些实际用例。让小编最为惊艳的则是GPT-5生成代码的速度和界面的美观度的确上升了不少。


最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

直播现场,则是有很多网页小游戏的编程实例,比如贪吃蛇、网站设计等等。这里不再赘述了,画面、色彩、流畅度、完成度确实不错。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

据介绍,GPT‑5 是迄今为止我们最强的编程模型,特别擅长:

  • 复杂前端开发;
  • 调试大型代码库;
  • 快速生成美观、响应灵敏的网页、App 和小游戏。

而更有早期的测试者指出,GPT‑5 在设计上更有审美感知,能自动处理排版、留白等细节

在直播中,举了一个“一句话让GPT-5创建一个移动的svg,并在画布中展示”的例子,2分钟的时间就做好了。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

另外一位OpenAI人员,则更加“调皮”:让GPT-5为此前的GPT-4o等一些列模型写一篇悼词,要求真诚、温暖、充满希望。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

虽然看起来不如SVG酷炫,但直播间的笑声一直没断。

据这位讲解人员介绍,GPT-5 是OpenAI迄今为止最强大的写作协作工具,能够帮助用户将粗略的想法转化为引人入胜、富有文学深度和韵律的文字作品。它能够更可靠地处理结构模糊的写作,例如持续不押韵的抑扬格五音步或流畅自然的自由诗,将对形式的尊重与清晰的表达相结合。

总之,不管是编程还是文笔创作,GPT-5的审美都双线飞升了。

第三个,需要大家注意的点是,GPT-5的语音对话能力更加流畅了,GPT-5的语速提升2倍的同时,流畅度没有受到任何影响,而且一致性也很好。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

大家可以体验一下。直播过程中GPT-5的韩语可以说快到完全收不住了。(中间的小哥直喊:康桑阿米达)

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

更可靠、更安全、更有边界感

最后,是安全方面。GPT‑5 在多项安全策略上迈出实质性一步:

  • 减少幻觉:比 GPT‑4o 降低约 45%,比 o3 降低约 80%;
  • 减少欺骗:如任务无法完成会明确表达限制,不再“假装完成”;
  • 更高的诚实性:更忠实地传达自己能与不能完成的任务;
  • 双用途问题处理更灵活:安全培训从“直接拒绝”升级为“安全补全”,在保证安全的前提下,尽量给予部分有用信息;
  • 减少迎合/拍马屁:GPT‑5 在专门测试中将谄媚率从 14.5% 降至 <6%。

个性化互动 & 可调节风格

GPT‑5 在可定制性方面也做了重大升级:

  • 更好地遵循自定义指令;
  • 提供四种预设互动风格(目前为文本,未来支持语音):

a.Cynic(冷幽默)

b.Robot(严谨专业)

c.Listener(共情倾听)

d.Nerd(技术宅)

这些风格都通过了内部对“避免过度迎合”的评测标准。

微软纳德拉:微软爱了

就在直播刚结束,微软CEO纳德拉就发推表示祝贺:GPT-5在微软几个平台上已经上线,这是迄今为止OpenAI最能干的模型,推理、编程、对话方面都取得了强有力的进展。

纳德拉非常看好大模型未来的发展,进步的节奏只会越来越快,我等不及去见证开发者、企业和消费者如何用最新的突破去创新。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

有关API方面

下半场,则是布雷特的主场。主要讲开发者相关的用例。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

这里挑重点,为大家介绍下内容,大家最关心的肯定是API的价格。小编为大家也整理好了:

  • GPT-5: $1.25/百万输入, $10/百万输出
  • GPT-5 Mini: $0.25/百万输入t, $2.00/百万输出
  • GPT-5 Nano: $0.05/百万输入,$0.40/百万输出

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图片

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区

具体的性能,提醒大家关注下上图的 MRCR 指标,根据自己任务的场景选择合适的即可。

写在最后:GPT-6 何时发布

好了,篇幅关系,就不再展开了。OpenAI官网上会放出技术报告来。大家记得研读一下。

其实这次的直播,放出来的信息量很大,还有很多,比如长文本、智能体方面还有很多细节。

但整体上看,多少都是在雕花吧,惊艳的地方跟多的是编程性能以及交互的界面的质感提升,其他方面印象深刻的不是很多。

只能说:更漂亮、更快、更聪明吧!

所以小编的心情,此刻也跟无数网友一样:wen GPT-6?

甚至让GPT-5 作诗一首:

《问天机》

何时六发?

众口喧哗。

春雷未动,

秋水无涯。

最强GPT-5终终终于来了,全球免费用!全方位暴涨至博士级水平,质量与响应速度取得质的突破!-AI.x社区图像

参考链接:​​https://openai.com/index/introducing-gpt-5/​

本文转载自51CTO技术栈,作者:云昭

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
已于2025-8-8 10:08:51修改
收藏
回复
举报
回复
相关推荐