熬夜看完OpenAI DevDay发布会,你想要的信息都在这了 原创

发布于 2025-10-9 06:45
浏览
0收藏

聊天框正成为AI时代的操作系统,而OpenAI希望成为新时代的微软。

OpenAI的开发者日,向世界展示了一张远比我们想象更为宏大的商业版图。

CEO山姆·奥特曼在主题演讲中分享了一组里程碑数据:ChatGPT周活跃用户已突破8亿,开发者数量从200万增长至400万,API每分钟处理60亿token。

这些数字背后,是OpenAI从一家AI模型公司向平台型企业的彻底转型

Apps SDK彻底改变人机交互

奥特曼在DevDay上明确表示:“别把ChatGPT当插件,这是一个‘应用入口’”。这一判断揭示了OpenAI的核心战略——将ChatGPT从单纯的聊天工具转变为AI应用的首选平台

Apps SDK是本次发布最受瞩目的功能,它让开发者能够在ChatGPT内部构建真正的交互式应用程序。

过这套SDK,开发者可以连接自己的数据、触发具体操作、并渲染出完全交互式的用户界面

现场演示展示了这一能力的革命性影响。

当用户为宠物狗业务进行头脑风暴时,可以直接“@”出Canva应用,后者会根据“色彩丰富、异想天开”的模糊要求,生成一系列精美的海报。

如果灵感迸发,用户甚至可以要求它将一张海报直接扩展成一份完整的商业计划书。

而当业务需要扩张时,ChatGPT会根据上下文建议用户考虑“匹兹堡”这个城市,并无缝唤起Zillow应用,帮助寻找合适的房源。

用户只需要在ChatGPT内提出新要求,就能让它筛选出“带院子的三居室”。

AgentKit大幅降低开发门槛

如果说Apps SDK是OpenAI构建的“入口”,那么AgentKit则是让这个入口能够真正干活的核心工具。

AgentKit是一套完整的智能体开发工具集,旨在解决企业级智能体开发“碎片化推进、高门槛入门”的困境。

它覆盖了AI智能体“构建、部署、优化、连接”的全生命周期。

AgentKit的核心包括三大组件:

  1. Agent Builder:通过可视化画布与拖拽式操作,让开发者无需复杂编码即可设计智能体的逻辑。
  2. ChatKit:简单易用的工具包,让开发者快速将聊天式智能体界面嵌入自有应用或网站。
  3. Connector Registry:企业级数据治理门户,为大型组织提供智能体与外部系统连接的统一管理平台。

产品经理Christina在现场展示了如何在8分钟内从零开始为DevDay官方网站构建并上线一个名为“Ask Froge”的智能问答AI。

她通过简单的拖拽操作,设计了工作流:一个分类器节点判断用户提问是关于“会议日程”还是“一般信息”,然后创建了两个专门的智能体节点处理不同类型的查询。

Codex重构开发流程:从写代码到说意图

除了前端的应用入口和中层的智能体开发,OpenAI还深入到底层的软件开发环节。

Codex正式结束研究预览,进入通用可用阶段。自8月初以来,Codex的日活跃使用量增长了10倍以上,处理了超过40万亿token。

Codex的能力已从代码生成扩展到完整的工作流参与

OpenAI开发者负责人Romain Huet在现场做了一个震撼演示:他需要让舞台摄像头被实时控制并联动现场灯光。

他在终端对Codex说:“你能制定一个控制Sony FR7摄像头的方案吗?”

Codex立即识别需求,自动查阅技术文档,用13分钟完成了完整的控制系统,包括协议实现、服务器搭建和接口连接。

接着,他继续让Codex连接无线控制器、构建灯光控制接口、集成语音功能。

最终,他用语音发出指令“把灯光照向观众”,现场灯光立即响应——整个过程没有手写一行代码。

模型更新:GPT-5 Pro API全面开放,Sora 2接入开发者

为支撑这一宏大的平台愿景,OpenAI同时升级了其底层模型能力。

GPT-5 Pro API已向所有开发者开放

该模型在处理高精度、深度推理复杂任务时表现更出色,特别是在金融、法律、医疗保健等行业。

其训练截止时间是2024年9月30日,拥有400k上下文窗口,最大支持272k token输出。

同时,OpenAI还发布了gpt-realtime-mini语音模型,成本比之前的版本降低了70%。

几天前刚刚上线的Sora 2,预览版API也正式向开发者开放,这意味着任何应用都可以直接集成OpenAI顶级的视频生成能力。


本文转载自​​AI 博物院​​ 作者:longyunfeigu

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐