
OpenAI版小程序诞生!奥特曼深夜五连发!ChatGPT可内置应用,Codex超强更新,AI构建者时代已至 原创
编辑 | 云昭
一不留神,OpenAI 正式直接将ChatGPT聊天变成了各大app的平台入口了。
就在 5 个小时前,OpenAI 再次更新了超级AI原生应用的定义!!!
刚进入10月,OpenAI接连甩出了5连炸。Sora2只是开胃菜!就在昨天凌晨2点,大洋彼岸的旧金山再次被OpenAI点燃了!
Sam Altman 带领着OpenAI终于实现了惊艳一跳:AI时代,超级AI原生应用已经从聊天进化成了内置应用入口平台了!
“我们希望今天能给你一些新的灵感,去创造属于你的作品。我们希望 OpenAI 能成为这个全新创造时代的理想平台。”
OpenAI DevDay上,50分钟左右的keynote,掌声接连不断。看得出来这次开发者对于OpenAI的发布是真的太喜欢了!
可以说,时隔两年,这是最亲民的一次发布。奥特曼特别挑明了这次DevDay的主题:“让AI构建变得更容易”。
今天,我们要聚焦一件对你们最重要的事:让 AI 构建变得更容易。我们一直在倾听开发者的声音——了解你们遇到的瓶颈,以及下一步想构建什么。
小编特地一早为大家整理了会上的发布内容。这次发布有四项精彩的主题:
首先,OpenAI展示了开发者已经可以在 ChatGPT 里直接构建应用,同时可以帮助更高效地触达用户。其次,如何更快、更好地创建智能体(Agents)。第三,如何让写代码变得更轻松——让 AI 处理那些重复性工作,从而让你专注于系统和创造力。第四,OpenAI带来了新的模型和 API 的更新。
这是有史以来最适合当“构建者”的时代!奥特曼用加速度来形容这场发布——“从想法到产品,从未如此快速。你能真切地感受到这种加速度。”
ChatGPT中直接构建App:应用直接装在Chat中
OpenAI 宣布推出一种全新的方式,让开发者可以在 ChatGPT 内直接构建应用程序。
从周一开始,ChatGPT 用户将能在聊天界面中访问来自 Booking.com、Expedia、Spotify、Figma、Coursera、Zillow 和 Canva 等公司的交互式应用。
同时,OpenAI 也发布了 Apps SDK 的预览版——这是一套供开发者使用的工具包,用于创建这些应用。
据悉,开发者今天就可以开始使用了。
通过这个 SDK,你可以获得完整的技术栈,连接数据、触发操作、渲染交互式 UI 等。
Apps SDK 构建在 MCP 之上,你对后端逻辑和前端界面都有完全控制权。我们也发布了该标准,任何人都可以集成。当你使用 Apps SDK 构建时,你的应用可以触达数亿 ChatGPT 用户——这将极大改变开发者产品的快速扩张方式。
至于推出的理由,奥特曼这样描述这个新发布:“我们希望 ChatGPT 成为一个帮助人们更好地前进的平台——让他们更高效、更有创造力、更快地学习,更好地完成自己想做的事情。嵌入 ChatGPT 的应用程序,将让新一代的应用变得更加交互、适应性更强、更加个性化,而且用户可以直接通过聊天与它们交互。”
但不难想象,这套新系统是 OpenAI 最新一次试图在其旗舰 AI 产品 ChatGPT 周围构建“应用生态”的努力。
此前,OpenAI 曾通过 GPT Store 让开发者制作交互式应用(当然最后市场的反应似乎并不是很成功)。但与那种独立的应用商店不同,这次推出的“内嵌应用”直接整合进 ChatGPT 的回答中,让用户在日常对话时即可调用第三方工具。这样既为开发者提供了更好的分发渠道,也让 ChatGPT 的用户体验更加丰富。
具体怎么操作?
用户只需在 ChatGPT 中输入不同应用的名称,就能调取来自各种服务的内容。例如,用户可以说:“Figma,把这张草图变成一个可用的流程图”,以调用 Figma 应用。也可以输入:“Coursera,教我一点机器学习相关的内容”,来调用 Coursera 应用。
在 Zillow 的应用演示中,用户可以用自然语言让 ChatGPT 搜索符合特定价格区间的公寓。随后,ChatGPT 会生成一张交互式地图展示结果,用户还能通过对话了解各个房源的更多细节。
此外,ChatGPT 还会在对话中主动推荐可能有帮助的应用。例如,当用户请求“帮我为这周末的派对生成一个歌单”时,ChatGPT 可能会自动调用 Spotify 应用。未来,OpenAI 计划将 DoorDash、Instacart、Uber 和 AllTrails 等更多应用引入 ChatGPT。
OpenAI同时表示,这一系统是基于 Model Context Protocol(模型上下文协议,MCP)构建的——该协议允许开发者将他们的数据源连接到 AI 系统。ChatGPT 应用不仅能触发特定动作,还能在聊天界面中直接渲染完整的交互式界面。有些应用甚至可以在 ChatGPT 中播放视频,视频会固定在网页顶部,并可根据用户的需求进行动态调整。
如果用户已经订阅了某项服务,他们将能够直接在 ChatGPT 中登录账户,使用部分特定功能。
奥特曼还透露,OpenAI 未来会支持在 ChatGPT 内对应用进行商业化,包括通过公司最近推出的“即时结账”(Instant Checkout)功能来付费购买。
此外OpenAI还同步上线了一份开发者构建指南。
在今年晚些时候,开发者将可以提交应用,通过审核后发布上线。我们还会推出一个 App 目录,方便用户在 ChatGPT 内直接浏览和发现新应用。
只要符合开发者指南中的标准,应用就有资格被列入目录。如果在设计和功能方面达到更高标准,还会被重点推荐——比如在目录首页,或像刚才演示那样,被 ChatGPT 在对话中自动推荐。
我们今天已经发布了开发者指南的草案,连同 Apps SDK 的预览版一同上线,这样你可以清楚了解接下来的方向。另外,我们也会很快公布 App 的变现机制,并希望听到大家对这方面的想法。
地址:https://developers.openai.com/apps-sdk/app-developer-guidelines
不过,围绕 ChatGPT 应用系统的关键问题仍在于隐私和数据访问范围。OpenAI 表示,开发者“必须仅收集最低限度所需的数据,并对权限保持透明”。但目前尚不清楚开发者能访问到用户的全部聊天内容、最近几条消息,还是仅能看到触发该应用的提示语。
此外,ChatGPT 在面对多个竞争服务(例如 DoorDash 与 Instacart)时如何选择也仍是未知数。外界推测公司未来可能允许品牌付费提升曝光,但 OpenAI 表示,它的首要原则仍是“以用户体验为中心”。
奥特曼这样评价 Apps SDK:这是一种“在正确时间找到正确应用”的全新方式,同时也为开发者提供了新的曝光途径。
当然,小编发现只有Plus或Teams用户可以使用,相信漫漫就会向免费用放开。
Agentkit:更快更好地构建部署智能体
接下来的Agentkit也是本场DevDay的精彩看点。奥特曼上来就指出了现在构建生产级Agent的痛处:
AI 已经从“回答问题的系统”,进化为“能替你完成许多事情的系统”。我们现在通过 Agent,也就是具备上下文、工具访问与信任机制的软件看到了这种变化。
但尽管外界对 Agent 充满热情,真正进入生产环境、被广泛使用的却寥寥无几。原因很简单——太难了。
不知道从哪开始,不知道该信任哪个框架。
还要自己处理任务编排、评估循环、工具连接、界面设计……
这些层层复杂的环节,在你还没验证想法是否可行之前,就消耗了大量精力。
尽管如此,行业仍充满能量与机遇。
跟数千个团队交流后,OpenAI在思考一个问题:既然 Agent 正在重新定义“工作”,那么 OpenAI 能不能让构建 Agent 变得更容易?
所以这次全新的解决方案 AgentKit,就是专为希望“从想法快速到成品”的开发者而生。AgentKit 是 OpenAI 平台中的一整套模块化构建工具,帮助你将 Agent 从原型快速推向生产。构建、部署、优化,全流程也都有了。
ps:大家都知道市面上的已经不少Agent框架发布了,这次OpenAI的下场,势必会加剧该领域市场的竞争。
AgentKit 有三大核心组件。
第一,Agent Builder。一个快速的可视化工具,让你能直观地设计逻辑步骤、测试流程、实现创意。
它基于 OpenAI 广泛使用的 Responses API 构建——已有数十万开发者熟悉并使用它。
第二,ChatKit。通过它,开发者可以轻松地把优质对话体验集成到自己的应用中。
你将获得一个简洁、可嵌入的聊天界面,可以自由定制品牌风格、工作流逻辑,专注于让你的产品更具独特性。下面视频中可以看到,ChatKit 如何在每个 Agent 节点之间流畅工作,甚至调用工具,以生成最优回复。
第三,Evals for Agents。专门用于评估 Agent 性能的新功能。
包括:
- Trace Grading(跟踪评分):逐步分析 Agent 的决策逻辑;
- Datasets(数据集):评估单个 Agent 节点表现;
- 自动提示优化(Automated Prompt Optimization);
- 甚至可以在 OpenAI Evals 平台内直接评估外部模型。
“这是我们在最初构建 Agent 时梦寐以求的一整套工具。”
除此之外,在安全的数据访问方面,也十足重要。OpenAI表示,通过此前发布的 Connector Registry(连接器注册中心),开发者可以安全地将 Agent 与内部系统或第三方服务连接,所有访问都可通过管理员面板进行控制,既灵活又安全。
奥特曼还亲自展示了几个例子。他提到了一家非常具有规模化的连锁店智能体使用的例子。
Albertsons 是一家在全美拥有 2000 多家超市的连锁零售商,每周有超过 3700 万顾客购物。每家店就像一个小型经济体,店长每天都要做无数决策:促销、陈列、供应商、产品组合……他们用 AgentKit 构建了一个零售 Agent。
假设某天冰淇淋销量意外下滑 32%,过去需要经历冗长的报表、分析、会议流程;现在,员工只需问 Agent:“冰淇淋销量下降的原因是什么?”Agent 会综合季节性、历史趋势、外部因素等背景信息,快速给出建议——比如调整陈列方式或投放本地广告。
不同数据源、不同系统协同运作,生成真正有用、合理的答案。这也是使用 AgentKit 能实现的体验。
“目前,已有多家出色的首发合作伙伴借助 AgentKit 成功规模化部署了 Agent。从今天起,所有人都可以开始使用。”
更强大的 Codex
App、Agent 之后,下面则是软件开发领域的智能体Codex。
奥特曼特别提到了,软件开发智能体降低开发门槛这件事。
在日本,一位 89 岁的退休老人在 ChatGPT 的帮助下自学编程,他已经为老年人开发了 11 款 iPhone 应用,把自己一生的智慧变成了帮助他人独立生活的工具。
但这并不是重点,重点是,今天OpenAI终于全面开放了自家内部在使用的Codex,而不仅仅是预版!
在 OpenAI 内部,Codex 已成为构建过程的核心。
如今 OpenAI 几乎所有新代码都是 Codex 用户编写的。使用 Codex 的工程师每周完成的 Pull Request 数量提升了 70%,而几乎每一个 PR 都经过 Codex 审查——其深度甚至超过很多资深工程师。
从今天起,Codex 正式脱离研究预览阶段,全面开放使用!
上一次Codex推出大量新功能还是8月份,跟随GPT-5一起发布: GPT-5 Codex 模型。
该模型在代码重构和代码审查等任务上表现更佳,还能根据任务复杂度动态调整思考时间。
奥特曼透露道,开发者非常喜欢这个新模型。Codex 的使用量增长极快。“我们关注的一个关键指标是每日消息量——也就是开发者每天与 Codex 的任务和对话次数。自 8 月初以来,这个数字增长了 10 倍。这种快速增长也让 GPT-5 Codex 成为了我们增长最快的模型之一。自发布以来,我们已处理超过 40 万亿 tokens。”
那这一次带来的 Codex 版本自然也有一系列新功能,主要有以下几点,主要是面向工程团队推出的更新。
第一,Slack 集成。这是很多人强烈要求的功能。现在你可以在团队的 Slack 对话中直接让 Codex 写代码或回答问题。
第二,新的 Codex SDK,帮助团队在自己的工作流中扩展和自动化 Codex。
第三,新的管理与报告工具,包括环境控制、监控和分析仪表盘等,帮助企业更好地管理 Codex。
此外值得一提的是,与Anthropic的定位不同,奥特曼将Codex的用户定位更广——
最鼓舞人心的一点,是 Codex 用户的广度:从周末写 side project 的独立开发者,到高速成长的初创公司,再到全球企业。比如 Cisco 已经在整个工程组织内部署了 Codex,他们的代码审查速度提升了 50%,项目周期从数周缩短到了几天。通过 Codex 和 OpenAI 的 API,把你身边的任何东西都变成可运行的软件。
OpenAI负责人还展示了几个非常有意思的功能:
比如在IDE环境里的Codex,提示词可以很简短,自动理解上下文。另外还可以通过语音实时的氛围交互,此外也可以接入已经开发好的MCP。
这位负责人在语音模式过程中,全程没有敲一行字,Codex可以实时的进行交互,并完美的按照语音指令,连接起了草稿、设备,完成了现场拍摄照片的任务,可以说达到了一个小高潮!
回到语音模式——“你能让 Codex 显示一个像电影片尾那样的字幕动画,演员名单就是在场的观众吗?”
“我正在用 Codex 处理,很快告诉你结果。”“太好了。那能同时倒数并给我们拍张合影吗?”
——搞定!(欢呼与掌声)
当我让语音智能体执行这个任务时,它自动加载了 Codex SDK,这意味着我现在可以实时重编程这个应用,根据用户需求或反馈即时调整。
当我要求制作片尾字幕时,Codex 自动进入 React 代码,插入所需模块并完成任务。字幕现在开始滚动。
我们刚刚把语音、草图、身边的设备结合在一起,把这些全部变成了可运行的软件:全程没写一行手动代码。
把你最具野心的想法、最复杂的编程问题交给 Codex,看看它会做什么。我相信,你会像我们一样每天都被它震撼。唯一的限制,就是你的想象力。
API 中新增的模型:GPT5-Pro、Sora2、精简版语音模型
为了极大拓展 AI 的可能性,OpenAI这次还在API中新发布了GPT-5 Pro、Sora 2 和 Realtime Mini。
其中 GPT-5 Pro被奥特曼成为有史以来最智能的模型。而Realtime Mini 则是一款高级语音模型的精简版。Sora2自然不用说了,国庆节刚刚宣布,现在算是终于上线API了。
最近,我们又发布了 GPT-5 Pro,这是我们有史以来最智能的模型。今天,我们正式在 API 中推出 GPT-5 Pro。现在,所有开发者都可以使用它。希望你们会喜欢。
GPT-5 Pro 特别适合在 金融、法律、医疗等需要高精度和深度推理的领域,为开发者处理最棘手的任务提供帮助。
我们还在 API 中发布了一个更小的语音模型——GPT-Realtime-Mini。它是我们两个月前推出的高级语音模型的精简、低成本版本,但保留了同样的音质与表现力,价格则便宜 70%。我个人认为,语音将成为人们与 AI 交互的主要方式之一,而 GPT-Realtime 是迈向这一未来的重要一步。
写在最后:可怕的OpenAI
时隔第一次 OpenAI Dev Day,已经过去两年。OpenAI 给业界带来的想象力真的可以说是恍如隔世。
用奥特曼的话来形容,OpenAI的开发者生态已经发展到足以让谷歌、苹果都难以小觑的程度:
回到 2023 年,当时我们有 200 万开发者,1 亿 ChatGPT 周活用户。我们的 API 每分钟处理约 3 亿个 token,当时我们觉得这已经很多了。
如今,已有 400 万开发者在使用 OpenAI。每周有超过 8 亿人使用 ChatGPT。我们的 API 每分钟处理超过 60 亿个 token。
400万开发者、8亿周活跃用户、每分钟API调用量超过60亿Token。
AI 已经从“人们玩一玩”的东西,变成了“人们每天用来构建产品”的工具。
屏幕上显示的是在座一些开发者的名字,他们构建的应用在我们的平台上达成了惊人的里程碑——处理量达到 100 亿、1000 亿,甚至 1 万亿 token。
代表 OpenAI 全体成员,感谢你们。是你们在推动未来的前进。
看到这些成果,我对接下来要发生的事情充满乐观。
虽然我们已经取得了长足的进展,但这仍是旅程的早期阶段。
而,这些数字自然是OpenAI作为最强大的模型供应商所带来的虹吸效应,但仅仅只是如此吗?
这次开发者日的发布,显然说明,OpenAI的版图远不止于模型这么简单。
从GPTs的尝试,再到如今的直接将应用装到ChatGPT的Apps SDK、再到一站式的Agentkit、视频领域的Sora2、音频领域的Realtime API,据说在硬件领域奥特曼和ive也已经开发出了全新一代的智能交互终端。
可以说ChatGPT已经从一个聊天软件逐渐演变成一个无所不能、无所不包含的超级平台。
- Apps SDK,帮助你在 ChatGPT 中构建原生应用;
- AgentKit,让你能更自信地部署智能体;
- 更强大的 Codex,助你和团队更快完成产品发布;
- 在 API 中新增的模型:GPT-5 Pro、Sora 2 和 Realtime Mini,它们将极大拓展 AI 的可能性。
所有这一切,奥特曼如是说:“OpenAI的目标,是让 AI 对每个人都有用。”
那对于我们技术人而言,请不要迟疑,
没错,正在见证一场重大变革。
互联网时代,大家搞起了LAMP框架;
移动开发时代,大家纷纷成为安卓开发者、iOS开发者;
而如今,相信地球上开始诞生一种名曰“OpenAI”开发者或者“ChatBot”开发者的称谓。
因为时代的车轮推进如此之快,以前需要几年、几个月的软件开发,现在通过ChatGPT,只需几分钟。
“之前复杂的基础设施似乎再也不用多加考虑了,你只需要一个好的idea!”
多么可怕的未来,多么可怕的OpenAI!
AGI时代的巨头已然成型了!
本文转载自51CTO技术栈,作者:云昭
