
OpenAI播客再谈AI编程大战!开发者是有福的人:特定需求的代码模型将涌现!主持人说漏嘴:我最喜欢Claude!
编译、整理 | 伊风
出品 | 51CTO技术栈(微信号:blog51cto)
OpenAI第二期播客来了!阵容也是相当重磅!
嘉宾是OpenAI 首席研究官 马克·陈(Mark Chen)和ChatGPT 负责人 尼克·特利(Nick Turley)。主持人依然由OpenAI研究员Andrew Mayne担任。
说起Mark Chen,感觉他目前实际担任了OpenAI CTO的工作。就在这两天 Meta 大举挖人、硅谷 AI 人才战火正旺之际,Mark 第一个站出来稳定军心,在内部 Slack 上发了一封强烈表态的备忘录:
“我现在的感觉是强烈的、生理性的,就像有人闯进我们家偷走了什么东西。”“请相信,我们绝没有袖手旁观。”
左:Nick Turley,右Mark Chen
这个博客有个很让人震惊的小插曲,在提到最强编程模型的时候,主持Andrew Mayne居然说自己喜欢Claude Sonnet……这播客,那么实在的吗??
言归正传,这个播客还是有很多编程方面的猛料值得一看:
🔹OpenAI可谓AI编程的开山鼻祖:在 GPT-3 刚出现的时候,OpenAI就发现它能生成完整的 React 组件,并捕捉到了AI编程工具的潜力和需求。
🔹Agentic 编程应该是异步式交互的:你给模型一个复杂任务,让它在后台处理一段时间,再返回一个接近最佳的解法。
🔹 “写出好代码”仍然需要“品味”:OpenAI 也在训练模型理解代码风格。
🔹 OpenAI做产品的思路:从技术出发,观察谁能从中找到价值,然后再围绕这些用户进行迭代。
🔹Codex是一款面向专业编程者的AI工具,未来还会有更加通用的消费级产品推出。
🔹 别再盯着“岗位消失”不放了:打字机修理工的确消失了,某些传统开发工作也会被替代,但“代码能做的事”远超想象。
“写代码这件事的空间,大得超乎你我的想象。”
1.编程模型不会一家独大,“Agentic 编程”大有可为
主持人Andrew Mayne:
在众多令人惊喜的能力中,代码一直是一个非常有意思的方向。我记得在 GPT-3 刚出现的时候,我们突然发现它能生成完整的 React 组件,当时我们就意识到它是有实际用处的。之后我们专门训练了一个模型聚焦在代码上,这就催生了 Codex 和 Code Interpreter。现在 Codex 又以新的形式回来了,虽然名字一样,但能力越来越强。
我们见证了代码功能从最初进入 VS Code,然后到 Cursor、再到我经常用的 Windsurf。现在代码领域的竞争压力也很大。如果我们问大家谁拥有最强的代码模型,可能会有不同答案。
Mark Chen:
没错,这其实也反映出一个事实——“编程”这个词本身指涉范围就很广。比如你在 IDE 里写代码,需要函数补全,这和你提出一个 Pull Request 并让 AI 完成整个任务,是完全不同的两种“编程方式”。
主持人Andrew Mayne:
你能展开说说“Agentic 编程”具体是什么意思吗?
Mark Chen:
当然。你可以把它和“实时响应型模型”做对比,比如 ChatGPT 的传统方式是你给出一个提示,它很快就给你回应。但 Agentic 编程更像是:你给模型一个复杂任务,让它在后台处理一段时间,再返回一个接近最佳的解法。
我们越来越多地认为未来会是这种异步式交互:你提出一个复杂请求,然后让模型花时间思考、推理,最终给你一个尽可能优秀的结果。在代码领域我们也看到这种演变。未来,你可能只需描述你想实现的功能,模型会处理后再回来给你完整解决方案。
我们的第一版 Codex 就体现了这个方向:它接收的是 PR 级别的大任务,比如一个新功能或大范围 bug 修复,希望模型真正花时间来解决,而不是仅仅快速响应。
Nick Turley:
是的,说到底,“编程”涵盖范围实在太广,几乎可以类比“知识工作”这种大词。所以我不认为会有一个绝对赢家或最佳模型,而是有很多选择。开发者其实是最幸运的一群人,他们现在能选择非常多样的工具。就我们而言,“Agentic 编程”是目前最令人兴奋的方向之一。
我做产品时经常用一个评估标准:“如果模型变强 2 倍,产品是否也会变得有 2 倍好用?” 过去 ChatGPT 的确做到了这一点。但当模型越来越聪明,用户不再只想和一个像博士生一样的模型聊天,他们会开始在意模型的性格、实际能力等。
Codex 是一种理想的产品形态:你定义任务,模型花时间思考,然后产出结果。这种交互方式特别适合未来更强大的模型。虽然目前还是早期研究预览阶段,但正如我们当初对 ChatGPT 的判断一样,我们认为越早获取反馈越有意义,对未来很期待。
主持人Andrew Mayne:
我之前常用 Sonnet(Claude),非常喜欢。后来我尝试了 Windsurf,用的是 0.4 mini 或 medium 设置,我感觉特别好,响应速度快、体验也流畅。每个人都有喜欢的模型,这我理解,但就我用的任务来说,这是我第一次真正满意。
Mark Chen:
我们发布这个其实是希望用户能体验到,我们也知道代码领域还有很多“低垂的果实”可以探索。代码是我们重点关注的方向,未来你会看到越来越多适配特定需求的代码模型。
主持人Andrew Mayne:
我现在如果只是想快速查个语法或写法,就会用 GPT-4.1 直接问。但对更复杂任务,情况就不同了。评估方式其实已经有点饱和了,而且每个人的标准也不一样,所以要怎么适配各种需求是个挑战。
Mark Chen:
尤其是代码领域,不只是“能不能生成正确答案”。用户还会在意代码风格、注释的详尽程度、模型是否主动做了额外的事情,比如写好辅助函数等等。大家的偏好差异也很大,这需要我们在很多方面做得更好。
Nick Turley:
过去如果你问我哪些领域会最先被 AI 变革,我一定会说是代码。因为和数学类似,它是可验证、可打分的,非常适合强化学习。
2.编程的品味仍是最宝贵的
Nick Turley:
现在我依然这么认为,但让我意外的是:代码其实仍然包含大量“品位”层面的东西。一个人成为专业软件工程师,不是因为智商变高了,而是因为他们学会了如何在团队中构建软件——写什么样的测试,如何写好文档,别人不同意你代码时该怎么回应……
这些才是“真正的软件工程”需要具备的内容,我们也需要教会模型理解这些。所以我相信 AI 在代码上的进步会很快,代码仍然是一个非常适合做 Agentic 产品的领域,但“风格”“品位”“真实开发实践”这些也必须被考虑进去。
主持人Andrew Mayne:
还有一点也很有趣:ChatGPT 现在面临的挑战之一是要在“消费者”和“专业用户”之间找到平衡。我告诉朋友可以把 ChatGPT 连接到代码模型,他们都觉得很神奇,比如让它控制 IDE、自动创建文件夹、写文档这些,其实都能做。
现在我们有了图像标签、Codex 标签,甚至可以通过 GitHub 使用模型。Sora 也整合进来了。你能看到这些功能在逐步融合:那我们该怎么区分消费级、专业级和企业级功能呢?
Nick Turley:
我们在做的是非常通用的技术,它会被各种各样的人使用。和很多公司不同的是,别的公司通常从一个特定用户类型出发,用技术来解决这个群体的问题;而我们更多是从技术出发,观察谁能从中找到价值,然后再围绕这些用户进行迭代。
以 Codex 为例,我们的初衷是面向专业软件工程师打造这个产品。但我们也知道,这种“溅射效应”会波及很多其他用户群体,他们也能从中受益,我们也会努力让他们用起来更加便捷。
其实面向非工程师用户还有很多机会。我个人非常希望能帮忙构建一个“人人都能编程”的世界。Codex 不是面向大众的产品,但你可以想象未来会出现这样的工具。不过总的来说,我们很难一开始就准确预测目标用户是谁,必须把这些通用技术推出去之后,才能用实证主义的方式观察价值到底在哪儿。
Mark Chen:
是的,其实更深入一点来说,有些用户可能主要用 ChatGPT 写代码,但他们偶尔也会想跟模型聊聊,或者想要生成一张漂亮的图。所以虽然存在不同的用户画像,但在实际中,我们发现大家都希望模型具备多种能力。
3.内部使用Codex:目标是让工程师提效十倍
主持人Andrew Mayne:
在 Codex 发布的时候,我有个印象很深的感受:有些工具之所以引发巨大兴趣,是因为内部团队本身就有强烈需求。这种工具你们内部用得多吗?
Mark Chen:
越来越多了。
Nick Turley:
我对内部使用 Codex 非常兴奋。应用场景非常广,比如开发者用它来减少写测试的负担,还有分析师用它处理日志报错,自动标记问题并在 Slack 上通知相关人员。甚至有人用它当作“待办清单”的入口,提前把未来希望完成的任务发送给 Codex 处理。
我认为这类工具非常适合“内部自测”(dogfooding),而且它确实能大幅提升开发效率。我们的目标是:不扩张人力的前提下,提高现有工程师的产出效率,理想状态是让一个工程师变成原来的十倍高效。从这个角度看,内部使用情况对我们未来产品发展方向是非常重要的指标。
Mark Chen:
是的,我们不会发布自己都不愿意用的工具。在 Codex 上线前,内部就有一些超级用户,他们每天能用 Codex 写出上百个 Pull Request,这说明我们内部确实能从中获得巨大价值。
Nick Turley:
而且内部使用还有一个“现实校验”的作用:人们都很忙,要引入新工具需要一定“激活成本”。你会发现:当我们试图推广某个工具时,要花时间让大家适应新的工作流,这个过程其实挺谦卑的。我们既能从中了解技术的局限,也能看到“采用路径”的实际阻力。
4.适应AI时代的秘密武器:好奇心、主动性
主持人Andrew Mayne:
确实,构建这类工具时,团队成员要花时间去学习和适应它。现在有个热门话题是:未来需要什么样的技能?你们在组建团队时会更看重什么能力?
Nick Turley:
这个问题我思考过很多。招聘确实很难,尤其是你想组建一个小而强、谦逊且执行力极强的团队时。我最看重的能力是好奇心。
很多学生问我,在一个快速变化的世界里该怎么办?我给他们的建议就是:好奇心是关键。我们自己其实也有很多不知道的地方,必须带着谦逊的态度深入研究,去理解什么是有价值的、什么是有风险的。
尤其是在 AI 相关的工作中,不管是代码、还是其他方面,其实真正的瓶颈不是获取答案,而是提出对的问题。所以我非常相信我们需要招聘那些对世界和我们所做的事情充满好奇的人。
至于是否有 AI 背景,我其实没那么在意。当然 Mark(Mark Chen:)可能观点会不同。但对我来说,产品团队的成功与否,很大程度上取决于好奇心的强弱。
Mark Chen:
我其实也差不多。就连研究方向,现在也越来越不强调一定得有 AI 博士学位。我自己就是以“驻留研究员”身份加入的,当时没有什么正式的 AI 训练背景。
我觉得 Nick 提到的很对,另一个重要素质是“主动性”。OpenAI 不是那种每天都有人告诉你:“今天你要做这三件事”的地方,而是你得看到问题、主动跳进去解决它。
还有就是适应性。这个行业变化非常快,所以你必须能迅速判断什么是重要的、什么时候该调整方向、该怎么转变工作重点。
Nick Turley:
的确,我们常被问“OpenAI 怎么能持续发布产品”,很多人觉得我们几乎每周都在发布新东西。但我们自己从未觉得速度够快,反而常觉得可以更快。
真正的原因是:我们拥有大量有执行力的人,不管是产品、研究还是政策团队,大家都能推动项目向前。虽然“发布”在不同团队里意义不同,但我们减少不必要的官僚流程,除了在极个别需要严格流程的领域外,大多数时间我们能快速推进,这也是我们想招聘的理想人才类型。
主持人Andrew Mayne:
我当初加入公司,是因为最早拿到 GPT-3 的访问权限,然后开始做各种 demo,每周发视频。虽然有时可能挺烦人的(笑),但我真的非常兴奋。
Mark Chen:
不烦,反而很有趣。
主持人Andrew Mayne:
那段时间真的让人兴奋。我跟别人描述时说,就像他们造了一艘 UFO,而我能玩它。比如我看到它能“悬停”,我就觉得:“哇,他们真的让它飞起来了!”我只是按了按钮而已,但感受到的力量是真实的。
我是自学写代码的,看了很多 Udemy 课程,然后能作为工程团队一员,被鼓励“自己去做点什么”,虽然不是核心工作,也没搞坏什么(笑),但这份自由让我感到被赋能。
我觉得这种精神至今还在,这也是 OpenAI 能不断推进产品的原因之一。毕竟 GPT-4 是由 150 到 200 人一起完成的。
主持人Andrew Mayne:
我觉得大家常常忘了这件事。
Nick Turley:
完全同意。实际上,连 ChatGPT 也是这样“拼凑”起来的。一开始是研究团队在做“指令跟随”相关的研究,之后的模型也延续了这条路线,通过后训练让模型更适合对话。而 ChatGPT 的产品原型,其实是一个黑客松(hackathon)项目。
我记得很清楚,我们当时问大家:“谁想做消费级产品?”然后各种背景的人都加入了进来——比如有来自超级计算团队的人说,“我之前做过 iOS 应用,我来做”;也有研究员来写后端代码。这是一个“想做点事”的人的交汇点。
我认为,能让这种事发生的组织文化,是诞生下一个 ChatGPT 的关键,也是我们在组织规模不断扩张时要维持下去的东西。
主持人Andrew Mayne:
我们之前提到,团队招人时会关注“好奇心”,Mark 也认同这一点。如果我是个 AI 行业外的人,比如 25 岁或 50 岁,面对技术飞速发展可能会感到有些害怕,特别是像 ChatGPT 在写作、编程上表现得这么好。
但我个人认为,永远不会有足够多的“写代码的人”,因为代码可以实现的事情,比我们能想象的还要多。
5.不要担心被取代:写代码这件事的空间大得超乎想象
主持人Andrew Mayne:
那么你们会给普通人什么建议呢?不论他们处于人生哪一阶段,该如何准备、适应并参与这个 AI 未来?
Mark Chen:
我觉得最重要的是你要意识到,你的能力可以被增强——AI 能让你更高效、更有影响力。
未来,专家仍然会存在,但 AI 帮助最大的其实是那些本身并不具备高级技能的人。举个例子,如果模型能提供更好的医疗建议,它最能帮助的,其实是那些无法获得高质量医疗资源的人。
图像生成也一样,它不是替代专业艺术家,而是让像我和 Nick 这样的人也能做出有创意的表达。
AI 提供的,是一种“能力提升的基础设施”,让普通人能胜任很多本来不擅长的事。
Nick Turley:
未来的确会发生很大变化。我觉得几乎每个人都会有那么一刻,AI 做了一件你原本认为“神圣而人类独有”的事情。
主持人Andrew Mayne:
我认识一个做投资的人,当他的工作内容被 AI 替代后感到非常受威胁。
Mark Chen:
没错,现在有些模型在写代码、解决问题方面,确实比我强。
Nick Turley:
这是很人之常情的反应。面对这种强大系统时,我们会感到敬畏,也可能感到恐惧。
就像 Mark 说的,你需要亲自使用它,才能真正理解它、降低恐惧感。
我们很多人从小就听说“人工智能”,但那个时候说的是算法、广告推荐,或是电影里的机器人,对不同人来说,AI 意味着不同的东西。因此,感到害怕一点都不奇怪。
要想和别人进行有建设性的对话,最好的方式就是亲自去用 AI。
至于如何为未来做准备,我认为不一定要去钻研什么提示词工程或 AI 编程原理。
反而更重要的,是那些本质的人类能力,比如“如何委托任务”。
你将拥有一个“放在口袋里的智能体”,它可以是你的导师、顾问、工程师。真正的关键是:你是否了解你自己,知道你要解决什么问题,以及别人能如何帮你。
Nick Turley:
我之前也说过,好奇心很重要。你能问出什么问题,就能获得什么样的结果。除此之外,持续学习的能力也非常关键。
你越能快速学习新领域、新知识,就越能适应这个变化速度前所未有的世界。我自己也准备好接受:未来某一天,我现在做的产品经理角色可能会消失。但我也期待去学点新东西。如果你有这种心态,那你就能很好地利用 AI。
主持人Andrew Mayne:
我们有时候会过度强调某些岗位的消失,比如我们不再需要打字机修理工了。某些类型的编程岗位也会消失。
但我还是那句话:写代码这件事的空间大得超乎想象。
你们刚才提到了医疗行业,有人会担心 AI 替代医生。但我其实乐意让 AI 来给我诊断、动手术,甚至处理很多事情。
但我还是希望有个人陪我聊聊、解释手术流程、握着我的手。我每天都吃很多维生素,但我不可能每天因为这些小事去问医生,对吧?
本文转载自51CTO技术栈,编译、整理 :伊风
