
OpenAI董事长:太多AI应用是在表演!AI泡沫远比想象更严重,会有人赔大本;应用不应追求AGI 原创
编辑 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
采访 | Decoder
“应用型 AI 公司不应该追求 AGI。”
“我们确实也处在一个泡沫期,会有人赔掉大量资金。”
“我们平台上的某个 agent,每生成一条回复,背后可能会触发 20 多次推理调用。”
上周,OpenAI 现任董事长、Sierra CEO Bret Taylor 做客一档播客栏目,期间的谈活内容引起了业内的关注。
Bret 的经历透露着一种技术人独有的传奇色彩,可以说是少数完整见证科技行业发展的资深人物之一。他早年是 Google 的工程师,之后创办了社交网络 FriendFeed,并在 2009 年将其卖给 Facebook,随后担任 Facebook CTO。后来他创立了协作工具 Quip,并将其卖给 Salesforce,并一度做到了 Salesforce 联席 CEO。
但现在,Bret 离职创办了 Sierra(提供企业级对话式 AI Agent 平台)。这家公司在做这样一件事情:重新定义企业如何利用 AI 提升客户服务体验。在此期间,他还曾担任 Twitter 董事会主席,见证了马斯克收购事件;在 OpenAI 经历 CEO Sam Altman 被解雇又复职的风波后,他成为董事长。
这样的的经历,堪称一种行业“沉浸式”观察的第一人称视角。
这次对话的背景是,Bret 的 Sierra 刚刚完成了新一轮融资,市值来到了 100 亿美元。当然,还有一个故事背景:就是 GPT-5 的发布近一个月,用户的反馈从差评慢慢趋向于好转。所以,主持人 Alex Heath,重点问了 AI 应用和大模型这两件事。在AI应用方面,站在 AI 圈的核心,Bret 的视角反而没有偏袒 AI 的炒作,对话中他在理性地思考AI产品即将带来的二阶、三阶的影响和变化,并坦承现在市面上的 AI 产品更多是表演性项目。“要么等,要么自己做!”
我们现在可能还在马斯洛需求层次的底层,很难想象到达“自我实现”的顶端是什么样子。
而对于模型技术方面,Bret 认为,Agent的技术秘方不在于自己预训练一个模型,他们会微调多个模型。
系统里有很多不同的模型,不是单一的供应商,也不是固定的参数规模,参数量只是衡量模型复杂度的指标之一。
此外,这次谈话当然也绕不开聊到 OpenAI 以及整个 AI 行业的走向。他举了几个非常令人兴奋的例子。其中,他特别提到了 WhatsApp 上的业务 Agent,以及驾驶途中的办公 Agent.
比如在巴西,有人直接在 WhatsApp 上办理抵押贷款。我问他在干嘛,他就直接上传 PDF 文件。突然间,你会发现,如果未来每家公司都用会话式 agent 来做客户服务。
那可能每家公司都会在 WhatsApp 上有一个业务入口,或者智能音箱可能会卷土重来。
想象一下,你在通勤途中,一边驾驶,一边通过个人 agent 整理邮件、对话交流,你的通勤时间一下子就变得超级高效。
“三年前,我心目中的 AGI 已经实现”,但是AI的泡沫要比麻省理工的那份研究报告实际上更严重些。
OpenAI的走向会通往哪里,是为AGI时代提供基础设施,还是把大模型商业化?Bret 给出了坚定的答案:前者。
对于近日 GPT-5 发布的争议,他回应:绝对是质的飞跃。并表示,以后人们对“模型到底提升了多少”的感知,会越来越取决于他们要解决的问题的复杂度。
提及大火的代码 Agent,Bret 指出,客户其实真正需要的不是让 Agent 帮我写代码,而是解决方案。
……总之还有很多料,之类不再逐一展开了。
以下是 Alex Heath 和 Bret Taylor 的完整对话,enjoy:
1.OpenAI董事长下场做Agent前做什么?
Alex Heath:
我想从 2023 年初说起。当时你刚离开 Salesforce,还是联席 CEO。能聊聊当时决定创业的过程吗?你是如何最终确定做 Sierra 的?
Bret Taylor:
我宣布离开 Salesforce 的时间,正好和 ChatGPT 发布几乎是同一周。我不知道你相不相信“宇宙暗示”这种东西,但对我这种极客来说,用到这种产品的那一刻,我满脑子都在想它。
说实话,我当时并不百分之百确定离开 Salesforce 后要做什么。我只是想先离开,再慢慢思考人生方向。结果我立刻就沉迷进了这项技术。我自己在用它,[LinkedIn 联合创始人] Reid Hoffman 也是我的朋友,他当时给我演示了 GPT-4 的早期版本。我完全被它展现出来的同理心和自然的人类表达震撼了。
我之前一直在关注 AI,但老实说,如果你在 2023 年 10 月让我解释“大语言模型”是什么,我可能会一脸茫然。
后来我意识到,这项我其实没跟得那么紧的技术,真的要改变世界。我知道我必须在这个领域做点事情。虽然还不知道具体做什么,但没关系。这让我想起当年第一次接触互联网的时候,直觉就是:它会改变一切。我想要在那个浪潮里工作。
然后我和 Clay Bavor(我认识 20 年的老朋友)一起吃饭,本来没打算和他一起创业,但在饭桌上我发现他也同样痴迷。他当时还在 Google 给 Sundar Pichai 工作,结果一顿饭下来,多点了几道菜,最后我们决定一起开公司。虽然完全不知道要做什么,但基于一个前提:当科技发生地震式的变革时,商业机会会大量涌现,用户需求、企业需求和软件商的能力都会被重新洗牌。
就像互联网出现后,造就了今天股市上最大的几家公司,比如 Amazon 和 Google,同时也冲击了微软(不过微软最终挺了过来)和 Siebel Systems(就没那么幸运)。这种“新贵 vs. 旧王者”的格局大洗牌,会打开巨大的市场。互联网的典型市场是搜索和电商,而大语言模型也会重塑无数市场,从软件开发到客户服务。
所以我们决定先休整几个月,然后和大量潜在客户聊,最终创办了 Sierra。我们要做的是客户体验的 AI Agent。现在包括 ADT 家庭安防、纽约的 Ramp、SiriusXM 等公司都在用 Sierra 的 Agent 来接电话、处理线上对话,甚至帮用户升级套餐或在警报响起时主动打电话通知你。这真的很令人兴奋。
2.Agent的商业模式:按结果付费,佣金分成
Alex Heath:
跟我聊聊Sierra,以及你们是如何与新客户进行实际合作的。请跟我讲一下整个流程,因为这是一个非常新的领域。我的意思是,客户支持本身并不新鲜,但你们的工作方式是全新的。那么,与之前在其他公司的工作方式相比,你们与客户合作的方式有什么独特之处呢?
我先从我们的商业模式开始,因为我认为这有助于回答你的问题。Sierra 与传统软件公司不同的一点是,我们只按结果收费。所以对于我们的大多数客户来说,这意味着当 AI 代理自主解决客户致电或聊天时提到的问题时,需要支付一定的费用。如果 AI 代理需要转接给真人,则免费。
Bret Taylor:
我们非常喜欢这种商业模式,而且我认为它将成为代理商的标准商业模式,因为“agent”(代理)一词源于“agency”(代理机构),其原则本身就意味着一定程度的自主权。我认为大多数经验丰富的代理商都会主动开始并完成一项任务,无论是为销售团队开发新的销售线索,还是解决客户服务咨询,或是为反垄断审查进行法律分析,无论它是什么。
如果人工智能代理不仅能帮助人们提高工作效率,还能真正完成任务,为什么不直接为出色的工作付费呢?看看大多数公司,如果工作成果可衡量,比如销售,你往往会支付佣金,对吧?这不仅仅是工资。所以我认为,让代理按佣金获得报酬,这不仅是供应商、合作伙伴和公司之间良好的激励机制,而且从根本上来说也感觉很合理。这就是为什么我认为它会像云端软件的出现一样。当马克·贝尼奥夫和帕克·哈里斯创立 Salesforce 时,它提供的是订阅式服务,而不是永久授权,这改变了软件的格局;同样的道理也将发生在代理身上。
现在回到我们如何与客户合作的问题,这引出了一个问题:如果只有当软件运行良好时才能获得报酬,那么软件供应商与公司之间的关系究竟是什么?大多数软件供应商与客户之间都保持着一定程度的“保持距离”关系。如果你见过有人做过大型ERP实施,我对ERP系统了解不多,但显然,它们很难执行,因为我遇到的每一个做过ERP实施的人,都比预期多花了两年时间,花费也比预期多得多。
如果你去和参与某个项目的10000人交谈,系统集成商会把矛头指向软件供应商,软件供应商又会把矛头指向系统集成商。没有人真正指责公司,因为公司才是付账的人。所以每个人都会说:“哦,你真棒。不,我肯定一切都好。” 这就好比成功有一千个父亲,而失败却只有一个孩子。问题的一部分在于,在这种关系中,唯一关心结果的一方是公司。
所以每个人都在互相指责,这需要一位优秀的CIO或CTO来应对,但你可以看到其中存在着各种不正当的动机。也许合作伙伴是按小时收费的;这可不是什么好的激励机制。软件供应商已经完成了销售,所以祝你好运,希望你能够成功部署。
我认为,走向基于结果的定价模式需要软件公司与其合作公司之间的关系发生改变。我认为目前在人工智能领域,这种模式很流行,部分原因就在于此。没有哪家软件公司想成为一家专业服务公司。所以,你不可能把定价机制调到最高,然后就打造出一家我认为你想打造的公司。但这需要承担不同程度的责任。
因此,在与客户的关系中,我们真正关注的是几个不同方面。一是产品的易用性。我认为,要实现目标,就需要让实现目标的过程尽可能简单。我们在市场上独树一帜,既有面向技术团队的产品,也有面向运营团队的产品。你无需任何技术知识即可组建代理团队。同样,我们正在努力赋能尽可能多的客户体验专业人士。在合作方面,我们在所谓的代理开发方面提供大量支持。如果你需要帮助来拓展代理团队,我们会安排专车前往。这很独特。
我不确定一切最终会如何发展,但我非常认同这个愿景。当我与客户交谈时,我很高兴他们能够清楚地了解我们为他们提供的价值,因为他们只有在客服人员工作时才需要付费。我非常喜欢这种简单的关系,并且非常认同。
3.为什么专注于大客户?
Alex Heath:
这么说,你们有数百个客户,其中50%的客户年收入超过10亿美元,20%的客户年收入超过100亿美元。对吗?
Bret Taylor:
是的。
Alex Heath:
为什么要专注于这样的客户,而不是像 Shopify 那样采取大规模的策略?你们为什么要向大公司靠拢?
Bret Taylor:
大公司有大问题。我喜欢第一性原理思维,如果你是一个大型消费品牌,在全球拥有1亿消费者,那么在大型语言模型出现之前,你不可能与所有消费者进行对话。如果你算一下,呼叫中心有个术语叫“每次联系成本”,它本质上衡量的是接听电话或回复聊天所需的全部人力和技术成本。这实际上取决于对话的复杂程度以及接听电话人员的资质。也取决于是在岸还是离岸。
但假设接电话的费用在10到20美元之间。对于大多数消费品牌来说,他们每用户的平均收入甚至低于这通电话的费用。所以你根本负担不起通话费用。这就是为什么如果你曾经尝试给任何消费品牌打电话,你都会发现你根本打不通。
很多网站都专门用来查找许多消费品牌的电话号码。这并不是因为他们不在乎你,只是不经济。如果每个想给他们打电话的人都打给他们,他们就会倒闭,这对你来说可能也不好。现在有了大型语言模型,情况就完全不同了。你把电话成本降低了两个数量级,而不是一个数量级,突然之间,通话的经济效益就发生了巨大的变化。
因此,我们之所以追求更大的企业品牌,是因为客户体验中这种阶跃式的功能与拥有数千万甚至数亿客户的公司息息相关。这些公司是世界上规模最大的公司。真正令人兴奋的是,我认为很多人在考虑用于客户体验的人工智能客服时,会想到联络中心自动化,而这才是其中很重要的一部分。
但如果你从我刚才说的角度来思考,你会发现,现在你与客户的对话次数比以前多了一到两个数量级,而成本却保持不变。这真的非常了不起。想想所有竞争的公司,比如手机公司,都在争夺一个固定的客户群体,而这些客户都在努力决定与哪家公司合作。如果你能将客户关注度提高100个基点,那就意义重大。如果你能将客户流失率降低500个基点,那就能改变公司的终身价值方程。
所以我认为人们正在考虑这个问题。我认为这实际上是降低电话成本的首要效应,这很棒;你可以省下这笔钱,并将其返还给股东。但我认为更成熟的公司会问:“我真的能获得市场份额吗?” 这真的非常令人兴奋,而这正是我们正在努力为世界上一些最大的品牌实现的目标。
4.无需人工介入的聊天机器人
Alex Heath:
你们现在有没有客服人员在无需人工参与的情况下为客户做事?我指的是超越聊天机器人的客服人员,他们做的事情实际上与经济挂钩,或者说,那些你以为会有人参与但实际上并没有人参与的事情。现在有这方面的例子吗?
Bret Taylor:
我举几个例子。我们有一些零售商,你可以提交受损商品的照片,并立即裁定保修索赔,系统会连接到库存系统并给您寄送新产品。你还可以通过我们平台上端到端的人工智能代理为您的房屋进行再融资。
Alex Heath:
无需人工介入?
Bret Taylor:
无需人工介入。这些代理在处理各种任务方面非常出色,你可以使用基于 Sierra 平台构建的代理来采取行动——我们 100% 的客户都在这样做。某种程度上,人工智能中存在一种叫做检索增强生成(retrieval augmented generation)的技术,这是一种更贴切的说法,它就是在回答问题。事实证明,这在目前已经成为一种商品。将 ChatGPT 与知识库整合起来并不难。如今大多数工程师可以在一个周末内完成,这真是令人难以置信。三年前这还是科幻小说;现在却是一个周末就能完成的项目。欢迎来到科技世界。它令人惊叹。
其实,把复杂的监管流程加上精密的护栏……这是一个很大的挑战。我们服务的行业包括健康保险支付方、医疗服务提供者、银行、财产和意外险公司。如果谈到理赔处理这种高度监管的复杂对话,它绝对不是“检索增强生成”(RAG)能解决的。这是带有合规审查的复杂交互。那你怎么用 AI 护栏来保证?又怎么用确定性规则的护栏来保证?你还得解决一些很琐碎但极难的问题,比如在 40 多种语言里的转录准确性。
如果转录系统漏掉了一个“and” 或 “or”,其实无伤大雅;但如果漏掉的是你的账号,那就大问题了。所以难点在这里。我们做过道路救援的项目,结果发现一个细节:如果你在和 AI agent 对话时,旁边突然有汽车喇叭声,它经常会停止说话,因为它会误以为你在打断它。它根本分不清这是汽车鸣笛还是你在说话。
我们的平台就是为解决这些问题而设计的:有效的护栏、多语言的文字与语音对话、确定性护栏、AI 驱动的护栏(我们称之为“监督模型”),这些都非常有效且有趣。还有一些看似简单的能力,比如能区分“那只是电视的背景音,没有人在说话”,或者“那只是汽车喇叭声,不代表有人打断我”。这些在三四年后可能会变得容易,但现在非常困难,也正因如此,我们的产品才有很大需求。
5.语音赛道:从上网站变成了打电话
Alex Heath:
我很高兴你提到语音。我也很好奇,除了聊天之外,语音会如何进入这个领域?你觉得语音会不会比文字更重要?
我认为会的。语音已经在我们的平台里占比超过文字了,这其实挺惊人,因为我们去年 11 月才推出。我觉得原因有几个。首先,从人的角度来看,如果你看未来计算机的电影,或者科幻小说对未来的想象,几乎都是通过对话与电脑交流的。我认为语音是最符合人体工学的界面。人人天生都会说话,不需要学习。它的摩擦成本极低,几乎人人都能使用。我们常说“数字鸿沟”,如果未来大部分的数字交互都可以通过说话完成,这将极大提升普惠性,尤其是在多语言和耐心的语音系统支持下。
如果你看电信行业、健康保险行业,很多客服依然依赖电话。不只是患者或消费者,服务提供方和支付方之间也还是靠电话。AI 做的事情,是第一次把这个最古老的模拟渠道——公共电话交换网,真正变成了数字化。过去几乎每家公司都有一个“数字自助服务团队”,说白了就是希望你上网站办事而不是打电话。这样对你更快,对他们更省钱。公司还专门组建团队去推动这个。现在情况却变成了:也许你直接打电话吧,没关系,因为同一个 AI agent 在接听电话,也在网站上服务你。这听起来有点疯狂。
你可以把它类比为 TCP/IP : TCP 运行在 IP 协议上。我们其实是把互联网“放进了电话”,让电话第一次成为数字技术的一个通道。因此,从创业角度看,有句老话:要做“止痛药”,而不是“维生素”。因为人们一定会买止痛药,但维生素只是锦上添花。
这就是一个真正的“止痛药”。电话渠道是最昂贵、最繁琐的渠道,而且大家都讨厌它。即使你遇到史上最好的客服代表,你通常也是在等待了十分钟之后才和他讲话。因为让呼叫中心做到“客户永远不用等待”在经济上根本不可持续。
所以电话现状是一个所有人都讨厌的局面:消费者讨厌,公司讨厌,没有人会替它辩护。而现在这项技术可以直接解决这个问题。这就是我为什么认为它会产生巨大影响。
但展望未来,局面其实还不确定。即便我身处 AI 领域的核心,也无法准确预测世界将走向哪里。但我觉得这是极其令人兴奋的。如果你看看 WhatsApp 在巴西和印度的使用方式,就会想:也许这种会话式交互会在其他市场同样无处不在。
我大概四年前去巴西时就被震惊了,有人直接在 WhatsApp 上办理抵押贷款。我问他在干嘛,他就直接上传 PDF 文件。突然间,你会发现,如果未来每家公司都用会话式 agent 来做客户服务,那可能每家公司都会在 WhatsApp 上有一个业务入口,或者智能音箱可能会卷土重来。
我会想到每天开车上班时用 CarPlay。我很喜欢这个产品的很多地方,但它其实什么都做不了。想象一下,你在通勤途中,一边驾驶,一边通过个人 agent 整理邮件、对话交流,你的通勤时间一下子就变得超级高效。这就像在车里和一个“无所不知的私人助理博士”聊天,挺酷的。我觉得这是令人兴奋的方向。我们一直谈论手机,因为它的经济影响力巨大。而现在,我们正在让计算机“变得可对话”,我认为这既是一种用户界面的变革,也是一种技术层面的变革。而且,我从未觉得这种体验是被强行推销给我的。
前几天我拿着手机打电话——就像这样(对在线观众,我现在把手机贴在脸侧)。在此之前,我一直觉得这是很正常的做法。但我的孩子说:“你居然把手机贴在脸上?”那种语气,就好像我在舔手机一样。小孩子们打电话的方式完全不一样。我从没觉得自己这种方式奇怪,直到那一刻。然后我心里冒出一句:“天啊,我真老了。”
你会意识到,孩子们在完全不同的技术环境中长大,从来没见过拨号电话。他们和技术的交互方式天然不同。如今的年轻人会在一个理所当然的世界里长大:当然计算机能理解我说话里的细微差别和讽刺语气,当然我有一个个人 AI agent,能替我做下一次旅行的研究。
我觉得我们甚至还没想清楚这种代际差异带来的二级、三级影响。就像我孩子觉得我把手机贴在脸边很奇怪,这仍然让我很费解。但我相信,我们正站在一个极其重大的趋势起点。某种程度上我很乐观,尽管我和许多人一样,也读过《焦虑的一代》(The Anxious Generation),我自己也会因为盯着口袋里那块发光的屏幕而有点上瘾。你会想,如果快进四五年,软件会不会“融化”进背景中?很多繁琐的事——比如等待接通电话、找不到客服电话号码——会不会被这类技术彻底解决?
那时可能会是这样的:“随时打给我们吧。” 系统会知道我所有的情况:如果我在地铁上,不想让别人听到,就通过文字聊天;如果我手上拿着东西,就选择语音。这一切都会自动可用。
所以我对这一趋势很兴奋。就像所有的技术演进一样,我们现在可能还在马斯洛需求层次的底层,很难想象到达“自我实现”的顶端是什么样子。但我相信我们会很快走到那一步。我们在 Sierra 的愿景,是帮助世界上每一家公司应对这种转变。
第一步是为客户创造一种卓越的服务体验,让他们感到被尊重、被重视,而且是个性化的。
第二步是让公司能够应对未来的不确定性。比如,会话式商业意味着什么?当人们在 OpenAI 上做消费研究而不是用搜索引擎时,这意味着什么?
我相信很多人已经这样做过了。比如你拿到一份实验室检查结果,我会第一时间把它上传到 ChatGPT,在和医生交谈之前先看看结果。我不知道医生对此会作何感想,但我敢保证,他的其他病人 100% 也在这么做。整个世界都在改变。所以我们在 Sierra 想的很多问题就是:如何帮助每一家公司在这种新世界里获得成功。
6.Agent真正的技术秘方,不在于预训练
Alex Heath:
从技术层面来说,你们会自己开发模型吗?你们真正的技术“秘方”是什么?是模型,还是别的东西?
Bret Taylor:
我们做了很多微调,但我们不会自己预训练模型。我认为大多数应用型 AI 公司都不该做预训练。模型是一种快速升值的资产,但投入巨大,对股东来说回报未必可观,同时也极其复杂。比如我们平台上的某个 agent,要生成一条回复,背后可能会触发 20 多次推理调用。这能让你体会到复杂度:系统里有很多不同的模型,不是单一的供应商,也不是固定的参数规模(参数量只是衡量模型复杂度的指标之一)。
我觉得应用型 AI 公司未来的走向,就有点像当年大家在问:“数据应该怎么存储?” 对在座的技术人员来说,市面上有数以万计的数据库和存储系统,从 Snowflake、Databricks 到传统事务型数据库。今天,一个现代的技术人已经会根据具体场景来选择最合适的工具。
应用型 AI 的发展方向也是这样,不是通用人工智能(AGI),而是把模型当作真正的基础设施。有时你需要最快的,有时你需要最便宜的,有时你需要最优质的。这个价格、性能、延迟的选择矩阵里,总能找到对应业务需求的选项。
我认为它最终会变得像数据库市场一样。真正的实践者是构建这些 agent 和应用的开发者,而不是那些懂得如何预训练模型的研究员。我的直觉是,随着上下文窗口不断增大、模型对规则的遵循能力增强,连微调的重要性都会逐渐下降。未来,基于模型构建应用的门槛,可能就像今天“你懂怎么用数据库吗?”而不是“你懂怎么写数据库吗?”。这两种技能完全不同,而应用型 AI 正在走向这种格局。
7.GPT-5绝对是质的飞跃
Alex Heath:
我们在 GPT-5 发布时看到,模型确实还在变好,但性能提升不像以前那样“跨越式”了。也许随着领域加速会有所不同?
Bret Taylor:
我不完全同意你的说法,不过我打断你了,你先把问题说完。
Alex Heath:
你当然不该同意,你还是 OpenAI 的董事呢(笑)。不过我的意思是,你是否认同这样一个观点:模型本身正在逐渐商品化?你之前也把它们称为“基础设施”。如果这是真的,二阶效应会是什么?是不是意味着模型最终会变成“即插即用”,
当然会有一些差异化特性,但不像过去那样带来剧烈的性能飞跃?
Bret Taylor:
我刚才不同意,其实不是因为我“护 OpenAI”,虽然我确实是(笑),而是因为我觉得这很依赖具体任务。比如,如果有人用过 GPT-4.0 或 4.1 来写代码,然后换成 GPT-5,你会看到性能上非常明显的跃升。
所以从编码这个任务的角度看,它绝对是一个跨越式的改进。对于正在构建编码 agent 的人来说,你刚才的说法并不成立,GPT-5 确实是质的飞跃。今年我还用 ChatGPT(4)帮我计划了一次假期,体验挺好。如果换成 GPT-5,结果可能就是“嗯,好吧,好像更好一点”,但我本来就过了个很棒的假期,所以也许我的期望没那么高。也可能结果会好很多。
我觉得我们正在进入这样一个阶段:对很多任务来说,模型的智能已经“够用”了。所以新模型出来时,如果你衡量的标准是“帮我规划假期”,你会觉得提升不大。但如果是做药物研发、发现新的疗法,或者要自主编写复杂软件,或处理复杂的异步 agent 任务,那你对“跨越式改进”的感受就完全不同。
所以我的直觉是——仅代表我个人,人们对“模型到底提升了多少”的感知,会越来越取决于他们要解决的问题的复杂度。
Bret Taylor:
如果你想想构建通用人工智能(AGI)意味着什么,其实我们还需要更多进步。OpenAI 的一位研究员 [Sebastien Bubeck] 在 X 上发了一条很有意思的帖子,他给模型一篇数学论文,模型居然提出了一种相对新颖的解法,涉及一种我完全不懂的数学分支。这已经超出了我能评价的范围,但它真的很有趣,很有创造性,甚至有点像 AlphaGo 那种“啊哈时刻”——居然能推导出一种全新的数学思路。
毫无疑问,如果我们要走到能自主推进 AI 研究、发现新药疗法、解决一些悬而未决的数学难题的阶段,还需要大量工作。我们还没到那一步。
但我猜你的评论可能是出于另一种动机:在很多任务上,这些模型已经足够用了。回到你的问题,这意味着什么?我认为 OpenAI 是一个使命驱动型公司。我们的使命是确保通用人工智能造福全人类,我们要朝着有益的 AGI 努力,但我们还没达到。我们需要持续推进研发。某些方面它们已经“超智能”了,但更多方面还远远不够。这正是我们努力的方向。
这是不是意味着对 Sierra 要解决的任务,或者在你个人生活里要做的事,我们需要那种超强大的模型?未必。我觉得最终会形成一个多模型的生态,每个模型都有它最合适的用武之地。但让我兴奋的是,就在旧金山这片土地上,我们还没走到终点。我们要创造 AGI,这本身就足够让人激动。
尽管有人觉得模型的进步速度在放缓,但我不太认同。从一些真正的研究突破来看,比如数学奥赛的成绩,这是之前的模型完全无法达到的全新高度,我认为这非常令人振奋。
8.三年前我心中的AGI已经实现了
Alex Heath:
既然你提到了 AGI,我越来越觉得没人能真正说清楚 AGI 的定义。但作为 OpenAI 的董事长,你对 AGI 的理解就显得尤为重要。我很想知道你认为 AGI 的含义是什么?过去一年里你的看法有变化吗?你有没有一个明确的判断:当我们达到某个标准时,AGI 就算实现了?
Bret Taylor:
先回答最后一个问题:有变化。三年前我心目中的 AGI,现在其实已经实现了。事实上,我觉得全世界绝大多数人在三年前设想的 AGI,现在都已经出现了。比如图灵测试。说实话我不记得论文里的原始定义是什么,但在计算机科学课上,它被教作:与 AI 对话时,它的回答和人类几乎无法区分。这个关口我们早就跨过了。图灵测试曾经在 AI 领域非常重要,但我们已经超越它好多年了。坦率地讲,那是这位史上最聪明的计算机科学家提出的一个糟糕主意。
我们不断“移动球门线”,因为技术一次次超出了我们的预期。很多我们直觉认为的“AGI”,早就被突破了四五次。我现在的理解(以后可能还会变)是:在数字技术与思想的领域,这些模型是否在大多数领域已经达到或超越了人类智能?我特别强调“数字与思想领域”,因为比如发明一种新数学,这是很多人认为属于 AGI 或超智能的范畴;但与物理世界交互则是另一回事,那与智能本身无关。比如你可以发明一种新疗法,但临床试验完全是另一套流程。所以我在意的,是衡量“智能”这一部分。
AGI 中另一个字母 G 代表“通用性”。我和很多研究人员讨论过,有些人认为如果一个模型在数学上表现极佳,它也会在很多其他任务上也会表现出色,因为数学是推理的基础。但也有人怀疑,它能不能迁移到生物学等完全不同的领域?
我更倾向于认为,如果某项能力(比如数学奥赛水平)不是专门训练的,而是模型整体能力的副产品,那它就具备良好的泛化性。但我们还需要观察,看看它是否真的能迁移到科学的其他分支。不过就进展速度和研究成果来看,我越来越乐观。我甚至期待第一项真正由 AGI 主导的科学突破。我觉得可能就在未来几年,虽然说不准,但感觉很快就会发生。当然,这个问题更该去问 OpenAI 的研究员。不过从一些早期迹象来看,它真的越来越可能。
9.超级智能是“换口号”
Alex Heath:
为什么像你之前的老板 Mark Zuckerberg 这样的人,现在在谈论“超级智能”?这里硅谷和旧金山到处都在说这个词。是不是因为大家觉得,“图灵测试过了,那我们干脆升级个名号”?
Bret Taylor:
(笑)是的,可以说是一种“换品牌”。
Alex Heath:
换个名号?所以区别到底是什么?老实说,我不是很明白。
Bret Taylor:
“超级智能”,我觉得字面上就是比人类更聪明。所以如果要细分的话,假如你造出了一个在各方面都和你我一样聪明、一样好用的通用智能,那是不是显得有点“平庸”?(无意冒犯你啊,Alex。)我觉得要是我们能做到这一点,本身就很了不起了。对我来说,你已经够聪明了。
所以我认为“超级智能”代表的是一个更高的门槛,真正意义上超凡的智能。从研究和安全角度看,讨论超级智能是有意义的:一旦模型超越了人类的推理能力,我们该如何监控?如何确保它的安全?这时候必须用技术来监控技术。如果它的能力已经超过了人类,那只有靠另一层技术来监督。这在非 AI 的领域也有先例,比如飞机和汽车里有很多监控系统,用来捕捉人类无法感知或处理过快的情况。这就是一个非常重要的研究方向。
所以我觉得谈论它是有价值的。至于公关层面的用语,我没什么意见,也不太关心。但在安全层面,这是一个核心问题:如果你无法理解它,怎么确认它和人类的价值观一致?更重要的是,这种“理解”必须来自人类,还是可以来自我们专门设计的“监督 AI”?这其中有很多技术与哲学层面的问题,需要我们在发展过程中去回答。
10.AI泡沫就像当年的互联网泡沫
我最近和 Sam(Sam Altman)一起吃过一顿饭。那顿饭后来被报道得很热,因为 Sam 说他觉得我们现在正处于一个 AI 泡沫里。他的原话是:“一定会有人亏掉一大笔钱,我们不知道是谁。同时,也会有人赚到一大笔钱。”
Alex Heath:
这听上去像经典的营销圈段子。
Bret Taylor:
嗯?
Alex Heath:
“我的营销预算里,只有 50% 有效。”
Bret Taylor:
哪 50%?
Alex Heath:
我也不知道是哪 50%。
Bret Taylor:
(笑)对。你问我同不同意?当然同意。我之前打过比方,Alex,如果你听过的话请见谅:我觉得现在的情况和当年的互联网泡沫有很多相似之处。很多人只记得 Pets.com、Webvan 这样的失败案例。但如果从 30 年的视角来看,互联网其实孕育了全球最大的一批公司,比如亚马逊和谷歌。再看看微软,它如今市值的很大一部分来自云业务等新兴领域。要是你从全球 GDP 的角度去衡量互联网的影响,其实当年 1999 年那些“过度乐观”的人,也并不算错。
即便是 Webvan 这样的案例,后来随着互联网基础设施和智能手机普及,出现了 Instacart、DoorDash 这样的成熟公司。换句话说,很多点子本身并不差,只是时机太早了。
如果你在亚马逊 IPO 时就买了股票,现在的回报相当不错;但如果你买的是 Webvan,那感受就完全不同了。两种结果同时存在。而今天的大模型和现代 AI 技术,光是放在软件工程和客户服务这两个场景里,就足以对经济产生巨大影响。
你看,世界上从来没有过“软件工程师足够多”的局面。但随着代码智能体的出现,这可能会改变。因为我们正在把一种稀缺资源(软件开发能力)变得更加充裕。那软件开发的市场规模到底是多少?我不知道,甚至没法衡量,因为今天几乎每家公司都在某种意义上是软件公司。
所以我觉得,结果几乎是必然的:一定会有巨大的赢家。经济机会在那里,自然会吸引大量投资,而有些公司会失败,有些会成功。就像当年铺设光纤的公司,很多最后破产了,但光纤网络依然被后来的企业、私募基金或其他买家利用起来。
所以我认为两件事可以同时成立:AI 一定会改变经济格局,它会像互联网一样创造巨大的经济价值;但同时我们确实也处在一个泡沫期,会有人赔掉大量资金。这两者在历史上都有充分的先例。
11.AI的泡沫远比麻省理工报道的严重
Alex Heath:
你会担心泡沫恰好发生在你所在的 AI 企业级市场吗?麻省理工不是刚有个报告吗,说很多企业在 AI 上的投入并没产生回报。我知道你们的定价模式是基于效果的,但看起来不少企业砸了钱,却没得到想要的结果。如果这种情况反转,会怎样?
图片
Bret Taylor:
我会把“担不担心”跟那份研究报告分开说。我确实担心,但不是因为那份研究报告,我不太同意它的结论。所以我会先说说我的担心,再回到报告,因为报告本身其实比我的担忧更乐观一些。
你知道,有个关于我重写 Google Maps 的故事,外界传得挺多。大体是真的,只是像所有好故事一样被添油加醋了些。大家喜欢讲这个故事,因为它听起来很厉害:“一个人周末写了一堆代码。”可现在你用过 Codex 或 Claude Code,你就会想:“哦,我完全可以让 AI 智能体在周末帮我写完。”
所以曾经让人惊叹的事,甚至是我个人身份的一部分,很快就会变成 AI 智能体的日常操作。也许现在还不行——我写的代码还是挺不错的(笑)。但两三年后?完全没问题。所以过去会被说“哇,好厉害”,未来会变成“居然以前是人干的?”
从商业角度看,那未来的软件市场会是什么样?这是个非常好的问题。因为当你顺着这个线索往下想,就会发现很多东西可能会到达瓶颈。比如自动驾驶,大家当年非常兴奋,但事实证明需要的时间远比预期长。所以即便是聪明人,也会在这些事上判断过于乐观。
可一旦 AI 智能体真的能做软件开发,那就是把最稀缺、薪酬最高的工作之一交给了 AI。这会带来什么结果?很多人问我:“那我还要不要学计算机科学?”我的答案是“要”,但老实讲,没有人真的知道未来会怎样。
Alex Heath:
我们会不会进入这样一个世界:软件生成(大多数软件人都知道,生成其实不是软件里最难的部分),会在很大程度上变成一种商品化的东西?也许会。很多人是这么认为的。那么这对软件市场意味着什么?我的假设其实是,它不会带来太大改变。当你买一个 ERP 系统时,你真正买的并不是那些 0 和 1。你买的是这样的事实:很多公司把他们的账本放在上面,你可以每个季度顺利结账,它很可靠,服务器会有补丁更新,确保你的云 ERP 系统不会出现安全漏洞,它还有各种合规认证和其他并不令人兴奋,但却是企业软件中既无聊又重要的部分。
如果你是一家大型 CPG(消费品包装)公司,能自己写一个 ERP 系统,这是个好主意吗?我并不完全相信。 我一直喜欢说,软件就像草坪,你必须打理它。所以如果你自己写了,就等于买下了它,对吧?你必须拥有、维护、处理它的一切。比如有新的会计准则出来了,那你就得自己去更新。所以我认为软件生成会改变我们写软件的方式,但会不会彻底颠覆企业软件市场的存在格局?我并不完全相信。也许我错了。
12.企业要的不是自己写软件,而是解决方案
Bret Taylor:
这其实很新。我们正进入一个全新的世界,因为我们把稀缺的东西变得充足。我最近常常想到一部电影,也推荐大家去看,就是《隐藏人物》(Hidden Figures)。这是一部关于登月的伟大电影,但特别关注的是那些做数学计算的女性们,她们当时的职位叫“计算机”。我是一个计算机。我看这部电影之前并不知道“计算机”原来是一个工作岗位,我还和我的孩子们一起看了。
有趣的是,其中一位女性看到 NASA 引进了一台 IBM 计算机,占满了一个客厅,她非常机灵地去学习如何用打孔卡编程,本质上是为了保住工作。我们现在其实也都在经历这样的时刻。就像“我是计算机”。我刚才讲 Google Maps 的故事,其实也就是一个计算器的故事。
但二阶、三阶效应还比较模糊。我相信企业软件市场会从“软件”转向“智能体”,但我相信公司想买的还是“问题的解决方案”,而不是自己去写软件。所以我认为这个市场会继续存在。
至于那项研究,我不太清楚数据基础,但我觉得问题在于它把“企业自己写软件”与“购买现成的 AI 解决方案”混为一谈了。这其实是两种完全不同的 AI 采用方式。我们和客户做的基本上是 100% 成功率——从概念验证到平台上线。而我认为原因在于,我们卖的不是 AI,而是客户体验。你一打开就能用。
在旧金山有一家很棒的公司叫 Harvey,我其实不知道总部在哪儿,但它真的很不错。我和很多律师事务所聊过,他们部署 Harvey 做法律分析,全都很成功。但这不是一个“AI 项目”。Harvey 的确用了 AI,这是它能存在的唯一原因。但客户买的不是“AI”,而是更好的反垄断审查流程,这就是他们想要的东西。
13.现在的AI市场:多是表演性项目
要么等,有么自己做
Bret Taylor:
我觉得我们现在还处在 AI 的早期阶段。你还没办法在市场上为你业务的每个问题都找到一个完美的供应商。所以结果就是:要么等,要么自己做。我不知道哪个是对的。但当你试图自己做时,复杂度简直是“冰川级”的。于是现在市场上有很多我称之为“AI 观光”的东西,即,大家做一些表演性的 AI 项目,但真正把它推进到最后一公里是非常难的。我认为最终的解决方案会是应用型 AI 公司。比如说,如果你想打造更好的客户体验,那就买 Sierra;如果你想要法律智能体,那就买 Harvey。
我认为我们需要把所有的应用场景都过一遍,从供应链优化到会计,再到你会计部门的审计员,这些都会是 AI 智能体。但我相信每一个垂直领域都会有一家公司来做,而这才是打包和购买 AI 软件的正确方式。我觉得那项研究反映的,其实就是市场不够成熟——很多领域还没有现成的解决方案。但今天现场有一些风投朋友,希望几年后多亏你们,这些公司会逐渐出现。而我相信,这些新的智能体公司会成为企业业务解决方案的下一个前沿,就像当年的 SaaS 一样。
Alex Heath:
好的,Bret,我们就到这里。非常感谢。
Bret Taylor:
谢谢邀请我来。
参考链接:
本文转载自51CTO技术栈,作者:云昭
