算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户

发布于 2025-8-21 09:50
浏览
0收藏

编辑 | 伊风

出品 | 51CTO技术栈(微信号:blog51cto)

Claude Code 为什么能在市场上战胜 Cursor?

对于创业者来说,如何在 API 之上构建自己的产品,又不担心被大模型干掉?

在最新一期播客里,Anthropic 联合创始人 Tom Brown 分享了 Claude Code 的成长故事。

算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户-AI.x社区

这款最初只是工程师 Boris Cherny 为了方便自己和团队写的内部工具,如今却成长为一款年化营收约 4 亿美元的 AI 编程明星。

“我们的转折点在于:把 Claude 本身当作用户来设计工具。就像我早期做社交应用 Grouper 时,用户是纽约的年轻单身群体;现在的用户是开发者,同时也是 Claude 自己。”

Tom 总结说,Claude Code 和 MCP 的成功,都源于这种“模型中心化”的视角

这是一个值得AI创业者深挖的方向:为模型作为“用户”去开发工具。

从本质上看,Claude Code 是在赋能模型,让 Claude 成为一个靠谱的“结对编程伙伴”或“初级工程师”。

而如果放眼整个商业社会,编程只是无数任务的一小部分。未来,如何去“教练”Claude 或其他模型,帮它们胜任更多企业工作场景,依然有着巨大的空间。

算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户-AI.x社区

除了讲述 Claude Code 的起源,Tom 还分享了许多幕后故事:

  • 自学六个月转向AI研究:作为GPT-3团队的AI老将,Tom自曝线性代数才得了AC+,靠着六个月的AI自学计划,他主动私信总裁哥Greg表示愿从打杂做起,最后成功入职了OpenAI 工作。
  • 坚决不搞刷榜:不同于其他AI实验室,Claude 没有专门给“基准测试”刷分的团队。他们注重的是在内部基准上的进步,但这些benchmark不会对外发布。
  • 算力扩张:Anthropic正处在人类史上最大规模的基础设施建设进程中,算力投入几乎每年增长 3 倍。
  • 人格设计:团队希望 Claude 成为一个“优秀的世界旅行者”,能和不同背景的人交流,让对话对象都觉得愉快。
  • 文化根基:Anthropic 已扩张至 2000 名员工,却依旧高效、少“政治内耗”,关键在于最初 100 名员工都因使命而来。

以下是经过整理的播客内容,enjoy:

1.不做大厂螺丝钉,去创业公司当一只“狼”

主持人Garry Tan

欢迎回到《The Light Cone》的新一期。今天我们请到一位特别的嘉宾——Anthropic 联合创始人 Tom Brown。

联创Tom Brown

很高兴能来。

主持人Garry Tan

Tom,很多观众都想知道,你 21 岁刚从 MIT 毕业就进入科技行业。怎么从 2009 年的那个起点,一路走到今天,参与到像 Anthropic 这样重要的公司?

联创Tom Brown

2009 年夏天,我的两个朋友创建了 Linked Language。他们当时看到我们另一位朋友 Kyle 做了一家 YC 公司,所以觉得这是可以尝试的路径。他们先开始了,我当时是第一个员工。你们那会儿也让我一起参加晚餐啥的。我本来也可以去大厂当软件工程师,可能那样会学到更多纯粹的工程技能。但选择加入创业公司,没有人告诉你该做什么,我们必须自己去摸索——否则公司会“自然死亡”。

在学校时,我的感觉是有人分配任务,我去完成,就像小狗等着有人把食物放进碗里。而在那家公司,更像是一群狼——必须自己去猎食,否则孩子们会饿死。我觉得这种心态的转变,是我尝试去做更大、更激动人心事情时最宝贵的财富。

主持人Garry Tan

是啊,大公司只会教你如何在大公司工作,而做“狼”要有意思多了。

联创Tom Brown

对。

主持人Harj Taggar

那你是怎么从在朋友创业公司工作,到自己开创公司呢?

联创Tom Brown

Linked 后来我们运营了一阵,我又回去读书。之后离开学校时加入了一家叫 Mopo 的公司。

主持人Harj Taggar

是做广告的。

联创Tom Brown

对,我是第一位工程师。我那时很想当一只“狼”,但编程水平其实很挣扎。我知道自己想做更多事,但不知道怎么做。那段经历算是让我见识了怎么把东西做规模化。

 2012 年冬天,我大学里最聪明的一个朋友拉我一起去做 YC 公司。我们当时做的是 Solid Stage,那是在 Docker 出现之前,目标是简化 DevOps。说白了就是做一个比 Heroku 更灵活的东西——但其实就意味着更复杂的 Heroku。我记得我们来你们这儿面试时,评审们其实也不太明白我们要做啥,说实话我们自己也没完全搞明白。

主持人Garry Tan

在尝试新事物时,这其实很常见。

联创Tom Brown

对,但我们算是比较特殊。面完试后我们开车回旧金山时,TLB 在白板上写了一个愤怒的皱眉表情,还问:你们到底要做什么?于是我们又去解释。也许我们解释得还行,或者他觉得我们虽然还不懂,但可能会慢慢搞明白。只是做到一半,我还是觉得不清楚我们到底要造什么,以及怎么把使命和它绑定起来,所以最后我选择离开。PG 把我介绍给了 Michael Waxman。

主持人Harj Taggar

他是 Grouper 的创始人之一。

主持人Garry Tan

对,Grouper 是个交友应用,但很特别——不是一对一,而是“三男三女”组队。这还是在 AI 兴起前,匹配完全靠人工。大家见面去酒吧,结果就很热闹。

联创Tom Brown

对,总会闹出动静,但不一定每次都开心。我自己上过几次组。Grouper 吸引我的原因很个人:我以前是个非常社恐的孩子,我想要一个方式,能让我和朋友一起去社交,尤其是能和女生说话,而且是安全的氛围。那时招聘员工也很关键,我负责所有工程面试。顺便说一下,唯一比我去 Grouper 还频繁的人是 Greg Brockman。他当时好像每周都去一次,还会在 Slack 或 HipChat 上发帖。

主持人Harj Taggar

那时候他常常在外面跑吧?

联创Tom Brown

是的,他那会儿在 Stripe,也可能在 Recur,但他确实有个阶段,每周都会发“我又去 Grouper 了”。所以我和 Greg 关系变近,这后来成了我和 OpenAI 的联系点。

2.转型做AI,进OpenAI九个月都没碰机器学习

主持人Diana Hu

所以,你从 MIT CS 毕业后,21 岁起步,一路在这些 YC 公司当早期员工,后来自己创业,几年后又加入新公司。能不能说说最后是怎么走到 Anthropic 的?这条路径很长,但也很厉害。

主持人Garry Tan

听起来跟 Greg 的那次结识是个关键节点。后来你成了 OpenAI 前二十几个员工之一,对吧?

联创Tom Brown

是的。我 2014 年 6 月离开 Grouper,大约一年后加入了 OpenAI。

我当时鼓起勇气想要转型,尝试去学习 AI 研究。我觉得,也许在我们有生之年会诞生“变革性的 AI”,如果真发生了,那将是最重要的事。或许我也能帮上点忙。但另一方面,我大学线性代数才拿了个 AB-,所以当时觉得,能参与 AI 研究的人必须是顶尖天才,我很不确定自己到底能不能帮上什么忙。加上我在创业上也算有些成功,所以内心也常想:与其重新学习,不如再去做一家创业公司算了。

主持人Harj Taggar

我感觉在那个时期,去做 AI 研究并不被视为一件“严肃的事”。当时大家都在创业、做一些非常务实的东西。你的朋友们会觉得“哇,很酷啊,你要去搞 AI”吗?

联创Tom Brown

其实不是,我的朋友们大多觉得“听上去很奇怪,甚至不太好”。就像他们觉得“AI 安全”听起来不靠谱,差不多等于“火星人口过剩”那种话题。他们也怀疑我能不能胜任。所以那段时间我一直摇摆不定,差不多花了六个月才鼓起勇气。

主持人Harj Taggar

那你当时具体在做什么?比如说,你在读研究论文吗?

联创Tom Brown

是啊,最开始其实我只是闲逛。我还搞了辆艺术车,参加了 Burning Man(“泰坦尼克号”主题车)。

对,那段时间我花了一个夏天,大概三个月。因为在 Grouper 后期,我已经非常疲惫了。创业公司的高潮很高,但低谷也很低。我们业务不成功,营收在下滑,但我的主要工作还是招聘工程师——让我推销一个我自己都不再相信的愿景。

主持人Garry Tan

听起来就像“死亡行军”。

联创Tom Brown

是的,所以我真的身心俱疲。于是我告诉自己:“Tom,放松一下,去练练瑜伽,做点 CrossFit,造辆艺术车。”

主持人Garry Tan

那回头看 Grouper,你会怎么总结?当时吸引了那么多聪明人,一开始增长很快,但后来停滞甚至下滑,到底出了什么问题?

联创Tom Brown

我觉得一开始,我们的竞争对手是 OkCupid。

主持人Garry Tan

全都是网页版。

联创Tom Brown

对,都是网页式的。我们要解决的主要问题是:主动去和陌生人搭话很难,很可能被拒绝,被认为奇怪。我们通过“盲配”来解决这个问题。但在 Grouper 运营期间,Tinder 出现了。Tinder 解决了同样的问题,但方式更好:双方都要先表示有兴趣,才会匹配,这样就不用担心被拒绝了。那确实是一个更好的解决方案。Tinder 做得很棒,“刷屏党”们也做得很棒,他们比我们更好地解决了我们试图解决的那个问题。

主持人Harj Taggar

那你后来是什么时候,真正认真对待 AI 的?

联创Tom Brown

我大概玩了三个月,做些有趣的事,然后钱也花完了,生活费不够了。我想,要想有机会拿到 AI 相关的工作,至少需要六个月的自学。那时候能去的地方就是 DeepMind、Google Brain,还有 MIRI。这三个是我考虑的目标。但我完全没有技能,所以我给自己定了六个月自学的计划,不想成为团队的拖累,而是能真正帮上忙。

主持人Diana Hu

那你能具体说说自学的过程吗?因为现在也有很多 20 多岁的软件工程师想转型做 AI 研究。那六个月你是怎么安排的?毕竟你之前说过线性代数才 AB-。

联创Tom Brown

可能是 AC+ 吧(笑)。

主持人Diana Hu

那也挺不错的。

联创Tom Brown

最后结果还行。我先接了 Twitch 的合同工,赚到够支撑六个月的资金。做了三个月合同工之后,我就开始计划自学。我不觉得这套方法现在还合适,但在 2015 年,大概是这样:先上一门 Coursera 的机器学习课程,尝试做一些 Kaggle 项目,读《Linear Algebra Done Right》,还准备了一本统计学教材。那时候 YC 校友有优惠,我就买了张 GPU 卡,然后远程 SSH 上去跑这些课程。

主持人Diana Hu

这已经是在 AlexNet 之后了吧?

联创Tom Brown

对,AlexNet 之后。所以我主要学的是图像分类,基本就是课程会教的那些内容。

主持人Diana Hu

那你是怎么拿到 OpenAI 的工作的?毕竟当时大多数都是研究员,团队很强,而你是少数工程师之一。

联创Tom Brown

OpenAI 一宣布成立,我就给 Greg 发消息说:“我很想帮忙。虽然线性代数才 AB-,但我有一些工程经验,做过分布式系统。如果需要的话,我甚至可以打杂。我只想参与。” Greg 回我说:“是的,目前懂机器学习又懂分布式系统的人才太少了(他还用了个词 paucity,挺高大上的),你正好合适。”

他还把我介绍给 Peter Abbeel,帮我制定了一些学习计划。我大概每个月都和 Greg 联系一下。几个月后,他说:“我们有个项目,需要做一个 StarCraft 环境。”于是我就加入帮忙搭建 StarCraft 环境。基本上我在 OpenAI 的前九个月都没有做机器学习的工作。

主持人Harj Taggar

那当时的 OpenAI 是什么样的?拿到融资了吗?有办公室吗?感觉更像是创业公司吗?

联创Tom Brown

所以当时是在 Dandelion Chocolate 工厂楼上的办公室。那是在 Greg 公寓之后。

主持人Diana Hu

对,Greg 公寓之后。

联创Tom Brown

对,就在 Greg 公寓之后,搬到巧克力工厂那边。那时 OpenAI 启动,Elon 已经承诺了 10 亿美元的资金,感觉非常稳。

3.参与训练 GPT-3狂堆算力,全力押中Scaling Law

主持人Diana Hu

对你来说,另一个重要的里程碑是参与构建 GPT 的训练工程。

联创Tom Brown

是的。

主持人Diana Hu

能具体说说吗?GPT-2 的突破点是用 GPU 训练,而 GPT-3 的关键是“用更多算力+GPU 扩展规模”。

联创Tom Brown

没错。我在 OpenAI 干了一年后离开,去 Google Brain 干了一年,再回到 OpenAI。2018 到 2019 年,就是 GPT-3 的酝酿期,正如你说的,核心就是扩大规模。我记得 Dario 当时已经看到了“Scaling Law(规模定律)”的大趋势。

主持人Diana Hu

你们还发表了那篇论文,对吧?那篇论文后来被证明非常有分量。

联创Tom Brown

是的。当时最打动我的,就是这条直线:只要用对配方,花更多算力,就能得到更强的智能。那让我觉得:这不是未来的事,而是正在发生的事。即便那时我们花的钱并不算多,但趋势已经很清楚了。同时,Jared Kaplan 和 Sam McCandlish 的论文也显示,算法效率的提升会让成本不断下降。这两方面叠加,我当时的想法就是:未来几年智能会大幅提升。

主持人Garry Tan

当时看到这一点,确实很惊讶吧。

联创Tom Brown

对。我不是物理学家,但当时那些物理学家做出的那条“直线”,横跨 12 个数量级。我从没见过任何现象能跨 12 个数量级还这么稳定。这让我彻底相信必须把工作重心转向 Scaling。

主持人Garry Tan

我问个外行问题:这种“规模定律”,是不是可能在很多领域都会出现?比如还有 2 个、5 个、1 万个领域,我们只是还没投入?

联创Tom Brown

在物理学里,规模定律到处都是。当时我并不知道,但后来才知道,物理学有个叫“现象学(Phenomenology)”的领域,就是在不同场景里拟合这些规律,他们发现幂律分布无处不在。而这大概是我第一次在计算机科学相关的研究里看到类似的规律,所以让我既惊讶又兴奋。

主持人Garry Tan

当时也有人很反对,觉得就是在浪费钱,往 GPU 里砸钱。

联创Tom Brown

对,当时很多研究人员也不满,觉得不够优雅,只是“蛮力叠层数”。但我觉得这反而就是 Anthropic 的口号:去做那个笨但有效的事(do the stupid thing that works)。而 Scaling 当时就是这样一个“笨但有效”的方案。

4.直到 Claude 3.5上线,才意识到公司做成了

主持人Diana Hu

那你怎么收集最后一颗“无限宝石”的?就是加入 Anthropic。

联创Tom Brown

对,Anthropic。

主持人Diana Hu

全世界其实没几个人在 OpenAI、DeepMind 和 Anthropic 都工作过。你们是 GPT-3 团队分裂出来的一部分,最后创办了 Anthropic。这个转折是怎么发生的?

联创Tom Brown

当时有两个团队,分别是安全组(safety org)和规模组(scaling org),都向 Dario 和 Daniela 汇报。

我们彼此的合作非常默契。当时在 OpenAI 和后来 Anthropic,有一点我特别喜欢:我们要求一切沟通都在 Slack 上,公开频道,透明沟通。而且这个团队是最认真对待 Scaling Law 的人。他们意识到这将是“变革性的 AI”,未来人类迟早要把控制权交给这种系统。最好是它能和人类对齐,过渡顺利,但也可能不顺利,风险极大。所以我们觉得必须严肃对待,要建立一个能承担这种责任的机构。

最后正是这批人成为了 Anthropic 的核心。坦白说,当时我并不确定这是对世界最正确的选择。但现在回头看,这确实是个好决定。有趣的是,刚起步时我们一点也不像会成功。OpenAI 有 10 亿美元和明星团队,而我们只有 7 个联合创始人,在疫情期间硬撑着做事,不知道产品能不能做出来。但吸引我的一点是,最初加入的人全都是奔着使命来的。他们本可以去更有名、更赚钱的地方。

主持人Harj Taggar

保持开放?

联创Tom Brown

没错,正是这种使命感,成为我们文化的核心。如今 Anthropic 已经有 2000 人了,但依然没被政治内耗侵蚀。我认为关键就在于,前 100 个人都是为了使命而来。如果有什么偏离使命的迹象,他们会第一时间站出来提醒。

主持人Jared Friedman

说回 Anthropic 的早期吧。你们七个人从 OpenAI 出走,大概有一个长期使命,就是“不要毁灭人类”。但在最初那一年里,你们实际上在做什么?又是怎么收敛到一个真正的产品的?

联创Tom Brown

第一年我主要做的两件事:一是搭建训练所需的基础设施,二是搞到训练模型所需的算力。这是我两个核心项目。当然,还有创业公司初期那些杂事,比如设 Brex 账户之类的。我们最初只有 7 个联合创始人,但几个月内大概有 25 个来自 OpenAI 的人陆续加入,所以很快就成了一支已经熟悉彼此合作的队伍,这让我们能更快跑起来。

主持人Jared Friedman

那你们是什么时候真正发布第一个产品?什么时候开始觉得事情在运转了?

联创Tom Brown

我们第一个产品其实是在 ChatGPT 之后。大概在 ChatGPT 发布前 9 个月,我们做了一个 Slack 版的 Claude 1。

主持人Garry Tan

对对,我记得在 YC 的 Slack 里就用过。

联创Tom Brown

对,我记得 Tom Blofield 把你们都加进去了。不过当时我们并不确定要不要把它真正当作产品发布,我们不确定这样做对世界是否是好事。那时我们对“如何产生正向影响”的理论还没想清楚。再加上,即使想发布,我们也没有相应的服务基础设施。因为拿不准,我们迟迟没去搭建那部分基础设施,这对我来说是一个教训。

主持人Garry Tan

当时 ChatGPT 还没上线。

联创Tom Brown

对,还没上线,所以我们也不知道它会掀起这么大的浪潮。

主持人Diana Hu

那是疫情期间,大概 2022 年?

联创Tom Brown

对,2022 年夏天。然后 ChatGPT 在 2022 年秋天上线,我们之后才发布 API,后来才有 Claude AI。其实直到 Claude 3.5 和编程能力出来之前,一直都不太确定我们会不会是一家真正能成功的公司。

主持人Diana Hu

我们其实在 YC 创业公司里看得很清楚。2023 年,几乎所有创业公司默认用的都是 OpenAI。但到了 2024 年情况开始转变,Claude 3.5,尤其是 Sonnet,逐渐获得市场份额,从个位数到 20%、30%。尤其在编程领域,Claude 成了默认选择,这点非常有趣。你能说说为什么在编程上会出现这种突出的表现吗?

主持人Garry Tan

现在可能已经是 80%、甚至 90% 了,编程领域甚至更高。

5.不搞刷榜:“我们完全忽略这些外部基准测试”

主持人Diana Hu

特别是 Claude Code。当时这是你们刻意布局的吗,还是自然发生的?

联创Tom Brown

我们确实在训练里投入更多,让模型在编程上表现更好。一开始只是想让模型在编程上能用。但看到外界的反响后,我们决定更大力地投入。

主持人Jared Friedman

所以在 3.5 Sonnet 之前,你们其实就已经押注了编程,等 3.5 出来有了明显的产品市场契合度,就进一步加码。

联创Tom Brown

对,这其实源于公司内部一些人很早就坚持要做编程能力。等到 3.5 Sonnet 出来后,我们终于看到了强烈的市场信号,于是更坚定了方向。

主持人Jared Friedman

那你们发布 3.5 Sonnet 的那一天,是否知道自己抓到了一个“关键转折点”?还是像 OpenAI 推出 ChatGPT 那样,也有点被它意外的爆发力吓到了?

联创Tom Brown

老实说,我们也没预料到。真希望当时能更有远见。但它的确让我们很意外。之后 3.7 Sonnet 在“代理+编程”上的表现也再次让我们吃惊。很多东西我们都是快速推出,往往不知道最终结果会怎样。

主持人Diana Hu

这其实也催生了很多基于 Sonnet 的编程代理创业公司。比如 Replica,10 个月就做到 1 亿美元规模;还有 Cursor 之类的案例。

联创Tom Brown

是的,这些都让我很意外。而且我自己在用 Claude 的时候,也常常被它的能力惊到。几乎每次新版本都会解锁出一些新能力。

比如有个朋友手上只有某个工具的编译二进制,没有源码。她问 Claude 能不能反编译。Claude 运算了 10 分钟,就生成了一个 C 语言版本,变量名都补上了。她说,自己要花三天时间才能手动对着十六进制表一点点写代码,而 Claude 一次性完成了。

所以我觉得我们还会不断被它的能力惊讶到。Claude 已经把所有十六进制表背下来了,还能尝试去推理,所以未来肯定还会出现更多让人意想不到的场景。

主持人Jared Friedman  

如果你去问 YC 的创业者们,绝大多数在编程方面更喜欢用 Anthropic 的模型。这个差距远远超出单看基准测试结果能预测的程度。

联创Tom Brown

是的。

主持人Jared Friedman

似乎有某种“X 因素”,让大家特别喜欢用 Claude 来写代码。你知道那是什么吗?是你们有意设计的,还是模型自己在黑箱里意外长出来的?

联创Tom Brown

我觉得主要原因在于基准测试(benchmarks)。基准测试很容易“刷分”。其他大实验室都有专门的团队,工作就是让模型在基准测试上拿高分。但我们没有这样的团队。我觉得这可能是最大的差别。

主持人Garry Tan

不“为考试而教”。

联创Tom Brown

对,我们不专门去训练模型刷榜。我觉得那样会带来很糟糕的激励机制。你甚至可以把这种“刷榜团队”放到市场部下面,但我们选择完全忽略这些外部基准测试。这也是为什么会出现“训练/测试不匹配”。

主持人Diana Hu

所以你们的评估更偏向内部的定性?

联创Tom Brown

我们有内部基准测试,但不会对外发布。

主持人Jared Friedman

那团队重点提升的,确实是这些内部基准?

联创Tom Brown

没错。我们团队会针对内部基准持续改进。同时还有很多实用任务,比如让我们自己的工程师提效,这是头等大事。所以我们内部会大量“自用测试”(dogfooding),确保模型真的帮到我们的人。

主持人Garry Tan 

再说回 Golden Gate Claude,大家普遍觉得 Claude 的可解释性做得不错,还有就是它的人格特质让人感觉更好。你们怎么同时做到量化评估,又能打造出这种“人格”?

联创Tom Brown  

评估“人格”确实比较难,比如怎么判断 Claude 是否“有一颗善良的心”。但这正是 Amanda Askell 团队的使命。她的描述是:Claude 要像一个“优秀的世界旅行者”,能和各种背景的人交流,每个人在对话后都觉得舒服、愉快。至于可解释性,那是一个长期下注。现在模型还不可怕,但未来会变得更强、更“吓人”,那时就必须能看懂它内部到底在做什么。

6.Claude Code 从内部走出去:“模型中心化”是成功关键

主持人Harj Taggar

最近 Claude Code 特别成功。能说说这个项目最初是怎么开始的吗?你们一开始就觉得它会成功吗?

联创Tom Brown

Claude Code 起初是 Anthropic 内部工具,目的是帮我们自己的工程师。最早是 Boris 拼凑出来的。

主持人Harj Taggar

所以是内部工程师自发做的?

联创Tom Brown

对,他为自己和其他工程师写的。我们当时完全没预料到它能在外部市场也成功。其实那时我们内部的策略是:押注 API,而不是自己做应用。因为我们觉得外面有那么多创业者,有更好的点子,比我们更懂怎么做产品,所以我们专注于把 API 打磨到最好。但 Claude Code 出乎意料,证明我们也能做出比外部产品更好的东西。我的一个看法是,这部分成功来自于心态转变:我们把 Claude 本身当成用户去设计工具,就像 Grouper 时我们的“用户”是纽约的年轻单身群体。现在的用户是开发者,但也是 Claude 本身。给 Claude 提供合适的工具和上下文,它才能真正高效工作。这个团队是最重视 Claude 作为“用户”的团队。

主持人Jared Friedman

所以你们比任何人都更懂 Claude。

联创Tom Brown

是的。但我也觉得,创业者同样能做到这一点。这是一个很值得挖掘的方向:以模型作为“用户”去开发工具。

主持人Garry Tan

这正是最典型的拟人化:把 LLM 本身视为一个利益相关方、一个用户,你需要去服务和赋能它。

联创Tom Brown

完全正确。

主持人Diana Hu

这也解释了为什么你们的 MCP(工具调用标准)能跑通。很多实验室尝试过,但最后真正跑通并被广泛采用的,是你们的。

联创Tom Brown

对,这和 Claude Code 的逻辑类似,都是“模型中心化”的思路。

主持人Harj Taggar

但 Claude Code 的成功,也让依赖 API 的创业公司有些担心,比如 Cursor。他们可能害怕被你们替代。你会给这类创业者什么建议?怎么在 API 之上建产品,同时不用过分担心 Anthropic 会做得更好?

联创Tom Brown

老实说,我也有点意外 Claude Code 能做到“市场最好”。对我来说,最大的优势可能不是技术壁垒,而是我们对 Claude 更有“共情”,更懂它需要什么。

主持人Harj Taggar

这挺有意思。也就是说,你们成功的关键在于:你们更清楚自己要服务的“用户”,而不是有什么别人做不到的技术优势。

联创Tom Brown

对,这件事创业公司同样能做。我觉得我们是最专注开发者的实验室,也是最专注 API 的实验室。我们想确保提供最好的平台,因为这个领域发展太快了,我们不可能最快想清楚所有应用场景。但人类社会是为人类设计的,我们需要让模型也能成为生产力的一部分。

主持人Harj Taggar

那你觉得目前有哪些方向是开发者可以去尝试,但还被低估的?

联创Tom Brown

Claude Code 其实就是在探索:如何让 Claude 成为一个合格的“结对编程伙伴”或“初级工程师”。它很像一个二三年级水平的工程师:能帮忙,但也需要大量上下文和引导。而在商业社会里,编程只是所有任务中的一小部分。还有很多工作,是聪明但经验不足的人会去做的。如何去“教练”Claude 或其他模型,让它们能为企业完成有用的任务,这里面有巨大的空间。

7.算力基础超阿波罗登月,每年还在涨3倍

主持人Jared Friedman

Tom,你的工作中很大一部分就是负责 Anthropic 的算力基础设施。能谈谈支撑这家庞大公司的算力基础设施长什么样吗?

联创Tom Brown

有趣的是,现在人类正处在史上最大规模的基础设施建设进程中。

主持人Jared Friedman

会比阿波罗登月计划、曼哈顿计划还要大?

联创Tom Brown

如果照现在的趋势继续下去,明年就会超过这两者。算力投入基本上是每年增长 3 倍,这太疯狂了。3 倍的年增速不可思议。我认为这种趋势会保持下去。至少明年的投入已经确定了,2027 年可能还有些不确定。

主持人Garry Tan

我们在 YC 这边也能感受到,所有顶尖前沿模型(包括 Claude)的算力点数都供不应求。大家都在喊:“给我更多智能!”

联创Tom Brown

对,怎么都不够。我知道你们也在关注更多硬件创业公司,特别是新的加速器。我觉得到 2027 年会有更多加速器上线。这是个不错的方向。同时,数据中心本身也是大问题。

主持人Jared Friedman

你们现在的瓶颈主要是什么?是电力不足?GPU 不够?还是建造许可难批?

联创Tom Brown

整体而言,电力会是最大瓶颈,尤其是在美国。我们希望在美国建数据中心,这是最重要的政策目标之一——让美国建设更多数据中心、放宽审批、简化流程。

主持人Garry Tan

那解决方案是可再生能源,还是核电?

联创Tom Brown

我觉得都需要。我希望核电建设能更容易一些。

主持人Jared Friedman

Anthropic 还是唯一一家同时使用三家不同厂商 GPU 的主要实验室。说说你们这个策略的效果?

联创Tom Brown

是的,我们用不同厂商的 GPU 和加速卡。坏处是我们的性能工程团队必须分散在这些平台上,工作量巨大。好处是灵活性:一方面,我们能吸收更多供给,不依赖单一厂商;另一方面,不同芯片更适合不同任务——有的更适合推理,有的更适合训练。我们能把合适的芯片匹配给合适的任务。这就是取舍所在。

主持人Diana Hu

有趣的是,把你职业生涯串起来看,你当年是第一个在 OpenAI 把架构从 TPU 转向 GPU 的工程师,这让 GPT-3 能规模化。如今你在 Anthropic 负责更大规模的算力布局。你自己会觉得这是种呼应吗?

联创Tom Brown

当时在 OpenAI 转向 GPU,部分原因是 PyTorch 在 GPU 上的开发体验远好于 TensorFlow 在 TPU 上的体验。这带来了快速迭代。好的软件栈能让实验加速,系统整体跑得更好。现在在 Anthropic,我们依然很重视这点。挑战在于平台更多,写好底层软件更难。但能不能构建出可靠的软件栈,决定了上层所有人是否能顺畅开发,这是最重要的。

主持人Diana Hu

那你有没有什么建议,给如今 20 多岁、正想加入 AI 浪潮的“年轻版 Tom”?

主持人Harj Taggar

对,很多大学生在纠结:要不要继续读书?未来还有没有工作?世界会怎么变?他们该怎么选择?

联创Tom Brown

我会建议,多冒点险。去做那些如果成功了,朋友会觉得特别厉害、你自己也会为之骄傲的事。这是我想对年轻的自己说的。

主持人Garry Tan

更看重内在动机,而不是外在荣誉。别去追逐那些学历、证书、进 FANG 的头衔,这些在今天其实都不那么重要。——好的,这就是今天的全部内容,下次再见。

视频地址:https://www.youtube.com/watch?v=JdT78t1Offo

本文转载自​​51CTO技术栈​​,作者:伊风

已于2025-8-21 10:07:59修改
收藏
回复
举报
回复
相关推荐