Claude Code之父爆料设计理念!“尽量简单”和“黑客性”是原则!新手甭上来就写代码!手工代码不会消失! 原创

发布于 2025-9-3 14:03
浏览
0收藏

编辑 | 伊风

刚刚,Anthropic 完成了 130 亿美元 F 轮融资!

估值一举飙升至 1830 亿美元,距离竞对 OpenAI 的 3000 亿美元大关又逼近了一步。

Claude Code之父爆料设计理念!“尽量简单”和“黑客性”是原则!新手甭上来就写代码!手工代码不会消失!-AI.x社区图片

在这条资本狂飙曲线背后,一个关键词不容忽视:Claude Code。

这款今年爆火的 AI 编程神器,已成为 Anthropic 业务增长的核心引擎。官方披露,它的年化收入已突破 5 亿美元,仅过去三个月的使用量就暴涨 10 倍。

更巧的是,融资消息刚落地,Anthropic 立刻放出了一期新播客——主角正是 Claude Code 之父 Boris Cherny。主题直指一个关键词:Agentic Coding 的未来。

这似乎已经释放出明确信号:Anthropic 正在全力押注这个方向。

Claude Code之父爆料设计理念!“尽量简单”和“黑客性”是原则!新手甭上来就写代码!手工代码不会消失!-AI.x社区图片

播客地址:https://www.youtube.com/watch?v=iF9iV4xponk

说回 Claude Code,它并非一开始就面向市场,而是 Boris 为了让自己和团队开发更高效而孵化的内部工具。

在播客里,他首次揭开了 Claude Code 的底层基因:

从最初就追求 “尽量简单” 与 “尽量可 hack”。

根据Boris的解释, “可 hack 性”指的是Claude Code具有很强的扩展能力。除了大家熟悉的 claude.md 文件、MCP外,如今还在持续增加新的扩展点,例如 hooks、slash commands 等多个方式。

Boris 还谈到了代理式编程的演进、Claude Code 的设计思路,并分享了不少实用的使用技巧。

他在对话中抛出了不少值得摘录的洞见:

1.Agent Coding这一年来最大的变化是:现在写代码,不只是靠 Tab 补全,而是让模型帮你写代码。从“直接操作文本”转向“由模型替你操作文本”,是一个大的演进趋势,抽象层还会继续上移。

2.Claude code如何从内部榨出反馈价值:为了能鼓励团队提建议,Boris给自己定了死规矩:只要有人反馈,就第一时间要修复。他说:“我经常一进办公室就连着修两三小时 bug,然后立刻在 Slack 频道回复:已修复。”

3. 展望未来,Claude Code关键在于:如何让其扩展得更容易?如何让更多人能在它之上开发?如何让 SDK 对大家更有用?这些才是下一步。

4.Claude 会成为围绕目标自主推进的智能体:“两年内,我们可能会看到 Claude 不再执行一堆小任务,而是围绕一个目标持续推进,就像一个工程师思考下个月的 road map 一样。”

5.代码本身不再像过去那样“珍贵”,尽管写代码依然是一门艺术。

6.两个建议:一是新手别直接让 Claude 写代码,先学会围绕代码库进行提问和研究;二是要先评估清楚任务的难度,再决定用哪种方式让 Claude Code 参与。

以下是经过整理的播客全文,enjoy:

1.如果Claude 是“马”,那么Claude Code 就是不可缺少的“马鞍”

主持人Alex Albert

大家好,我是 Alex,我在 Anthropic 负责公共关系。今天我们要聊的是 Claude Code 以及软件工程的未来。我身边这位是我的同事 Boris。

Boris Cherny

我是 Boris,Anthropic 技术团队成员,同时也是 Claude Code 的创建者。

主持人Alex Albert

过去 12 个月里发生了很多事情,节奏非常快,尤其是在代码领域。对那些不是每天都盯着新闻、跟进前沿的人来说,可能会有点难跟上——其实我自己有时也很难。能不能帮大家回顾一下最近发生了什么?我们现在处于什么阶段?

Boris Cherny

嗯,一年前的编程体验和今天完全不同。一年前,如果你要写代码,就是在 IDE 里,有自动补全功能,然后可能还会开个聊天应用,复制粘贴一些代码来回倒腾。这就是当时所谓的“AI 编程”最前沿的形态。

大概也是一年前,我们开始看到“代理(agents)”的出现,并且被真正地融入到开发流程里。这已经不只是个噱头或原型,而是开发过程中真正的一个“内环工具”。

我觉得这一年来最大的变化就是:现在写代码时,你会用一个智能体(agent)。你不再直接在 IDE 里编辑文本,不只是靠 Tab 补全,而是让模型帮你写代码。我们看到的趋势是:从“直接操作文本”转向“由模型替你操作文本”。我认为这是未来的发展轨迹。

主持人Alex Albert

我明白了,也就是说过去是在网页应用里复制粘贴代码、做一些很细微的修改;而现在更多是“放手”——告诉智能体你要什么,让它自己去做大量修改,甚至有时能独立生成整个应用。

Boris Cherny

对,没错。过去之所以做不到,有几个原因。大家一直都在尝试让 AI 自动化编程,但效果不佳。第一,模型本身当时还不够强大;第二,模型上层的“支架”(scaffolding)也不够好。Claude Code 最早的版本大概是去年底,我们用的还是 Sonnet 3.5,不是后来的 3.6 或 3.7。

主持人Alex Albert

就是还没升级的 Sonnet。

Boris Cherny

对,当时用起来勉强能跑,比如我大概 10% 的代码能靠它来写。印象特别深的是,有一次我把它交给核心团队测试,第二天走进办公室就看到几位工程师(包括 Robert)已经在屏幕上用它了。虽然那时模型本身还不够好,工具也比较粗糙,但居然已经有点用处了。

 过去一年,模型在“代理式编程”上变得更强大了,从 3.7 到 4.0,再到 Opus 4.1;同时“支架”——也就是 Claude Code——也进步很多。

所谓支架,就像骑马时需要马鞍。Claude 是马,而 Claude Code 就是鞍,能极大改变骑行体验。我本人不是骑马的人(笑),但这个比喻挺形象的。

主持人Alex Albert

我喜欢这个比喻。Claude 是马,工程师要把它引导到某个方向,就必须有一个“鞍”来掌控。这就是“支架”的作用,它涵盖了工具、上下文处理等等。

Boris Cherny

没错。Claude Code 就是这样的支架:它包含系统提示(system prompt)、上下文管理、工具接入、MCP 服务器、权限设置等。这些接口决定了模型能看到什么、能输出什么,从而极大影响表现。过去一年,我们逐渐学会了如何为模型设计这样的支架。

2.实际上手后的“直觉”,远比编码测评指标更直观

主持人Alex Albert

你刚提到“共同进化”,是说我们在训练时刻意这么做的吗?还是说这是个自然过程?

Boris Cherny

其实是很自然的。在 Anthropic,每个人都用 Claude Code,包括研究员。所以在用的过程中,我们会不断看到模型的限制,比如它在做某些编辑时经常失败,或者早期版本只能短时间保持“自动运转”,需要人类频繁纠偏。而新模型能更长时间保持自主运行。这些体验反馈都会反过来帮助我们改进模型。

主持人Alex Albert

在评估新模型时,你会不会有一套“直觉测试”或者固定用例?还是说你主要看新特性上线后在支架中的表现?

Boris Cherny

我个人的方法其实很直接,就是自己上手用。

主持人Alex Albert

那你的工作方式是怎样的呢?

Boris Cherny

对我来说,理想的一天就是整天写代码。不管我们在测试的新模型是什么,我都会用它写代码,看它表现如何。我没有固定的测试流程。

主持人Alex Albert

对,你就是直接看它在日常工作中对你有没有帮助?

Boris Cherny

 没错,没错。因为日常工作里会涉及各种各样的事情:写新代码、修 bug、看 Slack 消息或者 GitHub issue 回复用户反馈。现在模型能帮上越来越多的忙。如果你只让模型做某一类事,就会错过它的新能力,比如通过 MCP 拉取上下文、读 Slack 消息,或者自动调试 —— 因为它能自动获取 Sentry 日志。

主持人Alex Albert

所以最好的评估方式,某种意义上就是最接近真实使用场景的方式。直接用它,其实是最有效的评估。

Boris Cherny

对,我们在构建 Claude Code 的时候,也确实尝试做产品层面的评测。

主持人Alex Albert

嗯。

Boris Cherny

比如说,当我们修改 system prompt 或者别的设置时,就要知道模型有没有变好。我们确实有一些评测手段,但老实说,做 eval 太难了。最大的信号还是靠直觉 —— 感觉它是不是更聪明了。因为开发任务覆盖面太广。

主持人Alex Albert

是啊,开发者经常问我们,想要更多关于 prompt 测试和迭代的指导。我们在不同产品上都尝试过各种 eval,但对 Claude Code 来说,最核心的还是这个紧密的反馈循环。它比一堆硬编码的评测指标反而更直观。

Boris Cherny

我知道大家可能想听一个更“学术”的答案,但实际上,就是靠感觉。现在模型在各种 benchmark 上都表现很好,比如 SWE-bench 之类的。我们更多是在寻找更难的评测方法,比如 T-bench。只是要找到能覆盖软件工程复杂性的“合成型评测”真的很难。

主持人Alex Albert

对对。你觉得我们内部有没有做了什么特别的事,让这个反馈循环格外有效?我感觉 Claude Code 的“自用反馈(dogfooding)”循环是我见过最好的。

Boris Cherny

一开始我就是按照做其他产品的方式来做 —— 倾听用户,并且尽量让他们的反馈渠道变得简单。最初我们只建了一个 Slack 反馈频道,所有反馈都集中到那里。我还发现,有时人们其实不太愿意提反馈,因为他们觉得没人会看,反馈会消失在黑洞里。所以我当时做的一个关键点就是:只要有人提反馈,我会尽快修复。经常是一进办公室,我就花 2-3 小时集中修一堆 bug,然后立刻在频道里回复“已经修复”。这会让人们更愿意继续反馈。直到今天,Claude Code 的内部反馈频道依然是“水管爆裂”一样的信息流。

主持人Alex Albert

对,真是没停过。我记得早期(现在也一样),我一发反馈,你立刻就会用表情回应,或者追问细节。这样真的让人觉得“哦,原来反馈有人听”,于是就更有动力去继续反馈。

Boris Cherny

是啊,因为老实说,我也不知道自己在做的到底对不对。其实没人知道该怎么做 AI。我们都是边做边探索。而最重要的信号就是用户的需求,所以必须听用户的。

3.Claude Code:“尽量简单”和“尽量可 hack”原则

主持人Alex Albert

那我们换个话题,现在 Claude Code 产品的现状如何?有哪些最新功能?你对什么最兴奋?

Boris Cherny

Claude Code 从一开始就追求“尽量简单”和“尽量可 hack”。我觉得“可 hack 性”是我们最近发展很多的一个方向,我对此特别兴奋。

Boris Cherny

最初,扩展 Claude Code 的方式是通过 claude.md 文件。它可以放在项目的根目录,也能放在子目录,作为额外的上下文信息。它常常会随着代码库一起提交,能让 Claude Code 更了解你的代码。

但后来我们加了很多新的扩展点。比如现在有更复杂的设置系统和权限系统。我们还引入了 hooks,这个是我们工程师 Dixon 开发的,他看到很多用户希望以不同方式扩展,就写了一个功能非常全面的 hook 系统。

另外还有 MCP,这显然是一个很棒的扩展点。现在我们还有斜杠命令(slash commands)和子代理(sub-agents)。其中用户自定义的 slash commands 是我们投入很多的功能。它的形式其实很简单,就是一个 Markdown 文件放在代码库里,可以频繁复用。比如我有一个“提交代码”的 slash command,里面写了如何写一条好的 Git commit 信息,并且预先允许了提交命令,这样模型每次都能直接帮我提交,不用我重复确认。我觉得 slash commands 非常有趣,而 sub-agents 可以看作是另一种形式的 slash commands —— 它们像命令,但有独立的上下文窗口。可以说,agents 和 slash commands 是同一枚硬币的两面。

这让我特别兴奋,因为这是扩展 Claude Code 的又一种方式。展望未来,我觉得关键就是:我们如何让 Claude Code 扩展得更容易?如何让更多人能在它之上开发?如何让 SDK 对大家更有用?这样不仅能帮你构建代码代理,还能应用在其他任何需要 agent 的场景里。SDK 都能用。而且所有这些改进,都受益于我们在提升模型自主性上的努力 —— 让它能运行更长时间、能更好地遵循指令、能记住更多东西。整个过程互相促进。

4.一年之后,Claude或许能像工程师一样思考

主持人Alex Albert

 那么 6 到 12 个月后,如果我在用 Claude Code 或它的某个版本,我的工作会是什么样?难道整天都在 review PR 吗?能帮我们拆解一下日常工作会变成怎样?

Boris Cherny

我觉得未来还是会有一部分亲手写代码的工作,这不会消失。不过形式可能会不同。比如现在“亲手写代码”是直接在 IDE 里改文本,但以后可能是通过 Claude 代替你操作文本。除此之外,还会有另一类工作:Claude 主动做了一些修改,甚至帮你 review 了代码,而你的职责是判断要不要接受这些改动。再往后,比如 12 个月或 24 个月后,我们可能会看到 Claude 以“目标”为导向,做更高层的事情,而不是一堆具体的小任务。就像工程师会想:我下个月要实现什么目标?然后逐步做一些修改来实现它。Claude 未来也可能会这样。

主持人Alex Albert

对,就是逐级抽象上移。从最初让 Claude 改某个文件里的几行,到让 Claude 修改整个 PR,再到让它围绕一个目标去构建应用,或者实现别的成果。

Boris Cherny

没错。

主持人Alex Albert

挺有意思的。如果我是工程师,听到这些,感觉未来在很短时间里会有巨大变化,尤其是我的角色和工作内容。你会给正在准备适应这种新世界的人什么建议?他们应该学习哪些东西,培养哪些技能?

Boris Cherny

我会想到自己最早写代码的时候。那时我还是初中生,坐在数学课的最后一排,手里有个透明灰色的 Ti-83 Plus 计算器,可以看到电路。我用 Basic 给它编程,因为我发现可以把考试答案写进去,用来考高分。那种“黑客式”的直觉体验很震撼:你能想到一个程序,就直接在计算器里写出来,然后马上运行。这种快速反馈的循环让我能做出以前完全做不出来的东西。

而且入门非常容易。但后来,进入“没有 agent 的时代”,整个技术栈变得特别复杂。比如我想做一个 JavaScript 网站,就得学 React、Next.js,再加三个构建系统和一个部署系统,复杂到吓人。我觉得智能体的一个很酷的地方就是它正在改变这种状况。用代码代理,开始变得很容易。如果你有想法,就能快速实现。而且更多是围绕“想法本身”,而不是技术细节。Claude Code 自己的代码我们经常反复重写,这就是 agent 让一切变得可能。

所以代码本身不再像过去那样“珍贵”,尽管写代码依然是一门艺术。有时候我还会手写代码。我们团队的工程师 Lina 也说,她周末会写 C++,就是因为好玩。作为程序员,这本身是一种乐趣。但未来会越来越偏向于“你做出了什么”,而不是“你是怎么做的”。我给今天学编程的人一个建议:你依然要掌握这门手艺 —— 学会写代码、学语言、学编译器和运行时、学怎么构建 Web 应用、学系统设计,这些都要会。同时,也要更有创造力。如果你有创业点子或产品想法,现在真的可以直接做出来,这是以前根本不可能的。我们还不知道这会带来什么,但潜力巨大。

5.最佳实践分享:先让agent做研究,再写代码

主持人Alex Albert

我很喜欢这个建议。以前一个想法可能永远躺在 backlog,现在几分钟就能实现。那在结束之前,作为 Claude Code 的创建者,你有没有一些“最佳实践”或者小技巧可以分享?

Boris Cherny

有的,我觉得有两个小技巧。第一个是,如果你是新用户,还没用过 Claude Code,那一开始不要直接拿它来写代码。我知道这听起来有点奇怪,但你要克制住。

先用它来提问,问代码库相关的问题。比如:我想加一个新的 logger,要怎么做?Claude Code 会帮你探索代码库,找到答案。或者问:为什么这个函数是这样设计的?Claude Code 可以查 Git 历史,帮你解释。先从这种“问问题”开始,而不是直接写代码。等你习惯了这种让 agent 帮你做研究的方式,再逐渐用它来写代码。

我觉得第二个建议是:当你真的用 Claude Code 来写代码时,要先想清楚你要做的工作是什么、任务有多大。我脑子里大概分成三类:简单、中等和困难。

  • 简单任务:Claude 基本上一条 prompt 就能完成,比如我现在常常直接在 GitHub 上 @Claude 一个 issue,让它直接写一个 PR,这样我就不用占用终端了。
  • 中等任务:我会先在终端里用“计划模式(plan mode)”,Shift+Tab 进入计划模式,先和 Claude 对齐一个计划,等我觉得这个计划靠谱了,再进入“自动执行(auto acceleration)”让它去实现。
  • 困难任务:这时候还是我在主导,Claude 更像是我的搭档工具。我主要自己写代码,Claude 可以帮我做一些代码库研究、原型试验,或者我会让它“vibe code”一些选项,帮我探索系统的边界。但最后大部分实现还是我来写,Claude 可能帮我写一些单元测试。

所以我的第二个建议就是:要先评估清楚任务的难度,再决定用哪种方式让 Claude Code 参与。

主持人Alex Albert 

 这些技巧太棒了,非常感谢你,Boris,今天聊得很精彩。

Boris Cherny 

谢谢,也谢谢你,Alex。

6.写在最后

播客的内容到此已经结束了。最后,有一个有趣的小插曲。

在这期播客评论区里,画风却突然转向。

不少 Claude Code 用户在线“维权”,纷纷留言:

 能不能谈谈最近几周性能大幅下降的问题?


请正面回应一下 Claude Code 性能退化的问题。 

Claude Code之父爆料设计理念!“尽量简单”和“黑客性”是原则!新手甭上来就写代码!手工代码不会消失!-AI.x社区图片

就在不久前,Claude Code 官方刚宣布了启用每周使用上限,氪金用户的自由再度收缩。现在又被用户诟病性能下降问题。

值得注意的是,此前,另一款热门 AI 编程工具 Cursor 就曾因为性能下滑与限流问题而“翻车”。用户广泛吐槽其“无限用”承诺缩水,Pro 版变相加设使用上限,最终引发退订潮,口碑一度滑坡。

难道,这就是爆款编程产品的宿命?

你是否也有类似感受?


本文转载自​​51CTO技术栈​​,作者:伊风

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
已于2025-9-3 14:15:19修改
收藏
回复
举报
回复
相关推荐