重构Jensen定律:买更多、赚更多与AI工厂经济学 精华

发布于 2025-9-15 07:59
浏览
0收藏

核心观点

一、新Jensen定律 = AI工厂经济学

  • 定义:在一个电力受限且需求弹性的AI工厂中,任何能提升“每瓦性能”与“系统利用率”的增量投资,都将使可商业化的产出(Token吞吐量)增速,超过总成本的增速。
  • 两大商业成果(飞轮效应):

     1. 买得越多,赚得越多 (Buy More, Earn More):通过提升总产出实现收入增长。

      2. 买得越多,省得越多 (Buy More, Save More):通过提升效率降低单位生产成本。

二、定律的数学基石与成立前提

  • AI工厂的财务模型:

          产出:年Token产出 = 电力预算 × 系统效率 (Token/瓦) × 集群利用率 (%)

          核心洞察:当“电力预算”是固定上限时,“效率”和“利用率”成为驱动商业价值的唯一杠杆。

  • 三大关键前提条件:

          1. 约束条件:数据中心受电力限制,而非资本或物理空间限制。

           2. 市场条件:AI服务的需求具有弹性(价格降低会激发远超比例的需求增长)。

           3. 价值分配:效率提升所产生的利润,主要由运营商保留,而非完全被上游供应商(NVIDIA)占有。

三、战略推论:竞争范式的转变

1. 竞争单元的升级:从“芯片”到“AI工厂”

  • 竞争的焦点不再是单一硬件的峰值性能,而是整个系统(硬件+网络+软件)在真实负载下的端到端效率和利用率。
  • 这解释了NVIDIA的系统级设计理念,是其最深的护城河。

2. 网络的角色重塑:从“成本”到“利润杠杆”

  • 高速网络(Fabric)通过显著提升GPU集群的利用率,能创造出远超其自身成本的经济价值。
  • 在特定条件下,网络因其带来的巨大收益而变得“经济上免费”。

3. 产品节奏的本质:从“技术迭代”到“经济复合引擎”

  • NVIDIA每年更新架构,本质上是在驱动一个经济飞轮的复合增长。每一代产品都让客户的每一美元资本支出,能在未来产生更多的回报。

四、面向不同角色的行动指南

  • 对于投资者 (Investors):

         评估视角:必须用“AI工厂经济学”的系统思维来评估公司,而非单纯的芯片规格对比。

          价值识别:要认识到网络(Fabric)和软件是利润的核心杠杆,与GPU同等重要。

          理解护城河:NVIDIA的持续领导力源于其驱动客户实现经济回报的能力和快速的复合迭代节奏。

  • 对于运营商 (Operators):

         衡量标准:应关注系统级、端到端的真实效率指标,如每焦耳Token数 (Tokens/Joule)。

         投资决策:核心是进行严格的成本效益分析——升级带来的终身额外收入 VS. 终身额外成本。

         风险识别:必须警惕定律不适用的场景(如电力不受限、需求无弹性),避免盲目投资。

我们认为,业界对Jensen定律的普遍解读,即“Jensen定律加速摩尔定律”,未能充分理解AI工厂背后的基本经济学原理。黄仁勋本人的论述以及NVIDIA的运营模式,揭示了AI工厂的财务运行规律:当电力成为主要瓶颈且需求具备弹性时,每瓦性能的提升将使可商业化吞吐量的增长速度超过总成本的增长。这是对我们已熟知的现有科技定律的延伸。

具体来说,黄仁勋提出的“买得越多,赚得越多”(即收入增加)和“买得越多,省得越多”(即单位成本降低)等论点,具有明确的经济学内涵,我们认为值得进一步深入探讨。此外,在这一新体制下存在一个推论:在某些条件下,基于Fabric的利用率提升价值巨大,以至于高速网络变得“经济上免费”(即利用率收益超过摊销后的Fabric成本)。

在本文中,我们将详细解释我们所定义的新Jensen定律。我们还将探讨这一现象为何如此重要,剖析其背后的数学原理,并分享一些该定律适用的具体示例、何时“网络免费”的推论成立、其对投资者和运营商的影响,以及该定律不适用的情况。

范围与条件说明

我们对Jensen定律的解读主要适用于以下情况:电力受限的AI工厂,它们运行高利用率的通信密集型训练和长上下文推理工作负载,同时具备弹性需求且运营商能够保留利润。在这些条件之外,例如受资本支出或需求限制的站点、可批量化处理的推理,或基础设施供应商的租金受运营杠杆不足约束时,这种关系会减弱甚至逆转。

为何新Jensen定律如此重要?为何是现在?

随着我们从单次Prompt模式向更复杂的应用发展,推理和代理AI将每任务的计算量倍增,据NVIDIA和其他来源的数据,可达100到1000倍。我们不断听到,数据中心正日益受到电力的制约。NVIDIA的GB300、NVLink72和Spectrum-X技术栈,明确将“每瓦Token数”作为优化指标,同时提升了实际利用率。我们认为,这些变量共同使得AI客户能够将电力受限的工厂实现商业化变现。

请记住,我们对Jensen定律的解读前提是,只有当更好效率和利用率带来的终身额外收入大于终身额外成本(在考虑风险后),每一美元的新增支出才是有价值的。

以此为背景,让我们来审视NVIDIA在2026财年第二季度财报电话会议(8月27日)中的一些支持性陈述。

支持性陈述(摘自NVIDIA2026财年第二季度电话会议)

  • 每瓦性能驱动收入。在电力受限的数据中心,每年产生的Token数量与每瓦性能成正比。黄仁勋表示:“每瓦性能直接驱动收入……你买得越多,你的增长就越多。”
  • 10-50倍的能效提升。根据配置、NVFP4精度和NVLink72的使用,GB200相对于Hopper的能效提升了10到50倍。
  • 具体的投资回报率(ROI)示例。300万美元的GB200基础设施可以产生3000万美元的Token收入(10倍回报)。
  • 网络使利用率提升。网络将利用率从约65%提升到85-90%。黄仁勋表示,这“实际上让网络变得免费”。
  • Fabric技术栈。NVLink用于机架内扩展,Spectrum-X以太网/InfiniBand用于集群间扩展,而Spectrum-XGS则用于跨站点AI工厂的扩展。
  • 资本支出(Capex)背景。超大规模云服务商的数据中心资本支出每年约为6000亿美元;NVIDIA估计本十年AI基础设施的建设规模为3-4万亿美元。

Jensen定律的核心在于:每瓦性能直接驱动收入。在电力受限的数据中心,一年中可产生的Token数量直接与效率相关。正如黄仁勋所言:“每瓦性能直接驱动收入,买得越多,增长就越多。”

在最新的财报电话会议上,NVIDIA引用了巨大的效率提升,即GB300相对于Hopper的能效提升了10到50倍,这取决于配置、FP4精度的使用以及NVLink72。NVIDIA并未说明具体的工作负载、配置或准确性水平。

尽管如此,我们听到了具体的ROI有力例证。NVIDIA引用的一个例子是:300万美元的GB200基础设施支出产生了3000万美元的Token收入。这是一种10倍的回报,这可能不是一个模型,而是来自Microsoft和OpenAI等公司的实际运营数据。

网络的重要性日益凸显。NVIDIA的技术栈横跨三个维度:NVLink用于机架内的扩展,Spectrum-X Ethernet和InfiniBand用于集群间的扩展,而Spectrum-XGS则用于多站点AI工厂的扩展。通过将网络利用率从约65%提升至85%到90%,该公司认为“网络实际上是免费的”,因为由此带来的吞吐量收益超过了Fabric的成本。我们对此的解读是,在通信密集型环境中,当利用率收益大于Fabric成本时,网络就可以在经济上免费。

结合资本支出的背景,NVIDIA声称,“四大”超大规模云服务商(即三大云厂商加上Meta)今年在数据中心的支出约为6000亿美元,而我们的估计则相对较低,仅略高于4000亿美元,尽管这仍然是一个巨大的数字。或许NVIDIA在评估的是整个数据中心建设的支出,即便如此,这个数字仍超过了我们的估计。NVIDIA对本十年剩余AI基础设施的建设规模给出了3到4万亿美元的估值,这也远高于我们的市场预测。但这仍然是一个巨大的数字,这正是黄仁勋所指的资本支出飞轮。

或许黄仁勋对需求有着更好的洞察。

重构“Jensen定律”:从更快的芯片到工厂经济学

媒体中的常见用法(例如IEEE Spectrum、WSJ、Tom's Hardware等)将“Jensen定律”定位为NVIDIA超越摩尔定律的加速,即更短的产品周期和代际超额收益。这在方向上是正确的,但我们希望对此进行更精确的阐述。在我们看来,他们所忽略的关键杠杆是经济学。

重构Jensen定律:AI工厂经济学

核心原则

在电力受限的AI工厂中,增加的支出若能提升每瓦性能和Fabric效率,将使可商业化吞吐量(Token/秒)的增长速度快于总成本的增长。

  • 花得越多→挣得越多(收入增加)
  • 花得越多→省得越多(单位成本降低)

网络“免费”

当Fabric层的利用率提升巨大时,高速网络实际上是免费的——因为吞吐量的提升超过了摊销后的成本。

新颖之处

  • 为电力受限的AI工厂运营提供了可操作的定律。
  • 以明确的收入数学为基础。

是黄仁勋的营销炒作,还是真实的经济实质?

我们的假设是,存在一个版本的Jensen定律超越了营销,它与AI工厂经济学息息相关。让我们来审视AI工厂经济学中新兴的核心原则。

定律

经典定义

在Jensen定律中的作用

摩尔定律

晶体管密度大约每两年翻一番,从而降低每个晶体管的成本。

带来每瓦性能的提升 → 在固定电力下,每年生成更多 Token。它是“挣得更多”飞轮的来源。

Wright定律

随着累计产量的每次翻倍,单位成本会按可预测的百分比下降。

解释了随着部署规模扩大(GPU、机架、晶圆厂),每个 Token 的成本会下降。是“省得越多”的核心。

Metcalfe定律

网络的价值与其连接节点数的平方成正比。

捕捉了 Fabric 驱动的利用率——NVLink/Spectrum-X  扩展使网络“实际上免费”。

Jevons悖论

效率的提升会增加消费而不是减少消费。

描述了飞轮效应——更便宜的 Token 扩大了需求,从而推动更多的资本支出、更高的吞吐量和更多的收入。

在电力受限的环境中,每增加一美元的支出,用于提升每瓦性能和Fabric效率,都将使可商业化吞吐量(即每秒Token数)的增长速度,快于总成本的增长。

这一动态带来了两个结果:

  1. 买得越多,赚得越多:收入随之增加。
  2. 买得越多,省得越多:单位成本持续降低。

此外,当Fabric层的利用率提升显著时,高速网络就会在经济上变得免费。因为吞吐量的提升超过了网络设备的摊销成本。当然,这取决于现有的利用率假设、工作负载以及潜在的利用率收益。

这一框架直接追溯到上图右侧的一些经典科技经济学定律。其新颖之处在于,这些原则专门为电力受限的AI工厂运营而量身定制,我们用明确的收入数学锚定它们,我们将在稍后分享。这就是转变:从抽象的进步定律转向AI经济的具体财务驱动因素。

驱动科技行业的历史定律

回顾这些经典定律会有所帮助,我们可以将它们与我们所定义的新Jensen定律联系起来。

以下是定律的简要总结,以及它们在我们描述的新Jensen定律中的作用:

  • 摩尔定律:涉及器件的微缩,并驱动每瓦性能的提升,这意味着在固定的电力包络下,每年能产生更多的Token,从而带来更好的经济效益。
  • Wright定律:成本会随着累计产量的翻倍而持续下降,这解释了随着部署规模的扩大,每Token的成本会持续下降,这也是“省得越多”这一等式的核心所在。
  • Metcalfe定律:价值会随着连通性的指数级增长而增长。这与网络利用率相关,包括Scale-up、Scale-out、跨站扩展等,正是这些使得网络在经济上“免费”。
  • Jevons悖论:效率的提升会刺激消费,这支持了我们所定义的Jensen定律的飞轮效应。

新Jensen定律背后的数学原理

让我们来剖析我们对这一新Jensen定律解读背后的数学原理。

我们可以将其归结为三件事:可生成多少Token、这些Token产生多少收入,以及每个Token的制造成本。

数学原理:为什么每瓦性能×利用率=收入

用通俗语言解释“真正的”Jensen定律

吞吐量(每年Token数)

  • Token数=电力×时间×效率×利用率
  • 电力预算×运营时间
  • 能源效率(每单位能源的Token数)
  • 利用率(集群的繁忙程度)

收入

  • 收入=Token数×每Token美元

成本

  • 每Token成本=(资本支出+能源成本+其他运营支出)/Token数
  • 年度化资本支出(服务器、机架、网络、冷却)
  • 能源成本(每度电费用×电力×时间)
  • 其他运营支出(人员、空间、服务)

毛利率

  • 毛利率=1-(每Token成本/每Token价格)

首先从吞吐量开始:每年的Token数量。这是以下四个变量的函数:电力预算、一年运营时间、系统效率(即每单位能源的Token数)以及集群利用率。将这些结合起来,公式如下:

每年Token=电力×效率×利用率

一旦知道了吞吐量,收入就只是Token数乘以每Token的美元价格。这给出了总营收。

收入=Token×每Token美元

现在看成本方面。每Token的成本是年度总支出,包括服务器、机架、网络、冷却、电力、员工、房地产等,然后除以每年的Token数量。换句话说,就是将资本支出、能源以及其他运营支出进行年度摊销,并分摊到Token输出上。

每Token成本=(年度化资本支出+能源成本+其他运营支出)/年度Token输出

最后是毛利率。这等于1减去每Token成本除以每Token价格。简单来说,生成Token和保持系统利用的效率越高,利润空间就越大。

1−(每Token成本)/每Token价格)

所以当我们说每瓦性能乘以利用率等于收入时,这并不是一句营销口号,而是AI工厂的财务模型。在条件合适的情况下,它是一个实实在在的财务模型。

增值支出规则:网络的重要性

黄仁勋关于网络的经济论点大致是这样的:

如果你通过购买更快的Fabric、更好的冷却系统或更智能的软件来增加投资,并能充分改善效率或利用率,那么由此带来的更多Token的额外收入,将超过升级所产生的额外成本。

如果效率和利用率的收益大于新增的成本……那么“买得越多,赚得越多”就适用。

因为每Token的成本也会随之下降……这导致了“买得越多,省得越多”。

Jevons悖论式助推器

当效率降低了单位成本时,你就可以降低每Token的收费。如果需求具备弹性(即当价格更便宜时,客户会需要更多),收入就会增长得更快,这强化了我们之前讨论的Jensen飞轮效应。

跟随金钱的流向:新Jensen定律的价值流动

让我们用图片来展示,并审视新Jensen定律的价值流动,即“跟随金钱的流向”。为此,我们将我们所定义的Jensen定律版本用更通俗的语言来阐释。

将AI工厂想象成一家自助餐厅。这家自助餐厅有烤箱(GPU)、厨师(软件)和配送系统(网络)。其目标是每天服务尽可能多的餐食(Token),同时保持低成本并实现盈利。

吞吐量(每年Token数):可以将其想象成一年内服务的总餐食数。更多的烤箱、更快的烹饪速度和更顺畅的运营意味着更多的餐食。

  • 电力 × 时间 × 效率 × 利用率:这只是在说你投入了多少能源、运营了自助餐厅多久、烤箱有多好,以及它们有多忙碌。如果烤箱闲置,工厂的利用率就不足。
  • 每Token成本:每份餐食都有其单位成本,包括烤箱(资本支出)、电力(能源)和员工、供应品(运营支出)。将这些成本除以服务的餐食总数,就得到了每份餐食的成本(即每Token的成本)。
  • 收入:如果你对每份餐食收费,那么收入就是售出的餐食数乘以每份餐食的价格。这与Token的逻辑相同。
  • 毛利率:这是扣除成本后剩余的利润。每Token的成本越低,或售出的Token数越高,你所保留的利润就越多。

所以,新Jensen定律的含义是:通过增加投资来升级自助餐厅,你将能够服务更多的餐食(赚得更多),或者每份餐食的成本更低(省得越多)。如果两者同时发生,你的利润就会实现双重增长。

网络正完美地契合了这一点。更好的网络就像升级了自助餐厅的传送带,让每个烤箱都能保持忙碌。即使传送带需要额外成本,它们也能通过服务更多餐食而自偿。这就是NVIDIA所说的“网络免费”的原因。

右侧的循环是增值支出规则。它的意思是:

  • 如果你增加了投资(额外的资本支出、更好的Fabric、更智能的软件),并能充分增加效率或利用率...
  • 那么收入的增长速度就会快于成本的增长。
  • 结果是:更高的吞吐量、更多的收入,以及通常更低的单位成本。

因此,我们可以进行如下验证:

  • 更高效率或利用率所带来的收入提升,是否超过了升级所增加的成本?
  • 如果是这样,那么这项支出就是增值的(并且能够盈利)。
  • 反之,你的支出则未能改善经济效益。

关键在于,你必须采取一种系统性的视角,这正是黄仁勋一直强调的——“我们不仅仅是构建芯片,我们是构建系统。”在我们看来,这正是NVIDIA护城河的核心部分,但其价值却常被低估。如果系统的一部分得到了优化(例如更多的烤箱能制作更多的餐食),但传送带不够快,系统就会失衡,收入也就无法最大化。

深度剖析NVIDIA的声明

NVIDIA的第二季度业绩,为我们所定义的Jensen定律提供了部分佐证。该公司给出了几个示例,展示了新架构和Fabric如何直接转化为收入的倍增和更低的每Token成本。以下是我们对其中一些声明的看法。

NVIDIA2026财年第二季度电话会议的真实案例

“真正的”Jensen定律的证据

推理与代理AI

  • 新一代代理会进行规划、使用工具和迭代
  • 任务的计算密集度是聊天机器人的100-1000倍
  • 随着工作负载增长,效率和利用率的提升变得更重要

GB300 NVL72

  • 机架规模NVLink72→每瓦Token数比Hopper高10倍
  • NVFP4精度+NVLink72→每个Token的能效提升50倍
  • CoreWeave报告称,推理模型在推理速度上比H100提升了10倍

Fabric经济学

  • Spectrum-X以太网:年运行速率达100亿美元
  • Spectrum-XGS:连接千兆规模的AI工厂
  • NVLink72:带宽比PCIeGen5高14倍→GPU不会闲置
  • 网络成本被利用率提升所带来的收益所抵消→“网络是免费的”

300万到3000万美元的例子

  • 300万美元的基础设施支出→3000万美元的Token收入
  • 在真实案例中实现了10倍的收入倍数

年度节奏

  • Blackwell→Rubin架构
  • 年度升级优化每瓦性能和收入
  • 复合循环:更高的效率、利用率和收入

首先是推理和代理AI。与简单的聊天机器人不同,这些代理需要规划、使用工具并进行迭代。这使得工作负载的计算密集度高出100到1000倍,这意味着效率和利用率的提升变得尤为重要。这里的一个关键问题是,NVIDIA是如何计算利用率的?例如,在计算中如何考虑多租户开销、排队效率、I/O碎片化和系统重启?

其次是带有NVLink72的GB300。在机架规模上,它相对于Hopper提供了约10倍的每瓦Token数。在使用4位浮点数学时,每Token的能效提升更是高达50倍。CoreWeave声称,他们在实际生产环境中已经观察到推理模型的推理速度提升了10倍。我们很想知道,哪些Token化标准是最有效的?为了实现10到50倍的提升,是否采用了特定的服务质量(QoS)限制?

第三是Fabric的故事。网络绝不是一个次要因素,它对经济效益至关重要。Spectrum-X Ethernet已经以100亿美元的速率运行,而NVLink72提供了比PCIe Gen5高14倍的带宽。这正是黄仁勋所说网络实际上是免费的原因——因为如果利用率收益超过成本,它在经济上就是免费的。我们希望进一步理解这在合理的增量收入超过Fabric成本方面的含义。换句话说,运营商应该假设什么样的合理的节省NPV:Fabric TCO比率,才能确保实现经济上的“免费”?是1倍、2倍,还是3倍?需要什么样的合理缓冲来保证结果?

第四是从300万美元到3000万美元的案例。黄仁勋引用了一个真实的案例:300万美元的基础设施支出产生了3000万美元的Token收入。这正是“买得越多,赚得越多”这一飞轮效应的实际体现。我们有几个关键问题,包括这一收益实现的具体时间窗口,这是一种短暂的收益还是可以持续一段时间?其对每Token价格的假设是什么?合理的收益范围是什么(我们假设10倍是营销宣传中的最佳情景)。

最后是节奏。NVIDIA每年都会出货新架构,从Blackwell到Rubin以及未来的版本。每一代都驱动着更高的每瓦性能、更高的利用率和更高的收入。这是一种复合经济。我们所看到的一个关键问题是,如果新的NVIDIA一代在上一代基础设施实现回报之前就已到来(例如我遇到了明确的延迟风险),且基础设施的价值大幅下跌,我将面临商业案例失败,甚至可能丢掉工作。我们认为,当AI从超大规模云服务商和云端向企业和边缘移动时,这一问题将变得尤为紧迫。

总而言之,NVIDIA所销售的不仅仅是芯片;它证明了我们所定义的Jensen定律的经济引擎是真实存在的。更重的工作负载使得效率提升的价值更高,Fabric让GPU保持忙碌,而每一代架构的更迭都使得“买得越多,赚得越多”的循环得以复合。然而,运营商和企业客户必须穿透营销炒作的迷雾,理解他们独特环境下的情况,以及NVIDIA那些令人印象深刻的声明如何转化为对他们自身的价值。

投资者视角:新Jensen定律改变了什么

我们对投资者对NVIDIA最新财报的反应有些惊讶。除了自由现金流利润率受到打击,我们认为这个季度相当出色。NVIDIA在其DSO评论中解决了FCF问题,对此我们并无担忧。

从投资者的视角来看,在我们看来,新Jensen定律改变了四件事,如下文要点所述,并在此详细描述。

首先,竞争单位不再是单个芯片,而是整个AI工厂。重要的是系统层面的每瓦性能和利用率,这奖励了机架规模的设计、集成的Fabric、软件和产品节奏。

其次,网络不再是开销,而是一种利润杠杆。利用率的提升非常显著,以至于织网通常能够自偿,甚至能多次。需要注意的是,条件必须合适。目前,这对于大型超大规模云服务商是适用的,但它能否同样程度地适用于主流企业?

第三,定价权因弹性而重新定义。如果弹性存在,随着每Token成本的暴跌,提供商仍然可以通过降低价格来增长收入,因为需求会更快地扩张。但要注意:运营商必须承担弹性大于1的风险,即随着价格下降,客户会购买足够的产品来增长收入。我们在当前的容量争夺和向推理工作负载转移中看到了一些积极迹象,这表明市场对AI服务有着巨大的胃口。这里的警告是,每Token的价格在不断变化,而且变化很快。通常会出现API定价、免费层、降价、广告补贴等零和竞争。运营商的利润将受到这些动态的影响,这可能会改变结果。

第四,节奏是印钞机。NVIDIA的产品节奏不仅仅关乎更快的芯片,它更是将资本支出转化为持续的商业化变现飞轮。每年,新架构都能带来更高的效率(每瓦更多的Token数)和更好的利用率(让集群更忙碌)。这种结合意味着,每在GPU、网络和机架上投入一美元的资本支出,都将在下一个周期产生更多的收入。但投资者需要重点考量的是,客户在多大程度上能够跟上NVIDIA的产品节奏。显然,超大规模云服务商、Meta、xAI以及一些新兴的云和服务提供商能够跟上。但主流企业将难以维持这一步伐。当资本支出热潮消退后,企业和机器人等新兴应用将成为新的增长引擎。这些市场的动态将有所不同。

尽管如此,在今天超大规模云服务商主导的市场中,这正是黄仁勋所说的“买得越多,增长就越多”。那些持续再投资的客户,正乘着年度改善的曲线,每一代产品都在有效地复合其回报。

我们相信这一飞轮至少将持续到本十年末。

运营商视角:如何在实际运营中衡量新Jensen定律

以下是我们认为运营商应如何在实际运营中衡量Jensen定律:

  • 首先,每焦耳Token数——在某些案例中,真实效率正在快速上升,达到10到50倍。
  • 其次,利用率——一些运营商声称,通过NVLink72和Spectrum-X,集群的运行效率提高了15%到25%。
  • 第三,电力分配——当兆瓦的上限保持不变时,每瓦性能的每一次提升都会直接转化为收入。
  • 第四,Token价格和需求——随着价格下降,需求上升,收入也随之上升,这符合Jevons悖论。
  • 第五,投资回报时间——一些基础设施的建设,其回报时间现在已不到一年。
  • 最后,Fabric的组合——NVLink72的领域正在扩展,而XGS(数据中心到数据中心)才刚刚开始出现。

新Jensen定律不适用的情况

我们相信,AI工厂的数学原理引人注目,但仅在严格的运营条件下才能成立。黄仁勋的新定律并非绝对的保证。存在一些风险和条件,可能会导致其不适用。

  • 首先,如果数据中心不受电力限制,那么每瓦性能与收入之间的联系就不那么紧密了。
  • 其次,如果Token价格下降的速度快于效率和利用率上升的速度,那么增长就会停滞,尤其是在需求缺乏弹性时。
  • 第三,工作负载至关重要。如果模型对Fabric的速度或集体操作不敏感,那么Fabric支出的回报就会减弱。
  • 第四,实际的约束,例如供应链延迟、电力或冷却瓶颈,都可能推迟投资回报。
  • 第五,如果替代的技术栈或ASIC开始在端到端效率上与NVIDIA相匹配,那么经济效益就会开始回归正常化。

以下是我们认为需要随时间进行监控的具体细节:

10到50倍的效率声明必须在端到端进行验证,考虑在准确性和延迟对等条件下的每焦耳Token数。这应该在系统层面进行衡量,而不是仅仅在单个GPU上。此外,商业案例应假设一个领先期,并以3到5倍的成本回报作为考量,以规避风险。

利用率的提升同样微妙。来自NVLink72和Spectrum-X的+15–25个百分点的收益,对于集体密集型训练和长上下文推理是真实的,但对于并行推理则可能微不足道。运营商应在生产负载下,预期有意义的持续改善后再进行扩展。

每瓦性能仅当电力是限制性因素时才能转化为收入。如果容量受到资本支出或需求上限的限制,这种联系就会减弱。在我们看来,升级只有当电力将在12到24个月内成为瓶颈时才应进行。同时,对增量吞吐量将被消耗要有高度的信心,或者理想情况下有预售协议。

弹性假设必须脚踏实地。价格下降带来的收入提升,仅当弹性大于1时才适用。否则,应使用分层的QoS来保护利润。同样,不到一年的回报取决于高利用率、稳定的Token定价和准时安装。我们的研究表明,许多投资都面临着不可预见的延迟。在商业案例中,应假设更高的IRR或障碍率,以及更长的投资回报期。

运营商必须保留利润提升。在我们看来,升级只有当电力受限、利用率提升得到证实、需求具有弹性,且盈余能够归属于运营商,而不仅仅是基础设施供应商时,才是增值的。

最后,这一Jensen定律的解读对于超大规模云服务商和消费互联网公司的运作非常有效。但它如何转化为企业AI和边缘计算客户的价值,目前尚不明确。随着这些市场的发展,我们将进行更深入的挖掘。

这些都是我们需要关注的压力点。

结论

我们希望对Jensen定律的重新解读能够清晰地呈现给读者。“摩尔定律加强版”的简称虽然吸引人,但并不完整。经济学显示,在电力受限的AI工厂中,效率(每焦耳Token)和利用率(保持集群忙碌)是真实的收入杠杆。当这些改善快于成本上升时,两个动态随之而来:买得越多,赚得越多;以及买得越多,省得越多。

财报电话会议继续提供了佐证:NVIDIA引用了10到50倍的效率提升、300万美元基础设施产生3000万美元Token收入的示例,以及Fabric驱动的利用率提升可使网络实际上免费。但我们必须警告,这些成果仅在严格的条件下才能实现——需要在系统层面进行端到端衡量,要有持续的利用率改善,当电力确实成为限制性因素时,以及需求具备弹性能够支持收入增长而非价格侵蚀。

对于投资者和运营商来说,可采取的行动要点是:根据工厂的经济效益,而不仅仅是芯片规格来评估供应商。持久的赢家将是那些年复一年地复合效率和利用率的公司,它们软件和织网的重要性与硅片同等,同时确保效率所带来的利润能够归属于运营商,而不仅仅是基础设施供应商。

参考资料:Vellante, D. (2025, August 30). Reframing Jensen’s law: ‘Buy more, make more’ and AI factory economics. SiliconANGLE. https://siliconangle.com/2025/08/30/reframing-jensens-law-buy-make-ai-factory-economics/

本文转载自​Andy730​,作者:常华

已于2025-9-15 07:59:29修改
收藏
回复
举报
回复
相关推荐