
OpenAI的Stargate项目:德州巨头胜过xAI的Colossus
OpenAI正通过其Stargate项目重塑AI格局,这是一项与Oracle和SoftBank合作的宏大计划,在美国德克萨斯州阿比林(Abilene, Texas)建设全球最大的单一数据中心。这一占地900英亩的庞然大物已消耗300兆瓦(MW)电力,远超埃隆·马斯克(Elon Musk)旗下xAI的Colossus——一座拥有20万个GPU、功率250兆瓦(MW)的设施。OpenAI计划到2026年中将阿比林数据中心的功率提升至创纪录的1.2吉瓦(GW),并获得高达5000亿美元的四年投资以及白宫总统唐纳德·特朗普(Donald Trump)的背书,这一德州园区是大胆的飞跃。然而,其巨大的能源需求正在引发德州电力可靠性委员会(ERCOT)的担忧,威胁电网稳定性,并前所未有地挑战电力基础设施。
阿比林:从油井到AI中心
阿比林位于德克萨斯州,距达拉斯180英里,距沃斯堡150英里,是一片浸润着石油和牧牛文化的土地。Stargate园区,代号Project Ludicrous,正在改变这一地区的面貌。园区占地900英亩(一说875英亩),面积超过纽约市中央公园。建设于2024年6月启动,计划建造八栋近乎相同的建筑,总面积400万平方英尺。截至2025年1月,已建成两栋对称建筑,第三栋相同设计的建筑正在施工,剩余六栋也在进行中,预计2026年中全面投入运营。前两栋建筑将于2025年上半年上线,而2025年3月启动的第二阶段建设将推动园区达到1.2吉瓦(GW)的容量。
由首席执行官蔡斯·洛赫米勒(Chase Lochmiller)领导的初创公司Crusoe负责建设,目标是以最快的速度完成100兆瓦(MW)或以上功率数据中心的建设。该项目总成本达150亿美元($15 billion),其中120亿美元($12 billion)用于建设,不包括用于Nvidia GPU的数十亿美元支出。数据中心内部搭载数十万个AI GPU,包括Nvidia H100和B200加速器。OpenAI和Oracle计划到2026年底部署6.4万个Nvidia GB200 GPU,其中1.6万个已于2024年夏季安装。每栋建筑可容纳多达5万个Nvidia Blackwell处理器,通过Nvidia的Spectrum-X以太网平台互连。一个创新的液冷系统通过循环利用液体降低了对水资源的需求,相较于传统服务器农场,这在水资源匮乏的德州是一大优势。
为满足其巨大的能源需求——足以供应数十万户家庭,OpenAI在园区内建设了一座配备GE Vernova燃气轮机的天然气发电厂,以补充当地公用事业的电力供应。园区拥有210个风冷变电站和一座大型变电站,目前支持300兆瓦(MW)的IT负载和500兆瓦(MW)的最大容量,并计划到2026年中扩展至1吉瓦(GW),据SemiAnalysis报道。
超越xAI的Colossus
埃隆·马斯克的xAI凭借Colossus吸引了广泛关注,这座250兆瓦(MW)的数据中心拥有20万个GPU,被誉为全球AI领导者。但OpenAI的阿比林设施已领先一步,目前消耗300兆瓦(MW)电力,并配备数量未公开但极为庞大的GPU。到2026年中扩展至1吉瓦(GW)后,它将成为全球最大的单一数据中心建筑,令Colossus相形见绌。这不仅关乎声誉,更是主导AI计算能力的战略举措。
电网承压
随着OpenAI数据中心将德州电网推向极限,ERCOT已进入高度警戒状态。其能源需求堪比一座中等城市,带来了一系列严峻挑战:
- 无尽的电力需求:数十万个AI加速器需要持续、巨大的电力供应,迫使电力公司加速升级变电站、输电线路和发电能力。这对财务和物理基础设施造成压力,尤其是在尚未准备好应对如此快速增长的地区。
- 不可预测的波动:与工厂或办公室的稳定电力需求不同,AI数据中心可能在几秒钟内从满载切换到最低使用状态。这种波动给电网管理带来压力,导致电压和频率失衡。10%的偏差可能损坏电子设备或触发断路器。如果OpenAI园区突然减少电力需求,可能对电网造成冲击,潜在地关闭其他消费者或发电机,引发连锁故障。
- 协调瓶颈:整合如此大规模的设施需要与区域规划者进行复杂协调,而后者关于输电稳定性的研究落后于项目的激进时间表。
- 经济风险:电力公司可能需要投资数十亿美元以跟上步伐,但AI行业的不确定性使得回报充满变数。如果升级不足,停电将成为现实威胁。在阿比林,2021年德州停电曾导致该县六人死亡,这一前景令人担忧。
Stargate的强大阵容
Stargate LLC作为一个独立实体,汇聚了一支强大的团队:OpenAI作为AI核心和主要客户;Oracle凭借其3%的云市场份额租赁数据中心并管理超级计算机;由孙正义(Masayoshi Son)领导的SoftBank负责融资,尽管其曾因WeWork等项目失利;Crusoe负责物理建设;阿布扎比的MGX作为股权合作伙伴加入。该公司尚未任命董事会或首席执行官。
资金规模惊人:OpenAI和SoftBank各出资190亿美元($19 billion),Oracle和MGX各出资70亿美元($7 billion),并通过Primary Digital Infrastructure Inc.从JPMorgan Chase获得贷款。每个项目结合股权和债务以保持灵活性。微软曾是OpenAI的独家云服务商,但在2025年1月合同修订后成为技术合作伙伴,允许Oracle等供应商加入,微软保留优先拒绝权。
为何选择德州?为何选择阿比林?
德州是Stargate首选的天然之地。其丰富的能源资源远超其他电力稀缺的市场,且该州在新建数据中心方面领先美国,超越北弗吉尼亚。OpenAI全球事务副总裁克里斯·勒汉(Chris Lehane)称德州为“旗舰”地区,赞扬其“活力”和对新兴技术的支持。阿比林凭借重大税收优惠和对其低水耗需求的创新冷却系统支持,赢得了最终选址。
当地影响已显现。Crusoe承诺创造357个全职岗位,超过一家沃尔玛超级中心的员工规模,为餐馆、住宅开发商等带来“涟漪效应”。市长威尔登·赫特(Weldon Hurt)报告称,住房开发商、能源供应商、投资者和其他城市表现出浓厚兴趣,推动了达拉斯-沃斯堡地区的经济动能。
批评与挑战
Stargate并非没有争议。埃隆·马斯克称其为“假的”,AI规模定律(Scaling Law)共同创作者达里奥·阿莫迪(Dario Amodei)称之为“混乱”。阿里巴巴的蔡崇信(Joe Tsai)警告数据中心建设可能出现泡沫,特朗普的关税可能推高Nvidia GPU和建筑材料的成本。开发商还担心在偏远的阿比林出售物业。OpenAI首席执行官山姆·奥特曼(Sam Altman)对批评不以为然,坚称他们不需要“一天5000亿美元”,将“一步步”推进,强调对更多计算能力和资本的需求。
电网仍是最大障碍。德州的能源优势使达拉斯-沃斯堡成为全美顶级数据中心市场,但电力可用性正推动开发商转向阿比林等农村地区。新兴中心包括印第安纳州西北部、路易斯安那州、明尼阿波利斯和俄亥俄州哥伦布。前谷歌首席执行官埃里克·施密特(Eric Schmidt)甚至建议在偏远地区建设大型AI数据中心,以隐藏其免受潜在攻击,呼应核时代的战略。
Stargate的下一站
如果阿比林成功,它将成为扩张的蓝图。Crusoe正考虑在德州阿马里洛(Amarillo)布局,而OpenAI正在探索俄勒冈、宾夕法尼亚和威斯康星,并考虑租赁现有数据中心。在全球范围内,OpenAI和Oracle正在阿布扎比开发一个与Stargate LLC无关的AI数据中心,OpenAI作为客户。奥特曼将Stargate视为“AI工厂”,可能最早于2026年进军半导体生产。
这与更广泛的趋势一致:电力供应的长交付周期正推动数据中心增长向小镇和农村地区扩展,重塑市场并推动中美AI竞赛。Stargate的战略重要性显而易见,旨在保持美国在AI创新中的领先地位。
高风险的豪赌
OpenAI的Stargate项目是一座科技巨擘,超越xAI的Colossus,推动AI基础设施的边界。随着1.2吉瓦(GW)的目标即将来临,它有望重新定义计算能力,但其对电网的巨大压力、经济不确定性和快速推进的步伐是一场高风险的赌博。随着德州准备应对冲击,Stargate要么巩固OpenAI的主导地位,要么凸显追逐如此规模AI梦想的脆弱性。
本文转载自Andy730,作者:常华
