NVIDIA 推出Rubin CPX,专为AI推理设计的GPU

发布于 2025-9-11 22:34
浏览
0收藏

NVIDIA发布Rubin CPX,这是一款专门为大规模上下文AI推理设计的新型GPU。

Rubin CPX采用30 petaflops算力和NVFP4精度,配备128GB GDDR7内存。与现有的GB300 NVL72系统相比,性能提升7.5倍,attention处理速度快3倍。这款芯片将视频编解码器和长文本推理处理集成在单个芯片中。

NVIDIA 推出Rubin CPX,专为AI推理设计的GPU-AI.x社区

新推出的Vera Rubin NVL144 CPX平台将8 exaflops AI算力、100TB快速内存和1.7 petabytes/秒内存带宽装入单个机架。该平台支持NVIDIA Quantum-X800 InfiniBand和Spectrum-X以太网连接方案。

Rubin CPX主要面向两个应用场景。第一是百万token级别的代码生成,能够理解和优化大规模软件项目。第二是长视频内容处理,单小时视频内容可达百万token规模。

多家AI公司已确认将使用这项技术。Cursor计划用Rubin CPX提升开发者生产力。视频生成公司Runway将用于支持更长时长和更复杂的创作工作流程。AI研究公司Magic正在开发能处理百万token上下文的AI代理,包括完整代码库、交互历史和文档库。

NVIDIA表示,投资1亿美元的Vera Rubin NVL144 CPX系统可产生50亿美元的token处理收入。

在软件支持方面,Rubin CPX将兼容完整的NVIDIA AI软件栈,包括NVIDIA Dynamo平台、Nemotron多模态模型、NVIDIA AI Enterprise以及CUDA-X库。这些软件工具将帮助企业部署和优化长文本AI应用。

Rubin CPX预计于2026年底正式上市。

本文转载自​AI工程化​,作者:ully

已于2025-9-11 22:34:43修改
收藏
回复
举报
回复
相关推荐