Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤? 原创

发布于 2025-7-2 16:53
浏览
0收藏

编辑 | 伊风

出品 | 51CTO技术栈(微信号:blog51cto)

Grok 4真的要来了!

马斯克预告多次的Grok 3.5跳票,直接给大家端上4.0的更强版本。

为了这一次发布能够给AI圈一点震撼,Grok团队也是真的够拼,又一次把帐篷搭进了办公室。

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?-AI.x社区图片

此前,马斯克已经官宣将在7.4日后正式上线。但就在刚刚,X 网友 @AiBattle_ 爆料称:Grok 4 的源码疑似泄露!

从泄露内容来看,Grok 4 系列至少包含两个模型:

✅ 一款通用旗舰模型

✅ 一款专为编程设计的代码模型

Grok 4:

 “我们最新、最出色的旗舰机型,在自然语言、数学和推理方面提供无与伦比的性能,堪称万能的完美之选。” 

Grok 4 Code:

 “专为您的编码伴侣而设计的模型。您可以向它查询代码问题,或将其嵌入编辑器。”

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?-AI.x社区图片

此外,一张疑似来自开发者控制台的界面截图也流出,显示 Grok 4 已接入 API,正式可用!

上下文窗口大小为 131,072  tokens,相当于 100,000 词以上(约 300 页书)的上下文容量,略小于Claude 3.5 Sonnet 的200k。

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?-AI.x社区图片

那么,Grok 4值得期待的看点有哪些?

1.Grok 4 Code,马斯克挤入编程混战

Grok 版本号的跃升是马斯克的决定——希望能传递出一个信号:Grok 4的发布不是简单的更新迭代,而是一次标志性的技术突破,尤其是在编程领域。

马斯克在 X 上多次发文,称团队正在“夜以继日优化 Grok”,并强调还需“再跑一次大型训练”,特别针对一个专用编码模型进行最后调整。Grok 4 并不是单一模型的升级,而是包含了专为程序员打造的子模型。

这个子模型,正是 Grok 4 Code ——据知情人士透露,它将配套推出一个模拟 VS Code 的原生代码编辑器,深度对接开发者日常使用习惯,目标直指 “AI × 编程”的真实工作流场景。

长期以来,编程被视为 Grok 的短板。但随着 AI 编程全面进入“军备竞赛”阶段,马斯克显然也意识到必须补上这一课。

LiveBench.ai 公布的基准测试数据显示,当前版本 Grok 3 Mini Beta 在编程能力上明显落后于行业头部模型:

  • Grok 3 Mini Beta 的编程得分仅为 54.52,与排名第一的 o4-Mini High 相差 25.46 分,是所有评估项中差距最大的一项。
  • 在 “代理式编程”(Agentic Programming)任务上——即让 AI 独立完成复杂编程任务的能力——Grok 的得分仅为 15.00,而 o3 High 高达 36.67。

这一切正好解释了为什么 Grok 4 要押宝代码模型:xAI 想用一记重拳,补齐在 AI 编程上的最大短板。

2.Grok再获融资,马斯克狂囤算力

埃隆·马斯克的 AI 公司 xAI,正在持续加码。

美国投资银行摩根士丹利(Morgan Stanley)周一表示,埃隆·马斯克(Elon Musk)创办的人工智能公司 xAI,已通过债务和股权两种方式合计融资 100 亿美元,为其下一阶段的 AI 战役蓄足火力。

据报道,50 亿美元通过担保票据和定期贷款完成,另外 50 亿美元来自战略性股权投资。

这笔资金将为 xAI 提供更多“火力”,用于建设基础设施并开发其主打产品——Grok ,以与继续和死对头 OpenAI,以及亚马逊投资的 Anthropic 等竞争对手展开较量。

马斯克在今年 5 月曾对 CNBC 表示,xAI 已在其位于田纳西州孟菲斯的 Colossus 超级计算中心部署了 20 万块 GPU。Colossus 是 xAI 用于训练 AI 模型的超级计算机。

更激进的是,xAI 正计划在孟菲斯以外新建一座规模高达 100 万块 GPU 的超级设施,并继续向英伟达(Nvidia)和超威(AMD)等半导体巨头采购芯片,补足算力需求。

摩根士丹利表示:“这笔资金将支持 xAI 持续开发尖端 AI 解决方案,包括全球最大的数据中心之一及其旗舰平台 Grok。”

3.写在最后:AI编程是兵家必争之地

Grok 4的排兵布阵,再次让人意识到AI编程的战略意义。

昨天写苹果报道的时候,小编发现:仅仅一年时间,苹果最心仪的合作对象就从 OpenAI 转向了 Claude。详情可阅读:苹果自研AI被爆失败!Siri拟换脑:GPT与Claude决胜负!后者开出天价:年费数十亿才给用,年年涨价!网友:这下苹果尴尬了

更令人震惊的是,Claude 给出的合作报价居然高达数十亿美元——这不仅是要价,更是对自身技术实力的高度自信。

Claude 的强大编程能力,显然为它赢得了核心筹码,也确立了一个不可忽视的竞争地位。

最后,结合近期的AI圈动向,我们不禁感慨:想打赢这场 AI 战役,多少得有点“囤积癖”。

小扎疯狂囤人才,而马斯克极限囤算力——AI 格局的主角们,谁都不再“轻装上阵”。

无论如何,就让我们拭目以待几天后的 Grok 4 是否如期登场。

它能否补上编程短板?能否在 Claude 与 GPT 之间杀出一条新路?

我们也想听听你的声音:

你是否用过 Grok 家族的模型?你会看好 Grok 4 Code 吗?

本文转载自​​51CTO技术栈​​,作者:伊风

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐