
回复
就在半小时前,马斯克的Grok4终于正式发布了。
Grok3.5跳票。老马的直播还迟到1h也是没谁了,全世界都被耍猴。
最贵版本,300美刀,可以思考大几十分钟,一般人也用不上。
直播表示,Grok-4“能够进行超人级别的推理”(It can reason at a superhuman level!),并且在多项高难度基准测试上实现了对现有顶尖模型的碾压。
Artificial Analysis 获得早期访问权限并发布了 Grok 4 基准测试,数据着实恐怖。
今天的循环回到了XAI~
马斯克表示:“Grok-4几乎在所有学科上都比人类研究生更聪明。”
继续延续上一代的阔气:
xAI认为,可靠的信号是强化学习成功的关键,而他们已经找到了让模型在智能上实现巨大飞跃的路径。
Grok-4在多个被认为是衡量模型推理能力“天花板”的基准上,交出了一份近乎完美的答卷。
马斯克:“AI的终极推理测试,是在现实世界中运行。而这些数据表明,Grok-4正朝着解决真实、复杂问题的通用智能体方向大步迈进。”
关于下一步,xAI的目标非常明确:更快、更智能。编程(Coding)和更强大的多模态Agent将是接下来的核心焦点。
天气卡片是简陋的。
写文是低能的。
做题对了~
本文转载自探索AGI,作者:猕猴桃