马斯克的Grok 4又炸场了!
泄露的跑分显示,那个号称“人类最后考试”的HLE测试,它居然拿了45%的高分。
这比谷歌Gemini高了整整24个百分点,是Claude的4倍多。
HLE可是AI界最难的关卡,覆盖100多学科2500道题,专治各种吹牛模型。
Grok 4这次全面碾压对手。
在数学和编程测试里也领先。
马斯克说它基于“第一性原理”推理,像物理学家一样思考。

马斯克的Grok 4又炸场了!
泄露的跑分显示,那个号称“人类最后考试”的HLE测试,它居然拿了45%的高分。
这比谷歌Gemini高了整整24个百分点,是Claude的4倍多。
HLE可是AI界最难的关卡,覆盖100多学科2500道题,专治各种吹牛模型。
Grok 4这次全面碾压对手。
在数学和编程测试里也领先。
马斯克说它基于“第一性原理”推理,像物理学家一样思考。

下一篇:比卢普斯一对一指导杨瀚森