马斯克亮AI王牌：Grok 4.1发布，智商情商双在线霸榜，背后团队被传是“全华班”_财经

创始人

2025-11-18 17:55:57

0次

出品｜搜狐科技

作者｜郑松毅

大模型王位，再次易主。

数小时前，马斯克旗下人工智能公司xAI放出最新模型Grok 4.1，主打“智商情商双在线”，正面硬刚GPT-5.1。

据xAI介绍，本次Grok 4.1共有两个版本：Grok 4.1 Thinking（推理）和Grok 4.1（非推理）。目前，Grok 4.1已向全网用户开放，可在Grok官网、X平台以及iOS和Android应用中免费体验。

从测试结果看，在公认大模型排名榜单LMArena中，Grok 4.1 Thinking以1483分的成绩一举加冕全球大模型之王，超越Gemini 2.5 Pro 31分。而非推理模式的Grok 4.1，也直接杀到榜单第二。

值得一提的是，Grok 4.1的情商进步明显，具备了更高的理解力、洞察力、同理心和人际交往能力。

在情商测试EQ-Bench3中，Grok 4.1 Thinking以1586分的成绩同样霸榜，Grok 4.1位居第二，排名第三的是国产模型Kimi K2。

从实测效果看，对比上一代Grok模型，Grok 4.1变成了一位更具耐心的倾听者，且共情能力凸显。细节的是，还在回复结尾位置比了个心。

此外，Grok 4.1的创意写作能力较上一代足足提升了600分，语言表达流畅有画面感。而且，基于训练方法的优化，模型幻觉率比之前降低了3倍（从12.09%降至4.22%）。

据介绍，为实现上述提升，xAI在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征。并且，xAI开发了全新方法，能够利用前沿智能体式推理模型作为奖励模型，从而实现大规模自主评估和迭代响应。

xAI负责后训练的Dustin Tran分享了更多细节，他表示，新模型的改进主要在强化学习上，将RLHF推向了前所未有的新高度。

“在过去的几个月里，我们由十几个人组成的团队利用用户在真实对话中的偏好，以及基于强大推力能力进行评分的智能体奖励模型，对强化学习的算法进行了全面改进。此外，我们还将强化学习的规模扩大10倍。”

作为AI赛道的后起之秀，xAI能取得今天的成绩与老马的人才战略也密不可分。最近xAI的团队合影在社交平台疯传：满屏望去清一色黑头发黄皮肤的华人面孔。另有消息称马斯克已经辞退了Grok团队的最后一名白人成员，硬是把团队打造成了“全华班”。

比起Grok 4.1，很多人更好奇为何宣传已久的Grok 5迟迟不来？

有报道称，“xAI 推迟发布Grok 5，部分原因在于开发过程中遇到的资源限制和极其严格的测试需求。”

马斯克在近日最新访谈中回应，“作为迈向通用人工智能（AGI）的关键一步，Grok 5预计拥有约6万亿参数，其训练和优化需要巨大的计算能力，并将成为世界上最智能的人工智能。因此，Grok 5的全面测试和开发工作需要更多时间才能达到预期的高标准，将在明年发布。”

整体来看，本次Grok 4.1的发布不仅是技术迭代，也是马斯克AI战略的强力宣言，为 Grok 5和最终实现AGI目标铺设道路。但也有业内人士认为，“它仍可能不是今年最好的模型型号，等着看谷歌即将发布的Gemini 3.0模型表现。”