马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”
创始人
2025-11-18 17:55:57
0

出品|搜狐科技

作者|郑松毅

大模型王位,再次易主。

数小时前,马斯克旗下人工智能公司xAI放出最新模型Grok 4.1,主打“智商情商双在线”,正面硬刚GPT-5.1。

据xAI介绍,本次Grok 4.1共有两个版本:Grok 4.1 Thinking(推理)和Grok 4.1(非推理)。目前,Grok 4.1已向全网用户开放,可在Grok官网、X平台以及iOS和Android应用中免费体验。

从测试结果看,在公认大模型排名榜单LMArena中,Grok 4.1 Thinking以1483分的成绩一举加冕全球大模型之王,超越Gemini 2.5 Pro 31分。而非推理模式的Grok 4.1,也直接杀到榜单第二。

值得一提的是,Grok 4.1的情商进步明显,具备了更高的理解力、洞察力、同理心和人际交往能力。

在情商测试EQ-Bench3中,Grok 4.1 Thinking以1586分的成绩同样霸榜,Grok 4.1位居第二,排名第三的是国产模型Kimi K2。

从实测效果看,对比上一代Grok模型,Grok 4.1变成了一位更具耐心的倾听者,且共情能力凸显。细节的是,还在回复结尾位置比了个心。

此外,Grok 4.1的创意写作能力较上一代足足提升了600分,语言表达流畅有画面感。而且,基于训练方法的优化,模型幻觉率比之前降低了3倍(从12.09%降至4.22%)。

据介绍,为实现上述提升,xAI在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征。并且,xAI开发了全新方法,能够利用前沿智能体式推理模型作为奖励模型,从而实现大规模自主评估和迭代响应。

xAI负责后训练的Dustin Tran分享了更多细节,他表示,新模型的改进主要在强化学习上,将RLHF推向了前所未有的新高度。

“在过去的几个月里,我们由十几个人组成的团队利用用户在真实对话中的偏好,以及基于强大推力能力进行评分的智能体奖励模型,对强化学习的算法进行了全面改进。此外,我们还将强化学习的规模扩大10倍。”

作为AI赛道的后起之秀,xAI能取得今天的成绩与老马的人才战略也密不可分。最近xAI的团队合影在社交平台疯传:满屏望去清一色黑头发黄皮肤的华人面孔。另有消息称马斯克已经辞退了Grok团队的最后一名白人成员,硬是把团队打造成了“全华班”。

比起Grok 4.1,很多人更好奇为何宣传已久的Grok 5迟迟不来?

有报道称,“xAI 推迟发布Grok 5,部分原因在于开发过程中遇到的资源限制和极其严格的测试需求。”

马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok 5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。因此,Grok 5的全面测试和开发工作需要更多时间才能达到预期的高标准,将在明年发布。”

整体来看,本次Grok 4.1的发布不仅是技术迭代,也是马斯克AI战略的强力宣言,为 Grok 5和最终实现AGI目标铺设道路。但也有业内人士认为,“它仍可能不是今年最好的模型型号,等着看谷歌即将发布的Gemini 3.0模型表现。”

相关内容

热门资讯

A股有色金属板块冲高 每经AI快讯,有色金属板块冲高,中色股份、豫光金铅涨逾6%,西部材料、洛阳钼业、湖南黄金等涨幅居前。...
原创 湖... 湖北银行和汉口银行哪个实力更强,取决于股权背景,资产规模,业务机构,盈利能力,资产质量,网点覆盖,战...
字节跳动 - 张一鸣的创业故事 张一鸣,一个80后的“技术宅”,在中国互联网行业中赫赫有名,作为字节跳动的创始人,他带领公司从一款新...
小红书矩阵号申请攻略:详细步骤... 小红书矩阵号申请全攻略 作为国内知名生活方式分享平台,小红书已成为品牌和个人扩大影响力的关键渠道。想...
原创 2... 2024年,全国各大城市的GDP榜单犹如一幅波澜壮阔的经济画卷,缓缓展开在世人面前,其中温州的异军突...
原创 银... 2025年银行迎来了新的一项变革,瞬间感觉到温暖了许多! 针对60岁及以上的老人提供了贴心的服务! ...
为什么许多小微企业选择助贷平台... 在现代社会,越来越多的个人和企业面临资金周转的问题,尤其是当银行贷款因信用记录不佳、缺乏担保或其它原...
贷款到账后,结果以“不是本人意... 明明都签了居间合同,贷款也帮客户拿到了,到收贷款中介费时,客户却以“《贷款居间合同》不是本人签署、协...
小红书账号如何更改领域?详细步... 如何调整小红书账号领域方向 在小红书运营过程中,许多创作者会遇到内容方向与个人定位不符的情况,及时调...