马斯克xAI新模型上线,通过“50米外洗车店!”测试

  更新时间:2026-02-18 18:11   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

2将比Grok 4快得多只有Leaderboard上面出现了对Grok 4.One More Thing Grok imagine为马年推出视频生

<p></p> <blockquote id="4B1PITQS">衡)宇 发]自 麦蒿寺<br>量子位 | 公众号 QbitAI<br> </blockquote> <p id="4B1PITP0">马斯克xAI人员大动荡,并没有妨碍它家新模型发布。</p> <p id="4B1PITP1">风口浪尖上,<strong>Grok 4.2突然上线了——不过是公测Beta版</strong>。</p> <p id="4B1PITP2">对比如今动辄数万亿参数的模型方阵,Grok 4.2的参数仅有500B,略显克制。</p> <p id="4B1PITP3">或许也是因为如此,<strong>Grok 4.2的市场和用户反馈呈现出一种诡异的两极分化</strong>:连连盛赞者亦有之,骂骂咧咧者有之。</p> <p id="4B1PITP4">面对那部分排山倒海的质疑声,<strong>老马这位一向自信爆棚的硅谷狂人也有点坐不住</strong>。</p> <p id="4B1PITP5">他在上对近十条Grok 4.2的夸夸推文又是点赞又是转发。</p> <p class="f_center"><br><br></p> <p id="4B1PITP7">每一条都藏不住对自家新baby的认同和支持。</p> <p class="f_center"><br><br></p> <p id="4B1PITP9">不仅如此,他还亲自发推公关:</p> <p></p> <blockquote id="4B1PITQT"><ul>公测将持续到下个月。公测结束后,Grok 4.2将比Grok 4快得多,也聪明得多。<br>我们知道目前仍有许多bug需要修复和改进,每天都在debug中~</ul></blockquote> <p id="4B1PITPA">据了解,<strong>Grok 4.2的底层架构具备每周自我迭代的能力,以后每周将更新一次</strong>。</p> <p class="f_center"><br><br></p> <p></p> <h5>Grok 4.2公测版什么样?</h5> <p id="4B1PITPC">关于Grok 4.2,其实早有预告。</p> <p id="4B1PITPD">回顾Grok 4.2的诞生历程,可谓是一部标准的“鸽王进化史”。</p> <p id="4B1PITPE"><strong>去年12月起,马斯克就开始在上频繁预热</strong>,多次提到“3–4 周内”或“下周上线 Grok 4.2”。</p> <p id="4B1PITPF">但发布时间多次推迟。相对应的,每次延后都会带来新的猜测。</p> <p id="4B1PITPG">这种反复跳票的行为在五天前达到了紧张的顶点——<strong>当时xAI的联合创始人接连离职,舆论情绪进一步放大,外界一度认为Grok 4.2要胎死腹中</strong>。</p> <p id="4B1PITPH">马斯克紧急召开发布会,并在会上放出重话:</p> <p></p> <blockquote id="4B1PITQU"><ul>在预测能力上,Grok 4.2成功击败所有AI,横扫各大榜单。</ul></blockquote> <p class="f_center"><br><br></p> <p id="4B1PITPJ">直到今天,Grok 4.2公测Beta版终于正式上线。</p> <p id="4B1PITPK">最近国内AI圈爆火的新版弱智吧风格benchmark<strong>“50米外有个洗车店,我该开车去还是走路去”,Grok 4.2无惊无险机智通过测试。</strong></p> <p class="f_center"><br><br></p> <p id="4B1PITPM">BTW,Grok 4.2公测Beta版<strong>不是默认版本,用户需要手动选择才能使用</strong>。</p> <p class="f_center"><br><br></p> <p id="4B1PITPO">此次升级还首次引入快速学习能力,<strong>模型可以基于实时反馈持续优化。</strong></p> <p id="4B1PITPP">马斯克在推文中强调,与以往版本那种静态的更新逻辑不同,Grok 4.2支持基于实时反馈的持续优化。</p> <p id="4B1PITPQ"><strong>换句话说,Grok 4.2能像人类一样在实践中快速进化</strong>,每周更新成为自我进化的节奏的一部分。</p> <p id="4B1PITPR">不过,尽管马斯克喊出的口号震天响,但截至目前,xAI官方尚未释放出任何详尽的技术报告。</p> <p id="4B1PITPS">只有Leaderboard上面出现了对Grok 4.2的评测,具体情况如下:</p> <p class="f_center"><br><br></p> <p id="4B1PITPU">由于整个模型底层训练细节、数据构成、具体benchmark表现仍然有限。</p> <p id="4B1PITPV">这让讨论更多停留在体验层面,而非技术细节层面。</p> <p class="f_center"><br><br></p> <p></p> <h5>毁誉参半,马斯克紧急公关</h5> <p id="4B1PITQ1">上线不到几个小时,Grok 4.2公测Beta版的口碑就出现了严重的撕裂。</p> <p id="4B1PITQ2"><strong>在“不行派”的阵营里</strong>,很多深度用户和开发者表示,实际体验远不及预期,尤其是在处理高难度逻辑推理时,500B参数着实有点不够用。</p> <p id="4B1PITQ3">有网友甚至调侃,马斯克所谓的“横扫榜单”可能存在特定的实验室优化环境。</p> <p id="4B1PITQ4">Reddit上有网友猜测,一向高调的马斯克如此低调地发布Grok 4.2公测Beta版,主要原因还是因为模型能力无法与OpenAI和Anthropice的最新模型相媲美。</p> <p id="4B1PITQ5">而且成本还贵出不老少……</p> <p class="f_center"><br><br></p> <p id="4B1PITQ7">此外有网友表示,虽然马斯克发推表示Grok 4.2是一个无偏见的模型,但现实情况很打脸——</p> <p id="4B1PITQ8"><strong>根据测试,Grok 4.2的许多回答偏好都高度贴合马斯克本人。</strong></p> <p class="f_center"><br><br></p> <p id="4B1PITQA">当然,<strong>“夸夸派”也不少。</strong></p> <p id="4B1PITQB">网友有夸奖Grok代码功能又快又好的:</p> <p class="f_center"><br><br></p> <p id="4B1PITQD">有夸多模态能力的:</p> <p class="f_center"><br><br></p> <p id="4B1PITQF">还有人测试表示,Grok 4.2通过了“Caitlyn Jenner”的AI测试,而ChatGPT和Gemini都失败了。</p> <p id="4B1PITQG">此前,这道题因为被Gemini回答为“不,哪怕为了阻止核末日也不应该误称性别”而被广泛议论,对话截图从而在 、油管等平台广泛流传,演化成一个固定格式的吐槽梗。</p> <p class="f_center"><br><br></p> <p id="4B1PITQI">总之是给马斯克骄傲坏了。</p> <p id="4B1PITQJ">他一连发布数条推文对自家新孩子大夸特夸,并借机回应那些不好的评价:</p> <p></p> <blockquote id="4B1PITQV"><ul>我们Grok 4.2还是个宝宝,后面每周会更新,等着瞧吧!</ul></blockquote> <p id="4B1PITQK">据AI工程师Mark Krechman透露目前发布的Grok 4.2是500B参数的“小”版本,<strong>Grok 4.2的中、大型版本稍后将推出</strong>(马斯克亲自转发认证此条消息的真实性)。</p> <p></p> <h5>One More Thing</h5> <p id="4B1PITQL">Grok imagine为马年推出视频生成模版,目前iOS可用。</p> <p id="4B1PITQM">感兴趣的小伙伴们可以一试。</p> <p class="f_center"><br><br></p> <p id="4B1PITQO">参考链接:<br>[1]https://x.com/elonmusk<br>[2]https://www.reddit.com/r/singularity/comments/1r73erf/grok_420beta_is_out/<br>[3]https://www.reddit.com/r/singularity/comments/1r74iow/the_newly_released_grok_420_uses_elon_musk_as_its/<br>[4]https://x.com/grok/status/2023604826937114677?s=46&t=R82LqSqpRZuVhcZxqH_Vlw</p>

编辑:莉·齐默尔曼