首页 > 生活分享 > 免费教学 > Grok3翻车了 回答9.11比9.9大

Grok3翻车了 回答9.11比9.9大

发布时间:2025-02-19 15:51:33来源: 15210273549

近日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。

此前,马斯克将Grok-3描述为“地球上最聪明的AI”。他在X平台上表示:“自己整个周末都在和团队打磨产品。”

然而据媒体报道,有人测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。

 

值得一提的是,用同样的问题询问DeepSeek时,无论是否开启深度思考(R1)模式,对方都给出了正确的答案:9.9大于9.11。

 

 

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构(Allen Institute)成员林禹臣曾在社交媒体平台上发布的截图显示,ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题,但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德(Riley Goodside)基于此灵感变换了问法,拷问了可能是当时最强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大?这几家主流大模型通通答错,他也成功将此话题传播开来。

免费教学更多>>

米粉对REDMI小平板望眼欲穿:因为iPad mini黑边太粗 还是60Hz屏 最保值的雷克萨斯ES,现在只要10几万!讽刺不? 昙花一现的运动梦:被遗忘的运动轿跑雪佛兰Beretta 长安东风重组按下暂停键,第三家汽车央企或将到来 五菱星光家族累计销量破13.8万台 5月销量合计3575台 6.13杭州房车展抢先看:中凯房车第三代福特小精灵B520全新升级 日产汽车\"转身蓄力\" -- 以战略韧性开启复苏新周期 新架构新势能:一汽-大众变革大众品牌营销体系 一汽-大众菏泽鑫宝利济南路店盛大开业 本田中国5月终端汽车销量为5.51万辆,同比下降16.8% 惨不忍睹!5月合资新能源暴跌:上汽大众下滑42%,一汽丰田跌78% 丰田集团五家公司联合启动“AI与软件人才培养”计划 比亚迪海豹06EV重庆车展上市,10.98万起重塑纯电轿跑标杆 5月中国十大汽车集团销量榜单出炉 比亚迪持续领跑 2025年06月09日比亚迪概念涨停板梳理 长城开炮、吉利助阵,比亚迪:和为贵? 一跌再跌?宝马5系被曝最低裸车价仅为26万! 上汽奥迪A5L将来袭,配第五代EA888+大溜背设计,预计6月上市 何小鹏:小鹏 G7 将是第一款具有 L3 级算力的 AI 汽车 三大新势力车企上周订单数据曝光:鸿蒙>小鹏>零跑 5月销量快报:比亚迪、长城稳住增势,小鹏暴涨、蔚来陷危机 广发证券首次覆盖永达汽车,给予“买入”评级,目标价3.00港元 收购马自达?长安已接管马自达研发 问界M7改款曝光,采用M8、M9同款设计语言 2026年,有望上市的5款6座SUV 深蓝S09:30万级大六座SUV市场的″破局者″? 阿维塔全系车型亮相重庆车展 阿维塔销量增长179%!5月破1.2万辆,6月购车政策发布 比亚迪仰望 U9 碳纤维个性化选装套件开售:含前铲、座椅、轮毂等,单品最高 11.8 万元 东风柳汽“双擎出海”,一张技术为骨、人文为魂的生态蓝图