2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!

新浪长文:

 

2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到

如果你以为,如今的LLM已经无所不能,那刚刚出炉的2025大模型数学竞赛结果,恐怕要让你大跌眼镜了。

现在,各模型的分数已经在MathArena上发布。

怎么说呢,所有大模型都翻车了。

即使得分最高的冠军Gemini,也只拿到了31%的分数。凭这个成绩,连拿铜牌都不大可能。

。。。

所有跟帖: 

真的吗?看看这新闻: -大观园的贾探春- 给 大观园的贾探春 发送悄悄话 大观园的贾探春 的博客首页 (265 bytes) () 07/21/2025 postreply 15:38:36

看看里面谷歌官网的新闻。谷歌的AI达到金牌标准: -大观园的贾探春- 给 大观园的贾探春 发送悄悄话 大观园的贾探春 的博客首页 (369 bytes) () 07/21/2025 postreply 15:43:11

OpenAI -挖矿- 给 挖矿 发送悄悄话 挖矿 的博客首页 (0 bytes) () 07/21/2025 postreply 15:45:37

谷歌的AI是货真价实的2025 IMO金牌标准。 -大观园的贾探春- 给 大观园的贾探春 发送悄悄话 大观园的贾探春 的博客首页 (0 bytes) () 07/21/2025 postreply 15:47:23

按照现在的出题逻辑 完全有可能的 出题也是有规律的 -挖矿- 给 挖矿 发送悄悄话 挖矿 的博客首页 (0 bytes) () 07/21/2025 postreply 15:48:21

里面只是说openAI 没和官方合作,在闭幕式以前就抢发新闻,坏了规矩。不是AI造假 -STEMkid- 给 STEMkid 发送悄悄话 (0 bytes) () 07/21/2025 postreply 16:25:16

黎曼猜想躺在那裡等AI們去掘金。。。 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 07/21/2025 postreply 16:16:25

请您先登陆,再发跟帖!