新浪长文:
2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到
如果你以为,如今的LLM已经无所不能,那刚刚出炉的2025大模型数学竞赛结果,恐怕要让你大跌眼镜了。
现在,各模型的分数已经在MathArena上发布。
怎么说呢,所有大模型都翻车了。
即使得分最高的冠军Gemini,也只拿到了31%的分数。凭这个成绩,连拿铜牌都不大可能。
。。。
如果你以为,如今的LLM已经无所不能,那刚刚出炉的2025大模型数学竞赛结果,恐怕要让你大跌眼镜了。
现在,各模型的分数已经在MathArena上发布。
怎么说呢,所有大模型都翻车了。
即使得分最高的冠军Gemini,也只拿到了31%的分数。凭这个成绩,连拿铜牌都不大可能。
。。。
•
真的吗?看看这新闻:
-大观园的贾探春-
♀
(265 bytes)
()
07/21/2025 postreply
15:38:36
•
看看里面谷歌官网的新闻。谷歌的AI达到金牌标准:
-大观园的贾探春-
♀
(369 bytes)
()
07/21/2025 postreply
15:43:11
•
OpenAI
-挖矿-
♂
(0 bytes)
()
07/21/2025 postreply
15:45:37
•
谷歌的AI是货真价实的2025 IMO金牌标准。
-大观园的贾探春-
♀
(0 bytes)
()
07/21/2025 postreply
15:47:23
•
按照现在的出题逻辑 完全有可能的 出题也是有规律的
-挖矿-
♂
(0 bytes)
()
07/21/2025 postreply
15:48:21
•
里面只是说openAI 没和官方合作,在闭幕式以前就抢发新闻,坏了规矩。不是AI造假
-STEMkid-
♂
(0 bytes)
()
07/21/2025 postreply
16:25:16
•
黎曼猜想躺在那裡等AI們去掘金。。。
-喀爾判0715-
♀
(0 bytes)
()
07/21/2025 postreply
16:16:25
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy