2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!

来源: 2025-07-21 15:35:04 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

新浪长文:

 

2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到

如果你以为,如今的LLM已经无所不能,那刚刚出炉的2025大模型数学竞赛结果,恐怕要让你大跌眼镜了。

现在,各模型的分数已经在MathArena上发布。

怎么说呢,所有大模型都翻车了。

即使得分最高的冠军Gemini,也只拿到了31%的分数。凭这个成绩,连拿铜牌都不大可能。

。。。