11位顶尖数学家2/5 把他们自己研究里出现、已经做出来但还没公开发表的 10 个“lemma 级”问题拿出来测试 AI

来源: 2026-02-17 12:55:27 [旧帖] [给我悄悄话] 本文已被阅读:

GPT-5.2 ProGemini 3.0 Deepthink 一共解出 10 题中的 2 题。OpenAI 的首席科学家说内部未发布模型“可能有 6 题很有希望”       

https://arxiv.org/html/2602.05192v1 

https://www.scientificamerican.com/article/first-proof-is-ais-toughest-math-test-yet-the-results-are-mixed/

 

现在AI 的研究能力大约相当于数学系博士生;如果OpenAI 的首席科学家说的是真的,那么他家内部未发布模型就真正可以去做数学研究了.