11位顶尖数学家2/5 把他们自己研究里出现、已经做出来但还没公开发表的 10 个“lemma 级”问题拿出来测试 AI

本帖于 2026-02-17 13:20:03 时间, 由普通用户 Harp 编辑

GPT-5.2 ProGemini 3.0 Deepthink 一共解出 10 题中的 2 题。OpenAI 的首席科学家说内部未发布模型“可能有 6 题很有希望”       

https://arxiv.org/html/2602.05192v1 

https://www.scientificamerican.com/article/first-proof-is-ais-toughest-math-test-yet-the-results-are-mixed/

 

现在AI 的研究能力大约相当于数学系博士生;如果OpenAI 的首席科学家说的是真的,那么他家内部未发布模型就真正可以去做数学研究了.

 

 

所有跟帖: 

所以OpenAI 短时间内不会完蛋 -Harp- 给 Harp 发送悄悄话 (0 bytes) () 02/17/2026 postreply 13:20:17

请您先登陆,再发跟帖!