11位顶尖数学家2/5 把他们自己研究里出现、已经做出来但还没公开发表的 10 个“lemma 级”问题拿出来测试 AI
GPT-5.2 Pro和 Gemini 3.0 Deepthink 一共解出 10 题中的 2 题。OpenAI 的首席科学家说内部未发布模型“可能有 6 题很有希望”
https://arxiv.org/html/2602.05192v1
现在AI 的研究能力大约相当于数学系博士生;如果OpenAI 的首席科学家说的是真的,那么他家内部未发布模型就真正可以去做数学研究了.
GPT-5.2 Pro和 Gemini 3.0 Deepthink 一共解出 10 题中的 2 题。OpenAI 的首席科学家说内部未发布模型“可能有 6 题很有希望”
https://arxiv.org/html/2602.05192v1
现在AI 的研究能力大约相当于数学系博士生;如果OpenAI 的首席科学家说的是真的,那么他家内部未发布模型就真正可以去做数学研究了.