OpenAI o3和DeepSeek R1在数学benchmarks的成绩比较：

大观园的贾探春 · 2025-02-01 22:46:00Z

OpenAI o3和DeepSeek R1在数学benchmarks的成绩比较：简介

来源: 大观园的贾探春于 2025-02-01 22:46:00 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (1279 bytes)

本帖于 2025-02-01 22:47:23 时间, 由普通用户大观园的贾探春编辑

ChatGPT的回答：

Here's the comparison of math-related benchmark performance between OpenAI o3 and DeepSeek R1, excluding any benchmarks where one of the models’ numbers is unknown:

AIME 2024:
- OpenAI o3: 96.7% accuracy
- DeepSeek R1: 79.8%
Graduate-Level Google-Proof Q&A (GPQA) Benchmark:
- OpenAI o3: 87.7%
- DeepSeek R1: 71.5%

The MATH-500 benchmark data is only available for DeepSeek R1, so no comparison is made for that benchmark.

您的位置：文学城 » 论坛 » 子女教育 » 数学 » OpenAI o3和DeepSeek R1在数学benchmarks的成绩比较：

所有跟帖：

• 谢谢double check。我用的是free o3。你再试一下，2023 AIME I p15 -bigcat2026- ♂ (0 bytes) () 02/01/2025 postreply 22:53:43

• 谢谢！借这贴问一下，chatGPT, Deepseek, Gemini, Copolit 这些tools -newca- ♀ (400 bytes) () 02/02/2025 postreply 03:55:49

请您先登陆，再发跟帖！