DeepSeek R1 最多也就是赶上 OpenAI o1-1217

Bob007 · 2025-01-27 19:04:14Z

DeepSeek R1 最多也就是赶上 OpenAI o1-1217简介

来源: Bob007 于 2025-01-27 19:04:14 [档案] [旧帖] [给我悄悄话] 阅读数 : (14743 bytes)

Benchmark	DeepSeek-R1 (%)	OpenAI o1-1217 (%)	Verdict
AIME 2024 (Pass@1)	79.8	79.2	DeepSeek-R1 wins (better math problem-solving)
Codeforces (Percentile)	96.3	96.6	OpenAI-o1-1217 wins (better competitive coding)
GPQA Diamond (Pass@1)	71.5	75.7	OpenAI-o1-1217 wins (better general QA performance)
MATH-500 (Pass@1)	97.3	96.4	DeepSeek-R1 wins (stronger math reasoning)
MMLU (Pass@1)	90.8	91.8	OpenAI-o1-1217 wins (better general knowledge understanding)
SWE-bench Verified (Resolved)	49.2	48.9	DeepSeek-R1 wins (better software engineering task handling)

您的位置：文学城 » 论坛 » 时事述评 » DeepSeek R1 最多也就是赶上 OpenAI o1-1217

• 轻松赶上，超越后就一骑绝尘了 -Amerix- ♂ (0 bytes) () 01/27/2025 postreply 19:06:44

• 说啥呢，o1 o3 哪来的第四代 -监考老师- ♂ (0 bytes) () 01/27/2025 postreply 19:32:03

• GPT-4 -victor1988- ♂ (0 bytes) () 01/27/2025 postreply 20:17:38

• o1 不是 GPT-1 -监考老师- ♂ (0 bytes) () 01/27/2025 postreply 21:53:15

• 比的还是OpenAI 一个月前的产品 -Bob007- ♂ (0 bytes) () 01/27/2025 postreply 19:07:28

• 海量烧钱，后劲不足了 -Amerix- ♂ (0 bytes) () 01/27/2025 postreply 19:10:56

• 这是AI比较ChatGPT和Mathematica -Bob007- ♂ (1108 bytes) () 01/28/2025 postreply 06:09:29