最新的Math500模型测试准确率对比

来源: 2025-02-14 15:27:52 [旧帖] [给我悄悄话] 本文已被阅读:

Qwen2.5-0.5B-Inst.                       76.4 
Qwen2.5-1.5B-Inst.                        81.8 
DeepScaleR-1.5B-Preview.              87.8
DeepSeek-R1-Distill-Qwen-1.5B      91.6 
DeepSeek-R1-Distill-Qwen-7B        95.2 
S1.1-32B  (FeiFei Li,Qwen)            95.4
DeepSeek-R1                                 97.3