DeepSeek -R2 也快要来了

来源: 碰碰胡于 2025-04-29 10:47:15 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (605 bytes)

R2大模型将采用更先进的混合专家模型（MoE），
总参数量较前代R1提升约1倍，预计达1.2万亿（R1总参数量为6710亿），
单位推理成本较GPT-4大减97.4%。

更可气的是，干脆不用女大的芯片了

R2将彻底摆脱NVIDIA芯片，训练全程均未使用NVIDIA显卡，
全部基于昇腾910B（Ascend 910B）芯片集群平台

您的位置：文学城 » 论坛 » 我爱我家 » DeepSeek -R2 也快要来了