DeepSeek -R2 也快要来了

来源: 碰碰胡于 2025-04-29 10:47:15 [博客] [旧帖] [给我悄悄话] 本文已被阅读：次

R2大模型将采用更先进的混合专家模型（MoE），
总参数量较前代R1提升约1倍，预计达1.2万亿（R1总参数量为6710亿），
单位推理成本较GPT-4大减97.4%。

更可气的是，干脆不用女大的芯片了

R2将彻底摆脱NVIDIA芯片，训练全程均未使用NVIDIA显卡，
全部基于昇腾910B（Ascend 910B）芯片集群平台

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.