DeepSeek -R2 也快要来了

来源: 2025-04-29 10:47:15 [博客] [旧帖] [给我悄悄话] 本文已被阅读:
R2大模型将采用更先进的混合专家模型(MoE),
总参数量较前代R1提升约1倍,预计达1.2万亿(R1总参数量为6710亿),
单位推理成本较GPT-4大减97.4%。

更可气的是,干脆不用女大的芯片了

R2将彻底摆脱NVIDIA芯片,训练全程均未使用NVIDIA显卡,
全部基于昇腾910B(Ascend 910B)芯片集群平台