R2大模型将采用更先进的混合专家模型(MoE), 总参数量较前代R1提升约1倍,预计达1.2万亿(R1总参数量为6710亿), 单位推理成本较GPT-4大减97.4%。
更可气的是,干脆不用女大的芯片了
R2将彻底摆脱NVIDIA芯片,训练全程均未使用NVIDIA显卡, 全部基于昇腾910B(Ascend 910B)芯片集群平台
R2大模型将采用更先进的混合专家模型(MoE), 总参数量较前代R1提升约1倍,预计达1.2万亿(R1总参数量为6710亿), 单位推理成本较GPT-4大减97.4%。
更可气的是,干脆不用女大的芯片了
R2将彻底摆脱NVIDIA芯片,训练全程均未使用NVIDIA显卡, 全部基于昇腾910B(Ascend 910B)芯片集群平台
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy