它用“蒸馏”过的数据直接做RL,类似于在OpenAI 上做fine tuning, 当然省钱省事。

回答: Deepseek用Transformer吗?Bob0072025-01-26 20:35:26
请您先登陆,再发跟帖!