是的,Deepseek的模型只花了5M做training, 用的什么芯片不清楚

请您先登陆,再发跟帖!