看来DeepSeek也不需要象Alex Wang说的用了几万块H100也能训练成功

请您先登陆,再发跟帖!