看来DeepSeek也不需要象Alex Wang说的用了几万块H100也能训练成功

来源: 2025-02-06 10:25:50 [旧帖] [给我悄悄话] 本文已被阅读: