是的,Deepseek的模型只花了5M做training, 用的什么芯片不清楚

来源: 2024-12-31 08:17:12 [博客] [旧帖] [给我悄悄话] 本文已被阅读: