是的,Deepseek的模型只花了5M做training, 用的什么芯片不清楚
所有跟帖:
•
用的是A800,H800. 看它的open source不就知道了? 应该用了特定范围的training
-cnrhm2017-
♂
(0 bytes)
()
12/31/2024 postreply
08:21:30