是的,Deepseek的模型只花了5M做training, 用的什么芯片不清楚
来源:
当年情
于
2024-12-31 08:17:12
[
博客
] [
旧帖
] [
给我悄悄话
] 本文已被阅读:次