因为deepseek达到同等效果用的资源比chatgpt少,所以scaling law没问题? 可是deepseek再把参数提升上去本身效果也远不是(log)线性的了。
是我发的,所以你想说什么呢?
所有跟帖:
•
你不是专家,所以你可能就无法理解什么叫做“性能与资源消耗的log成正比”
-bulubulu-
♂
(320 bytes)
()
02/21/2025 postreply
08:06:34
•
Current implementation of llm models will continue
-bulubulu-
♂
(301 bytes)
()
02/21/2025 postreply
08:20:34