是我发的,所以你想说什么呢?

因为deepseek达到同等效果用的资源比chatgpt少,所以scaling law没问题? 可是deepseek再把参数提升上去本身效果也远不是(log)线性的了。

所有跟帖: 

你不是专家,所以你可能就无法理解什么叫做“性能与资源消耗的log成正比” -bulubulu- 给 bulubulu 发送悄悄话 (320 bytes) () 02/21/2025 postreply 08:06:34

Current implementation of llm models will continue -bulubulu- 给 bulubulu 发送悄悄话 (301 bytes) () 02/21/2025 postreply 08:20:34

请您先登陆,再发跟帖!