是我发的,所以你想说什么呢?

来源: 2025-02-21 07:56:10 [旧帖] [给我悄悄话] 本文已被阅读:

因为deepseek达到同等效果用的资源比chatgpt少,所以scaling law没问题? 可是deepseek再把参数提升上去本身效果也远不是(log)线性的了。