那么什么叫overall,就现在有数那几个大模型才叫overall。现在关键是在哪个点上scaling law不行了

grok3基本已经证明了现在产不多就处在这个点上了,奥特曼为了维护他5000亿造算力的童话,不得不硬着头皮继续吹而已。

所有跟帖: 

是我发的,所以你想说什么呢? -bulubulu- 给 bulubulu 发送悄悄话 (185 bytes) () 02/21/2025 postreply 07:56:10

你不是专家,所以你可能就无法理解什么叫做“性能与资源消耗的log成正比” -bulubulu- 给 bulubulu 发送悄悄话 (320 bytes) () 02/21/2025 postreply 08:06:34

Current implementation of llm models will continue -bulubulu- 给 bulubulu 发送悄悄话 (301 bytes) () 02/21/2025 postreply 08:20:34

请您先登陆,再发跟帖!