他自己说的

"I came up with this whole idea while optimizing wllama to run deepseek-r1-distilled-qwen-1.5B faster. So the bigger deepseek helping optimize code to run the smaller deepseek."

所有跟帖: 

这个和gpu 指令优化没关系。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 17:34:54

请您先登陆,再发跟帖!