举个例子,Linux 计算 blas库里面嵌套汇编的例子太多了,不代表blas可以轻松移植到其他cpu.

所有跟帖: 

这些最终的汇编不是自己写的,是AI根据标注生成的 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:39:04

Blas 库里面SIMD 是最基本的汇编嵌入指令了,只不过这年头都不学汇编了,搞得很先进似的。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:42:04

他自己说的 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (937 bytes) () 01/29/2025 postreply 17:20:48

这个和gpu 指令优化没关系。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 17:34:54

请您先登陆,再发跟帖!