深度求索开发了一个汇编语言人工智能,生成的汇编效率超过CUDA

本帖于 2025-01-29 16:11:27 时间, 由普通用户 cn_abcd 编辑
 

所有跟帖: 

虽然还不能说英伟达的护城河已经被打破,但起码可以说这条护城河不那么深了 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:16:02

华为费了老大劲做的事,DS轻轻松松接近解决 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:17:42

英伟达的护城河是cuda生态,如果META可以用,别人也可以,那么英伟达20年的努力白费了 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:28:21

看META工程师的post -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:34:21

绿色的那一段 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:41:03

他不说了是prompt了吗?SIMD在Intel 刚出MMX的时候是很简单的优化。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:45:27

举个例子,Linux 计算 blas库里面嵌套汇编的例子太多了,不代表blas可以轻松移植到其他cpu. -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:37:28

这些最终的汇编不是自己写的,是AI根据标注生成的 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:39:04

Blas 库里面SIMD 是最基本的汇编嵌入指令了,只不过这年头都不学汇编了,搞得很先进似的。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:42:04

他自己说的 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (937 bytes) () 01/29/2025 postreply 17:20:48

这个和gpu 指令优化没关系。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 17:27:18

the bigger deepseek helping optimize code to run the smaller -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 17:34:54

这个比较有用,让代码需要的资源更少,速度更快,也更容易运行在别的AI硬件上。如果用中国自产的AI芯片,替代女大,将是 -硬码工- 给 硬码工 发送悄悄话 (15 bytes) () 01/29/2025 postreply 16:17:44

现在只是可能,对于其他卡,需要花精力去理解优化 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:20:33

和中国的AI厂家合作,很方便 -硬码工- 给 硬码工 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:55:01

这个类似于C语言高性能计算时嵌套个汇编指令,又不是完全用汇编写的,很常见,哪有那么神。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:30:27

这些最终的汇编不是自己写的,是AI根据标注生成的 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/29/2025 postreply 16:33:44

AI会个simd汇编指令一点不奇怪,因为SIMD指令是很常用的优化指令. -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:53:55

抄袭openAI的几乎做实了 -5678910- 给 5678910 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:37:23

就看deep seek能不能开发出一个超过CUDA的软件 -年轮- 给 年轮 发送悄悄话 (0 bytes) () 01/29/2025 postreply 16:51:10

架构师+AI就能整个更好的软件出来的日子不远了。 -dakinglaile- 给 dakinglaile 发送悄悄话 dakinglaile 的博客首页 (0 bytes) () 01/29/2025 postreply 19:10:38

请您先登陆,再发跟帖!