为什么电力涨, 女大起伏不定

本帖于 2025-01-30 15:57:45 时间, 由普通用户 亚特兰蒂斯 编辑

 

花街认可堆算力是方向,电力公司是算力的粮食,必须涨。

 

但算力是不是都落到女大头上,花街就举棋不定了。

 

两天前,我曾写文说明大集群gpu可靠方案只有女大,cuda是女大的护城河,难以撼动。

 

不幸的是,DS可能填上了这条河。有科技博主研究了DS,发现为了解决低性能GPU Cluster带宽低的问题,DS另辟蹊径,在cuda下面的准汇编语言发力,将部分算力转换成数据交换处理器,绕过了cuda。

 

既然cuda可以绕过去,芯片市场必定群雄并起,进入战国时代。

 

那,为什么美国厂商没想到这法子呢?

 

首先,老一辈的程序员把汇编语言打入冷宫。精巧的汇编性能无敌,但是难写难调,20行的汇编程序都能玩出各种花样。 几年前我还在AI芯片上写过汇编,写一次足够让我发誓终身不碰汇编。

 

其次,在集群大系统中,汇编没有成功的先例。 大多数时候都是混杂情况, 汇编写一小块性能要求高的核心算法,其他用高级语言实现。

 

那DS为什么打破常规呢? 原因有三,

 

第一,DS拿到的芯片是二级货,只能在软件上出奇招。

 

第二, DS工程师太年轻,没吃过汇编的苦,无知无畏,敢想敢干。

 

第三, 我认为可能性很大,这个准汇编就不是人写的,而是AI写的,人只提供了思路,AI“自举”迭代,自我进化,完成了用汇编实现大集群的壮举。

 

这个技术可能是DS优化训练的核心技术。应该没有开源。

 

但这不足以成为DS的护城河。美国以“犹太人+东欧人+华人+印度人”的startup公司并不缺聪明的大脑,有点子就能实现。

 

DS是算力肌饿极限状况下的草根突围。逼急了超水平发挥而已。

 

所以即使长期投资,在女大上是不是重仓,还要留个心眼。女大的护城河没那么宽了。

所有跟帖: 

这个帖子值得置顶 -沉默的老农民- 给 沉默的老农民 发送悄悄话 (0 bytes) () 01/30/2025 postreply 14:20:37

已经破了 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 01/30/2025 postreply 14:24:00

”数据交换处理器” 的功能就是不用自己思考,让别人思考,假装自己会思考吧?别人思考能力不提高,它就没法提高了。 -QinHwang- 给 QinHwang 发送悄悄话 QinHwang 的博客首页 (0 bytes) () 01/30/2025 postreply 14:36:48

想歪了,这里的带宽是指GPU与GPU交换数据的速度,有的时候他比计算能力还让人头疼。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:28:50

谢科普。 -QinHwang- 给 QinHwang 发送悄悄话 QinHwang 的博客首页 (0 bytes) () 01/30/2025 postreply 15:34:05

用PTX还是NVDA的芯片啊,就好比我不用java和.net编程,直接用汇编语言一样,只是提高了效率,但是你和这款芯片绑 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (30 bytes) () 01/30/2025 postreply 14:36:56

关键是这个idea, 可能用到别的GPU上也可以显著提高性能, 反正ai写具体代码 -mobius- 给 mobius 发送悄悄话 (0 bytes) () 01/30/2025 postreply 15:09:24

有什么用呢,工作量更大,不用现成的库全部自己写?这些年计算机的学科的发展白干啦?哈哈 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (30 bytes) () 01/30/2025 postreply 15:14:25

不白干,AI用我们以前写的程序学会了编程。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:38:04

每个AI芯片厂商都有自己的底层汇编语言,以前想卖芯片,一心想与cuda兼容。现在等于有了新路子。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:25:05

很有道理,我不知道DS使用了汇编语言,但通常汇编语言比高级语言效率高也只是稍许高一些啊!? -parentb- 给 parentb 发送悄悄话 parentb 的博客首页 (0 bytes) () 01/30/2025 postreply 14:38:06

是在底层更细的颗粒度上做优化,不是用汇编重写一遍cuda. -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:23:19

如果海量的算力需求一直存在,未来一定会出现ASIC,针对性优化 -Wakeland- 给 Wakeland 发送悄悄话 (0 bytes) () 01/30/2025 postreply 14:44:00

Jensen 黄好像还没出来公开发声。是不是市场在等他说啥?H800是他特意为中国设计,算力不减只减带宽的芯片。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 01/30/2025 postreply 14:45:02

木桶短板理论,限制带宽就降低了芯片的整体性能。DS用多余的计算能力弥补瘸腿的带宽。好的AI芯片是平衡带宽和计算。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:27:04

谢谢大拿科普。有道理。 -aloevera- 给 aloevera 发送悄悄话 (0 bytes) () 01/30/2025 postreply 14:57:00

哇!内行! 赞! -猛牛- 给 猛牛 发送悄悄话 猛牛 的博客首页 (57 bytes) () 01/30/2025 postreply 15:10:45

刚开始玩钱,花街的操作水深,还看不太懂。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:31:06

应该不可能 -cnrhm2017- 给 cnrhm2017 发送悄悄话 cnrhm2017 的博客首页 (387 bytes) () 01/30/2025 postreply 15:28:13

现在的玩法是“人+AI”,人要敢想,AI做粗活累活。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 15:30:17

你这个idea倒是可以 -cnrhm2017- 给 cnrhm2017 发送悄悄话 cnrhm2017 的博客首页 (0 bytes) () 01/30/2025 postreply 16:17:36

不用担心飞飞李,新一代比老一代强多了。抗癌药还在忽悠阶段。 -mobius- 给 mobius 发送悄悄话 (0 bytes) () 01/30/2025 postreply 17:09:24

做IT的没有护城河,基本是越年轻越牛逼,盖子小扎都是年少成名。我们只能忘记经验,更年轻人硬抗,现学现卖。 -亚特兰蒂斯- 给 亚特兰蒂斯 发送悄悄话 亚特兰蒂斯 的博客首页 (0 bytes) () 01/30/2025 postreply 19:10:07

请您先登陆,再发跟帖!