不觉得多神秘,product design胜出吧。

如何在阉割版芯片上trade off精度到达符合大多数应用的结果。

所有跟帖: 

搞不好阉割版都不让卖了 -我是谁的谁- 给 我是谁的谁 发送悄悄话 (0 bytes) () 01/27/2025 postreply 14:56:14

黄教主还是想做生意的。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 01/27/2025 postreply 14:58:14

老黄作不了主啊,商务部决定 -我是谁的谁- 给 我是谁的谁 发送悄悄话 (0 bytes) () 01/27/2025 postreply 14:59:26

老黄一直在偷跑。阉割版也是他搞出来的 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 01/27/2025 postreply 15:00:51

有钱不赚白不赚,他又不是傻子 -我是谁的谁- 给 我是谁的谁 发送悄悄话 (0 bytes) () 01/27/2025 postreply 15:01:45

H800和H100的性能差,原来主要就GPU之间的通信宽度。理解Deep Seek的做法。所以老美芯片限制没用的 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 01/27/2025 postreply 16:10:37

上链接,解释Deep Seek53页的paper -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (145 bytes) () 01/27/2025 postreply 14:56:56

早茶姊妹,看这个link。我偷懒,快速听了这位博主讲解deep seek tech paper. -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 01/27/2025 postreply 15:08:37

请您先登陆,再发跟帖!