如何在阉割版芯片上trade off精度到达符合大多数应用的结果。
不觉得多神秘,product design胜出吧。
所有跟帖:
•
搞不好阉割版都不让卖了
-我是谁的谁-
♂
(0 bytes)
()
01/27/2025 postreply
14:56:14
•
黄教主还是想做生意的。
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
14:58:14
•
老黄作不了主啊,商务部决定
-我是谁的谁-
♂
(0 bytes)
()
01/27/2025 postreply
14:59:26
•
老黄一直在偷跑。阉割版也是他搞出来的
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
15:00:51
•
有钱不赚白不赚,他又不是傻子
-我是谁的谁-
♂
(0 bytes)
()
01/27/2025 postreply
15:01:45
•
H800和H100的性能差,原来主要就GPU之间的通信宽度。理解Deep Seek的做法。所以老美芯片限制没用的
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
16:10:37
•
上链接,解释Deep Seek53页的paper
-加州lalin-
♀
(145 bytes)
()
01/27/2025 postreply
14:56:56
•
早茶姊妹,看这个link。我偷懒,快速听了这位博主讲解deep seek tech paper.
-加州lalin-
♀
(0 bytes)
()
01/27/2025 postreply
15:08:37