现在还持有NVDA和半导体的一定要花时间去研究deepseek

毕竟是中国的公司,我个人还是半信半疑,但如果被证明可行,其他的大模型应该可以去抄它的算法,那对AI芯片的需求会断崖式下滑。

这个消息目前看还没有发酵,花街需要的时候才会拿出来。

所有跟帖: 

算法不一定公开 -TalkToMi- 给 TalkToMi 发送悄悄话 (0 bytes) () 12/31/2024 postreply 08:06:41

不过好像是open source -TalkToMi- 给 TalkToMi 发送悄悄话 (0 bytes) () 12/31/2024 postreply 08:06:57

V-2 MIT license可以随便抄, 现在是V-3 -当年情- 给 当年情 发送悄悄话 当年情 的博客首页 (0 bytes) () 12/31/2024 postreply 08:09:14

用了几次滴滴,同意 -moneytalks- 给 moneytalks 发送悄悄话 (0 bytes) () 12/31/2024 postreply 10:35:28

要是真的, 对GPU training的需求急剧下降? -远走他乡- 给 远走他乡 发送悄悄话 (0 bytes) () 12/31/2024 postreply 08:14:58

不一定。因为,会有更多应用。 -TalkToMi- 给 TalkToMi 发送悄悄话 (0 bytes) () 12/31/2024 postreply 08:17:00

Inference这块我研究过,不管是机器人还是Phone/PC终端, 芯片都是自己研发 -当年情- 给 当年情 发送悄悄话 当年情 的博客首页 (62 bytes) () 12/31/2024 postreply 08:18:59

是的,Deepseek的模型只花了5M做training, 用的什么芯片不清楚 -当年情- 给 当年情 发送悄悄话 当年情 的博客首页 (0 bytes) () 12/31/2024 postreply 08:17:12

用的是A800,H800. 看它的open source不就知道了? 应该用了特定范围的training -cnrhm2017- 给 cnrhm2017 发送悄悄话 cnrhm2017 的博客首页 (0 bytes) () 12/31/2024 postreply 08:21:30

一家大机构说,等“竞争”的说法大量涌现的时候,就是该买入的时候 -coach1960- 给 coach1960 发送悄悄话 coach1960 的博客首页 (0 bytes) () 12/31/2024 postreply 08:21:49

这个不叫竞争吧?这叫挖墙脚 -当年情- 给 当年情 发送悄悄话 当年情 的博客首页 (0 bytes) () 12/31/2024 postreply 08:23:36

有人说DEEPSEEK3专门是针对BENCHMARK研发的,就像应付考试一样,你怎么看? -dividend_growth- 给 dividend_growth 发送悄悄话 dividend_growth 的博客首页 (0 bytes) () 12/31/2024 postreply 08:53:43

这个需要后续使用阶段用户反馈来验证,现在不好说 -当年情- 给 当年情 发送悄悄话 当年情 的博客首页 (0 bytes) () 12/31/2024 postreply 09:34:53

如果是真的,对NVDA很不利,但有利AVGO和TSM -dividend_growth- 给 dividend_growth 发送悄悄话 dividend_growth 的博客首页 (24 bytes) () 12/31/2024 postreply 09:21:54

请您先登陆,再发跟帖!