Deepseek到底是算法牛所以训练成本低还是因为蒸馏把成本降下来的?

所有跟帖: 

训练成本低 -MostlySilent- 给 MostlySilent 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:33:30

中国电力成本有优势,芯片应该是达子水货吧。 -followsun- 给 followsun 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:42:07

我理解,deepseek和tiktok类似,都是特定系统的产物;说到算法,最多也就是万花从中一点红 -qianliu- 给 qianliu 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:45:29

现在每次买股票,我都问问Deepseek的意见 -jinht- 给 jinht 发送悄悄话 jinht 的博客首页 (0 bytes) () 04/28/2026 postreply 11:48:01

INTC , deepseek 怎么说? -adxp- 给 adxp 发送悄悄话 adxp 的博客首页 (0 bytes) () 04/28/2026 postreply 12:23:15

米国这里芯片强,走的是力大飞砖路线,老钟那里芯片低阶,只能走心灵手巧路线 -宁城- 给 宁城 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:49:30

现在美国几个AI vendor的算力都不够了, 在后面偷偷改算法减少TOKEN用量, -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:55:29

比如一个编程任务需要先分析现有文件,以前查10个, 现在最多查6个, 运气好查几个能出好结果, 不好就瞎编 -testmobile- 给 testmobile 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:56:39

美国受限电力瓶颈,大公司倾向在南美电力富余的地方搞数据中心,盯着的几个电力股都新高了 -followsun- 给 followsun 发送悄悄话 (0 bytes) () 04/28/2026 postreply 11:56:24

分享一下那几个股票!俺不怕买高 -jinht- 给 jinht 发送悄悄话 jinht 的博客首页 (0 bytes) () 04/28/2026 postreply 12:11:40

最早应该是算法 -eyehalfopen- 给 eyehalfopen 发送悄悄话 eyehalfopen 的博客首页 (77 bytes) () 04/28/2026 postreply 12:12:28

如果蒸馏能降成本,被蒸馏的怎么自己降不下来 -nyzach- 给 nyzach 发送悄悄话 (0 bytes) () 05/14/2026 postreply 07:21:37

请您先登陆,再发跟帖!