Meta更为此筹组了4个「战情室」,2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSee

DeepSeek横空出世,Meta慌:训练成本"比高层薪水低" | 文学城

中国横空出世的AI模型DeepSeek震撼矽谷,也让Meta陷入恐慌。

中国AI新创企业DeepSeek(深度求索)近2个月接连推出新模型DeepSeek-V3与DeepSick-R1,令其APP在苹果App Store的下载排行榜中冲上第一名,将ChatGPT远抛在后。这款低成本高性能的AI模型表现与OpenAI的ChatGPT-4等全球顶尖AI语言模型不相上下,令整个矽谷为之震撼,更让美国科技巨头Meta的生成式AI部门陷入危机。

一位自称是Meta员工的网友,日前在美国匿名职场论坛TeamBlind上发文,表示DeepSeek横空出世后,技术水准就直接超越了Meta旗下的Llama 4,让Meta全公司上下陷入恐慌。更令Meta难堪的是,这家中国企业只用了550万美元(约新台币1.8亿元)来训练DeepSeek,成本只有Meta的十一分之一。

这名员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知,因为「单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领着高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。」

外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。Meta更为此筹组了4个「战情室」,2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。

所有跟帖: 

Meta 那几十个大佬高管的年薪就超过DS 的训练费用55M。可以理解他们的恐慌情绪 -943279561- 给 943279561 发送悄悄话 (0 bytes) () 01/27/2025 postreply 07:46:07

怪的是meta股票不跌反涨 -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/27/2025 postreply 08:07:46

因为meta是个AI中间商,进货成本低了。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/27/2025 postreply 08:29:50

他自家的模型不是浪费了?再说这样他有什么优势? -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 01/27/2025 postreply 08:53:34

他家自己的模型llama早开源了。AI 打通算力瓶颈,要普及到终端用户,需要依靠meta, apple掌握的用户资源。 -BeyondWind- 给 BeyondWind 发送悄悄话 (0 bytes) () 01/27/2025 postreply 09:12:06

因为DS证明meta 的东西更有用了:) -kl3527- 给 kl3527 发送悄悄话 kl3527 的博客首页 (0 bytes) () 01/27/2025 postreply 10:28:00

小扎终于明白了, 花几个亿去给主党造Dropbox没用,市场上先输給Tiktok, 现在又输給Deep Seek哈哈 -bustout- 给 bustout 发送悄悄话 (0 bytes) () 01/27/2025 postreply 08:26:31

奇怪的是小扎的钱袋子越来越鼓 -Bob007- 给 Bob007 发送悄悄话 (0 bytes) () 01/27/2025 postreply 08:44:11

我也希望能有这样的输 -Bob007- 给 Bob007 发送悄悄话 (0 bytes) () 01/27/2025 postreply 08:44:48

现在只是投资者赌他能赢, 并不是他的产品经得起考验。 -bustout- 给 bustout 发送悄悄话 (0 bytes) () 01/27/2025 postreply 09:19:15

请您先登陆,再发跟帖!