Deepseek 风暴

本帖于 2025-01-28 10:45:51 时间, 由普通用户 老键 编辑

我在2025展望贴里说到AI会有重大突破,成为真真的生产力,但没想到风暴来得这么快,中国杭州一家才一年的初创公司推出的deepseek 在周一如五级飓风重创全球科技股板块,有的跌幅曾高达近40%。据众多业内行家的专业测试,它的性能总体看齐chatgpt,几个领域譬如数学高于gpt,我自己试了试,速度太慢,没耐心做长的对话,以后再试,可能是服务器容量太小给挤爆了,据说还有大量网络攻击,和deepseek 大模型本身性能恐怕无关。

但技术性能还不是关键,科技进步总是后浪高过前浪,关键是deepseek取得这样傲人的性能据报只用了chatgpt几十分子一的成本,包括数量级减少的用于语言大模型学习的图像处理器数目和能耗,这是十分惊人的, 如chatgpt的早期版本,deepseek大方公开了源码,如果实力雄厚的大公司用资金,算力和人才杠杆撬动进一步开发,其成果将难以预料,其一;其二,它模型训练的廉价,极大降低了应用的门槛,譬如某家民间网调公司可以下载它的开码,适化后在一架laptop上就能训练特定领域的用户信息,而无需云计算。所以,虽然目前的deepseek 并不代表重大的生产力意义上的突破,但它打开的这扇窗,一下让人看到远得多宽得多的前景。

也有人说deepseek故意低报了图像处理器的使用数量以减少美国在这方面封锁的压力,可能(从图像处理器巨头英伟达股暴跌可见一斑),但它即使减少一半算能也是了不起的成就哦。觉得另一方面这也意味着deepseek 优化其算法的一个动因,这我得为咱中国人骄傲,精打细算苦干巧干是我们的美德哈,不是玩笑,我们看其公布的算法技术优化细节,精打细算苦干巧干还真挺好地概括了其特点,这以后再细说了。

 

所有跟帖: 

只是一个骗局而已。算法只是AI的一个部分,算法改善并不是万灵药。很快风暴过去,剩下的都是缺乏数据和芯片的基本功而裸泳的。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 10:51:36

我说了,它报低成本是可能的,但即使只降低一半成本也是了不起的,它开源并发布技术文档大家可以审核算法,确有过人之处 -老键- 给 老键 发送悄悄话 老键 的博客首页 (343 bytes) () 01/28/2025 postreply 13:26:49

领教了 -玻璃坊- 给 玻璃坊 发送悄悄话 玻璃坊 的博客首页 (30 bytes) () 01/29/2025 postreply 05:31:45

我不排除故意夸张可能。。。中国联想曾有类似经历,结果呢?。。。不管怎样,提出问题就是好样的! -zhiyanle- 给 zhiyanle 发送悄悄话 zhiyanle 的博客首页 (0 bytes) () 01/28/2025 postreply 10:52:14

这完全可能 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/28/2025 postreply 13:30:36

了解一下蒸馏,已经在质疑了,最好不是笑话。 -三花锦鲤- 给 三花锦鲤 发送悄悄话 (0 bytes) () 01/28/2025 postreply 11:01:27

任何不是建立在厚积薄发,有足够的积累上的“突破”,十有八九都是骗局。AI的基础,创新的基础都不在思想控制的中国。这是常识 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 11:18:51

这和鉴别民科是一个方法。哈哈。不是真正的名校物理或者数学博士毕业,你给我说推翻了相对论,我只能给你一个白眼。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 11:47:22

但是很多小学毕业的会当真。觉得发现了历史时刻。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 11:48:07

这不是相对论更不是量子论,微积分都不算,普通物理的实验室课。真要归功,那得是二十年前发明神经元算法的人,然后靠算力发展 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/28/2025 postreply 13:51:53

讲这个没意义。 -ahhhh- 给 ahhhh 发送悄悄话 (168 bytes) () 01/28/2025 postreply 12:03:10

这等于是说一个民科,通过推翻相对论,戳穿了哈佛麻省等名校,垄断科学教育的谎言。很快人们就会明白过来,这本身才是一个谎言。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 12:06:20

没有资金,芯片,还有技术的积累,用一点小技俩来搞AI突破,是无根浮萍。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 12:08:11

相对论没推翻。推翻的是实现相对论的成本。那个是谎言 -ahhhh- 给 ahhhh 发送悄悄话 (0 bytes) () 01/28/2025 postreply 22:48:00

再加工。这是建立在大厂开源基础上的,大厂随时可以掐掉。 -三花锦鲤- 给 三花锦鲤 发送悄悄话 (0 bytes) () 01/28/2025 postreply 12:10:14

不过戳破大厂虚报成本的伎俩还是很好的。 -三花锦鲤- 给 三花锦鲤 发送悄悄话 (0 bytes) () 01/28/2025 postreply 12:35:58

大厂gpu垄断这话有一定道理,但也不一定是故意的,先入为主了,就跟美国人吃肉,那个浪费,也整不出什么好菜 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/28/2025 postreply 13:55:54

老川的态度挺有意思:“假如這項成果屬實,他正面以待,因為美國企業也做得到,未來不必再花這麼多錢來達到相同的結果。” -Shubin- 给 Shubin 发送悄悄话 Shubin 的博客首页 (176 bytes) () 01/28/2025 postreply 13:14:28

我觉得关键不在那里,不是要造个能回答傻差问题的AI,而是要搞出真正能代替工人,会计师,工程师的AI,能迅速工业化带来收益 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 13:18:12

所以专精一门,能迅速产业化的机器人AI,更加重要。不知道AI界抓住这个关键没有。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/28/2025 postreply 13:19:41

你说的那个相当于高级机器人,哪有那么容易造出来啊。日本人研究了多年家务机器人,迄今也没有能替代保姆的。 -Shubin- 给 Shubin 发送悄悄话 Shubin 的博客首页 (0 bytes) () 01/28/2025 postreply 13:27:48

不是美国企业也做得到,而是在这基础上可以做得更好,旧思路打破了,有钱有人,将会是个飞跃 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/28/2025 postreply 13:58:56

说不定微软就把deepseek 收购了 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/28/2025 postreply 14:00:16

这才是正常的态度吧,不是闭眼不看,也不是盲目仇恨,而是相信我们能做到。自信,还是好的吧。不自信才会盲目贬低别人。 -freemanli01- 给 freemanli01 发送悄悄话 freemanli01 的博客首页 (0 bytes) () 01/29/2025 postreply 02:06:10

贴子被锁定了,这里加一句,本帖是想说deepseek虽然一时让科技股跳水,但从中长期来看,绝对是AI科技版的利好消息 -老键- 给 老键 发送悄悄话 老键 的博客首页 (143 bytes) () 01/28/2025 postreply 14:44:57

我试了一下 deepseek,确实挺强大的,尤其是展示思维的部分很惊艳,应该不是骗局。 -木有文化- 给 木有文化 发送悄悄话 木有文化 的博客首页 (285 bytes) () 01/28/2025 postreply 17:51:18

+1 -lakelavon- 给 lakelavon 发送悄悄话 (0 bytes) () 01/28/2025 postreply 18:40:34

我还没好好试过。思维的话我觉得chatgpt不错了,但常识方面却常常偷懒 -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/29/2025 postreply 01:26:16

人最怕偏见,好不好用用就知道了 -玻璃坊- 给 玻璃坊 发送悄悄话 玻璃坊 的博客首页 (114 bytes) () 01/29/2025 postreply 05:35:14

已经抓到证据,是偷openAI的。 -咲媱- 给 咲媱 发送悄悄话 咲媱 的博客首页 (0 bytes) () 01/29/2025 postreply 08:49:52

常识很重要。这几日城里的那些东东四处乱窜,没完没了地狂吹,就该知道其中必有蹊跷。跌幅是死给联储看并割韭菜。seek还 -看客2010- 给 看客2010 发送悄悄话 看客2010 的博客首页 (34 bytes) () 01/28/2025 postreply 22:45:19

我觉得它是等着微软去收购,像tiktok 一样,川总有兴趣,然后改名叫microdeep -老键- 给 老键 发送悄悄话 老键 的博客首页 (0 bytes) () 01/29/2025 postreply 01:28:39

盖子想要的话,自己能搞。 -看客2010- 给 看客2010 发送悄悄话 看客2010 的博客首页 (0 bytes) () 01/29/2025 postreply 08:37:08

这个事真真假假,还是不要急着下结论。进步是有一些,但看这个宣传架势,是有来头的,不排除中共政府也在里面 -akuan- 给 akuan 发送悄悄话 (0 bytes) () 02/03/2025 postreply 10:24:45

请您先登陆,再发跟帖!