从谷歌Gemini失利,谈中国DeepSeek到底是中草药还是AI利器?

本帖于 2025-01-26 21:15:35 时间, 由普通用户 金笔 编辑

上一篇我说到:中美在人工智能领域里的竞争实际上就是西药和中草药的竞争!有人不服气说中国的DeepSeek需要更少很多的电力(俗话:轻快),因而具有更为先进的算法,可以跟美国最为先进的OpenAI媲美或更好。

真的是这样吗?

人工智能,说到底就是模拟人的大脑。我们知道人脑的智慧(智力)取决于两个方面:记忆力(或记忆量)以及“闪存”(即获取和解读记忆的速度滤过能力)来决定的。

在OpenAI上线以前,我们知道谷歌,脸书,特斯拉以及微软(OpenAI)之间的竞争是很激烈的。但当OpenAI推出以后,这个号称收集了2022年为止的所有数据库(图书,资料,Internet等),而训练出来的人工智能ChatGPT开始面向市场以后,实际上这个竞争就已经结束了。注意,OpenAI训练时使用的数据库,基本都是免费的。

当ChatGPT开始推出收费服务,所有的数据库都开始收费了。即使富有多钱的公司,如谷歌,脸书等,实际上也无法购买和支付所有这些数据库了,太昂贵了。因此人工智能的训练,即向它喂资料就变的很局限了。这也就是为什么马斯克和OpenAI的CEO翻脸的原因(骂他是骗子等)。因为OpenAI即没有公布他们的算法,还推出了收费服务。这就实际上阻碍了AI界的继续竞争,也阻碍了AI的发展。结论:ChatGPT的模式变得不可重复。

现在AI的竞争主要局限在专业的公司间了,如ChatGPT,Cloude等。如果没有大量的资料库来充实和支撑,人工智能实际上还是一台电脑。

那么再说中国推出的DeepSeek,它区区的五百万美金,能够喂食多少资料呢?

据说它很轻快(所谓算法先进?),但实际上就很说明问题。DeepSeek要读取的记忆量可能就很小。

那么,你们说它的人工智能AI会高到哪里去呢?

所有跟帖: 

Bingo! 击中要害,厉害!数据库。对的。数据库收费,那也就是数据收费了。以后再搞到免费的数据就难了。这个就像人脑一 -越活越有劲- 给 越活越有劲 发送悄悄话 (144 bytes) () 01/26/2025 postreply 21:19:26

呵呵,终于有人赞同我的了~! -金笔- 给 金笔 发送悄悄话 金笔 的博客首页 (0 bytes) () 01/26/2025 postreply 21:24:00

用“蒸馏”过的数据,直接上RL,省了pre-taining ,是大胆,也算是“二次开发”。当然省时省钱。 -kl3527- 给 kl3527 发送悄悄话 kl3527 的博客首页 (0 bytes) () 01/26/2025 postreply 21:43:00

蒸馏?那就更没有原汁原味了。谢谢补充。没有花时间研究它,只是觉得DeepSeek不会靠谱而已。。。! -金笔- 给 金笔 发送悄悄话 金笔 的博客首页 (0 bytes) () 01/26/2025 postreply 21:57:51

蒸馏是指从用大模型比如DeepSeek R1去训练参数少的小模型,从而得到8B,14B,32B等等对资源要求较少的版本。 -监考老师- 给 监考老师 发送悄悄话 监考老师 的博客首页 (0 bytes) () 01/26/2025 postreply 22:55:17

看AI所实现的方向。如果是推理性的,数据大小并不重要。好比google 的alphaZero战胜AlphaGo并不是通过 -小八腊子2- 给 小八腊子2 发送悄悄话 小八腊子2 的博客首页 (164 bytes) () 01/27/2025 postreply 10:50:13

DeepSeek没有从原数据开始,是用现存的开源模型,可能还蹭了ChatGPT的input/output -破棉袄- 给 破棉袄 发送悄悄话 (0 bytes) () 01/27/2025 postreply 13:28:04

同意~ -oldpp- 给 oldpp 发送悄悄话 oldpp 的博客首页 (0 bytes) () 01/27/2025 postreply 20:52:05

数据库?GOOGLE早就定时存互联网数据了。 -ahhhh- 给 ahhhh 发送悄悄话 (159 bytes) () 01/27/2025 postreply 19:46:50

啥都不懂啥都敢说,无知者无畏 -zxw968- 给 zxw968 发送悄悄话 (0 bytes) () 01/27/2025 postreply 20:19:51

GOOGLE的数据集如何?就算不和OpenAI比,比Claude都差。 -busboy- 给 busboy 发送悄悄话 (0 bytes) () 01/27/2025 postreply 22:39:33

请您先登陆,再发跟帖!