ChatGPT只是壮年的学习模型, 很快会日薄西山

俺此时在诊所等医生助理,那就随便扯扯吧。我不是做数据的,所以也就是作为一个外行人胡扯一下。openAI 作为一个语言输出结合文字分析模型, 也就是一个正当壮年, 但是绝对活不过二十年。这个平台,和谷歌在竭力完善它的算法,成为领域寡头之后,这个技术方法,也就是几十年的寿命无异。

为啥这么说呢?原因很简单,因为未来的大数据大部分不会是文字数据, 而是视频数据。因为我不知道视频数据和文字数据的结构以及分析学习的算法需要怎样的不同,但是可以肯定的是,如果需要在未来二十年以后,还要在大数据独居鳌头的话,任何模型需要处理的该是短视频或少量的长视频数据。

为啥我这么觉得呢?因为博客或普通网页那时早已日落西山,就算存在,也是老旧无人打理的幽灵网页。活跃的网页,也早就从阅读量巨大的html模式变成了图片或小视频的聚集点。起码我看我娃和她们的朋友们,如果他们将来还有人写博客,那真的是老古董,要被人笑死。而现在每天新的上来的短视频,那真是数据惊人。同时我近来通过谷歌搜信息时,越来越发现浮上来的前几条,都是视频。这在三年前,是不可以想象的事情。而那时,我们也还只是在慢慢习惯于谷歌的语音输入。

也许最简单的处理就是直接把视频数据转换为语音数据,然后可以使用同样的算法,但是这样学习肯定学不过对语音和图片数据的同步分析模型吧。

我也就胡扯一下,哪位数据大拿看到了,有空的话指教一下视频数据如何学习。

 

所有跟帖: 

Google在matrix运作方面已经能到十几维,这是其TensorFlow处理图像等厉害的关键技术。但是文字不会消失, -nearby- 给 nearby 发送悄悄话 nearby 的博客首页 (35 bytes) () 03/11/2023 postreply 07:15:38

文字是肯定不会消失,而且维度肯定不是问题。其他数据最后也就是简化到一样的格式。视频数据需要被分解吗? -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 07:24:52

一般数据是二维标准格式,但是图像、录像等维数更高。简化成二维容易处理些 -nearby- 给 nearby 发送悄悄话 nearby 的博客首页 (0 bytes) () 03/11/2023 postreply 07:33:25

我不懂,所以觉得这是问题的关键。如何把数据的维度进行最有效的管理和规化,和在对数据的处理上拿到最优化的算法,哪个更重要? -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (199 bytes) () 03/11/2023 postreply 09:57:40

小K,口气好大,“像”专家评论。可惜。。。。。。。。。 -lovecat08- 给 lovecat08 发送悄悄话 lovecat08 的博客首页 (0 bytes) () 03/11/2023 postreply 07:22:42

你那马夹2,怎不来评评。你俩好像从不同台跟贴,有鬼哦.! -lovecat08- 给 lovecat08 发送悄悄话 lovecat08 的博客首页 (0 bytes) () 03/11/2023 postreply 07:24:16

没看过“日薄西山”,请附照片说明! -lovecat08- 给 lovecat08 发送悄悄话 lovecat08 的博客首页 (0 bytes) () 03/11/2023 postreply 07:26:42

我要是专家,那一定去你家吃饭,算吃货,我是专家。别的都不是,我都是混混,哈哈哈 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 07:26:30

考小k一个文字处理的经典: king - man = ? -nearby- 给 nearby 发送悄悄话 nearby 的博客首页 (0 bytes) () 03/11/2023 postreply 07:35:36

杨伟? -lovecat08- 给 lovecat08 发送悄悄话 lovecat08 的博客首页 (0 bytes) () 03/11/2023 postreply 07:41:45

这个是去问谷歌呢,还是 Chat?其实我更喜欢谷歌,经常翻到第五页第六页的 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 09:58:31

猫猫、小k、国王早上在书香娱乐开心,等猫猫的仿诗,邻兄要做监工培养孩子们做饭菜去了 -nearby- 给 nearby 发送悄悄话 nearby 的博客首页 (0 bytes) () 03/11/2023 postreply 07:43:56

啊哈,我跑路去了,今天一定要效率大高! -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 07:45:45

高见! -梧桐之丘- 给 梧桐之丘 发送悄悄话 梧桐之丘 的博客首页 (0 bytes) () 03/11/2023 postreply 08:26:07

别吓我,我在等医生无聊才码的字,没想到招呼了这么多没见过的ID 来了书版~~梧桐还请帮我找k骇客来,顶一阵子 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 10:09:06

也许未来有更强大的AI,但是chatGpt绝对是这个方向的开山之作, 现在chatGpt能帮你看YouTube 视频。 -pichawxc- 给 pichawxc 发送悄悄话 pichawxc 的博客首页 (0 bytes) () 03/11/2023 postreply 09:08:55

谢谢,我猜我想问的问题其实是,到底未来的赢家是对数据的规划优胜者,还是算法的优胜者 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 09:53:47

赢家的问题也太远了。只要算法不公开,算法肯定是的优胜者。对于利用公共数据的AI, 数据不是决定性的。 -pichawxc- 给 pichawxc 发送悄悄话 pichawxc 的博客首页 (0 bytes) () 03/11/2023 postreply 10:47:32

一针见血, openAI比的是算法。不公开的数据比的是数据。我明白了。前面一直没想清楚,哈哈哈 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 11:00:44

ChatGPT基于OpenAI的GPT3.5,即将出台的GPT-4不限于文字,是多模态,包括文字,语音,图像,视频。 -泥川- 给 泥川 发送悄悄话 (0 bytes) () 03/11/2023 postreply 09:48:27

进步是通过迭代,一代代更新,现在的ChatGPT,也就相当于福特当年的Model-T。 -泥川- 给 泥川 发送悄悄话 (81 bytes) () 03/11/2023 postreply 10:00:56

产业总要更新换代。前面高科技大下岗我才知道原来推特和脸书都在做生物化学模型,这些人都下岗了,不能直接产业化~~~ -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (258 bytes) () 03/11/2023 postreply 10:05:41

电动车只是马斯克这个大牛炒作出来的,其实一点都不更清洁。不是技术突破,是 PR突破 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 10:06:48

你既然是外行来扯专业知识,你觉得有意义吗?当然谁都可以瞎扯蛋,言论自由 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 03/11/2023 postreply 09:57:00

那当然有意义了,我天天做我专业的,下班了还扯岂不烦死。我又不发表论文,爱扯扯啥,不爱听不爱看的嫌无聊的就别和我扯呗 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 10:01:11

GPT会影响文教。像80s NCR后来变成90s ATM 又变成现在Costco/HD 结帐机器(须人类看着:),影响了银行/零 -AP33912- 给 AP33912 发送悄悄话 AP33912 的博客首页 (0 bytes) () 03/11/2023 postreply 10:30:00

也就只能说AI和纺织机一样,但是人类高效率织布后很快就会发展出别的需要。俺问的是,谁的织布机最强,还保留到了21世纪:) -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (112 bytes) () 03/11/2023 postreply 10:59:00

呵呵,20年chatGPT还活着?您老也太宽宏大量廖。回首20年前,硅谷都有啥呢?旧的死了新的闯天下,才是正道。 -吃素的狼- 给 吃素的狼 发送悄悄话 (164 bytes) () 03/11/2023 postreply 15:09:23

那到底会有几年呢?微软重金加入,就算谷歌在前期数据处理更胜一筹的话,就算以后输了,我觉得GPT怎么也能风光几年 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 18:53:19

说的对,现在短视频真是大行其道呀,不知道若干年后是不是大家就都不写字了 -浮云驰- 给 浮云驰 发送悄悄话 浮云驰 的博客首页 (0 bytes) () 03/11/2023 postreply 15:39:55

搞得我也学会做短视频了,俺羞愧一下 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 18:56:21

最近看了很多免费的影视,感觉大多都是俗套,还是文字带来的想像力最大 -朱朱莉- 给 朱朱莉 发送悄悄话 朱朱莉 的博客首页 (0 bytes) () 03/11/2023 postreply 17:58:16

我觉得ChatGPT和大数据追求的都是normalize 的普世信息,如果它太新意了,就脱离算法本身的逻辑了。 -kirn- 给 kirn 发送悄悄话 kirn 的博客首页 (0 bytes) () 03/11/2023 postreply 19:00:06

请您先登陆,再发跟帖!