俺此时在诊所等医生助理,那就随便扯扯吧。我不是做数据的,所以也就是作为一个外行人胡扯一下。openAI 作为一个语言输出结合文字分析模型, 也就是一个正当壮年, 但是绝对活不过二十年。这个平台,和谷歌在竭力完善它的算法,成为领域寡头之后,这个技术方法,也就是几十年的寿命无异。
为啥这么说呢?原因很简单,因为未来的大数据大部分不会是文字数据, 而是视频数据。因为我不知道视频数据和文字数据的结构以及分析学习的算法需要怎样的不同,但是可以肯定的是,如果需要在未来二十年以后,还要在大数据独居鳌头的话,任何模型需要处理的该是短视频或少量的长视频数据。
为啥我这么觉得呢?因为博客或普通网页那时早已日落西山,就算存在,也是老旧无人打理的幽灵网页。活跃的网页,也早就从阅读量巨大的html模式变成了图片或小视频的聚集点。起码我看我娃和她们的朋友们,如果他们将来还有人写博客,那真的是老古董,要被人笑死。而现在每天新的上来的短视频,那真是数据惊人。同时我近来通过谷歌搜信息时,越来越发现浮上来的前几条,都是视频。这在三年前,是不可以想象的事情。而那时,我们也还只是在慢慢习惯于谷歌的语音输入。
也许最简单的处理就是直接把视频数据转换为语音数据,然后可以使用同样的算法,但是这样学习肯定学不过对语音和图片数据的同步分析模型吧。
我也就胡扯一下,哪位数据大拿看到了,有空的话指教一下视频数据如何学习。