对。生成性AI,针对普遍话题,比如Chat GPT是有可靠数据,图形生成也是,这些都垂手可得的

本帖于 2024-09-23 17:10:10 时间, 由普通用户 加州lalin 编辑

其他大多数公司都忙着怎么搬运数据,从原来restrict的数据库,搬到各种platform上。或者忙着收集各种数据,各种json, avro数据。最早出现的大数据都是打着不要scheme,自由,不受数据定义的旗号。

然后今天,大多数商业公司的数据都是一团糟。花费大量的金钱在processing and storing 数据,make 数据available。现在工业界都认清了 garbage data in, garbage data out 的现实。再厉害的ML, 对垃圾数据还是没办法。现在的趋势是shift the right to the left,push back到数据源头去control数据的正确性和定义性。把ML的功能,move close to the source of the data.

套句电影台词: 革命尚未成功,同志还需努力。哈哈哈。

所有跟帖: 

解释的通俗易懂了:) -两女宝妈- 给 两女宝妈 发送悄悄话 两女宝妈 的博客首页 (0 bytes) () 09/23/2024 postreply 13:20:51

请您先登陆,再发跟帖!