对。生成性AI,针对普遍话题,比如Chat GPT是有可靠数据,图形生成也是,这些都垂手可得的

来源: 2024-09-23 13:06:15 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

其他大多数公司都忙着怎么搬运数据,从原来restrict的数据库,搬到各种platform上。或者忙着收集各种数据,各种json, avro数据。最早出现的大数据都是打着不要scheme,自由,不受数据定义的旗号。

然后今天,大多数商业公司的数据都是一团糟。花费大量的金钱在processing and storing 数据,make 数据available。现在工业界都认清了 garbage data in, garbage data out 的现实。再厉害的ML, 对垃圾数据还是没办法。现在的趋势是shift the right to the left,push back到数据源头去control数据的正确性和定义性。把ML的功能,move close to the source of the data.

套句电影台词: 革命尚未成功,同志还需努力。哈哈哈。