这个和任何资源一样,都必须提纯的,而排除污染,就是AI应该发展的能力。在概率上说,数据量大的污染应该比数据量小的更均匀
来源:
咲媱
于
2024-09-30 11:04:34
[
博客
] [
旧帖
] [
给我悄悄话
] 本文已被阅读:次
数据量小的数据库,被造假,或者人为选择数据的可能性更大,这样信息垃圾进,垃圾逻辑出,训练出来的AI就是垃圾啊。
而海量的数据,人为造假的难度就非常大。