这个和任何资源一样，都必须提纯的，而排除污染，就是AI应该发展的能力。在概率上说，数据量大的污染应该比数据量小的更均匀

来源: 咲媱于 2024-09-30 11:04:34 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (238 bytes)

本帖于 2024-09-30 11:07:30 时间, 由普通用户咲媱编辑

数据量小的数据库，被造假，或者人为选择数据的可能性更大，这样信息垃圾进，垃圾逻辑出，训练出来的AI就是垃圾啊。

而海量的数据，人为造假的难度就非常大。

您的位置：文学城 » 论坛 » 文化走廊 » 这个和任何资源一样，都必须提纯的，而排除污染，就是AI应该发展的能力。在概率上说，数据量大的污染应该比数据量小的更均匀