小白问题:如果教师模型有错,会不会把错复制给学生模型,然后一代一代“蒸馏”,把小错变成大错?

来源: 2025-01-29 21:12:00 [旧帖] [给我悄悄话] 本文已被阅读: