训练有两种,一种是你说的,蒸馏GPT。另一种是DS说的,从其他文件来。
8964,在GPT里,可是也在其他文件里。
DS在reason的时候显示它知道8964,并不意味着8964是GPT来的。只有你先入为主认为DS是从GPT来的,才会看到8964自然认为8964也是从GPT来的。