类似这种公式全是别人发明的,从neural net到transformer到MOE到RL

来源: 2025-01-29 06:21:01 [旧帖] [给我悄悄话] 本文已被阅读: