这文章的方法是对大模型不需要强解超级规模的矩阵,记住每个细节,用-1,0,1三种状态就好,因此不需要GPU了

来源: 2024-06-30 08:25:15 [旧帖] [给我悄悄话] 本文已被阅读: