DS的主要贡献其实是那篇论文,告诉大家怎么用reinforcement learning快速廉价的训练大模型

来源: 2025-01-28 13:22:58 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

有了这个,Meta和其他公司也可以用同样的方法训练大模型。我在LinkedIn上的几百个connect大多数都是做AI的,现在大家在上面讨论最多的不是这个模型本身,而是他们发的这篇论文,有人根据他们的方法用了这个在家用十几台iMac搭建的cluster就训练了一个不错的模型