DS的主要贡献其实是那篇论文,告诉大家怎么用reinforcement learning快速廉价的训练大模型

有了这个,Meta和其他公司也可以用同样的方法训练大模型。我在LinkedIn上的几百个connect大多数都是做AI的,现在大家在上面讨论最多的不是这个模型本身,而是他们发的这篇论文,有人根据他们的方法用了这个在家用十几台iMac搭建的cluster就训练了一个不错的模型

所有跟帖: 

请您先登陆,再发跟帖!