训练数据和工艺是低成本的关键

来源: 未完的歌于 2025-02-07 07:22:34 [博客] [旧帖] [给我悄悄话] 本文已被阅读：次

昨天李飞飞团队用不到50刀的成本训练出跟OpenA1-o1和DeepSeek一样水平的模型，在网上迅速传开。

前段时间兴奋了很久用低成本只花600万做出DS，而李飞飞团队的S1只花了不到50刀，就做出同样水平的东西。

很多人觉得不可能，咋不可能呢？

我一直在说DS的低成本没啥可吹的：在别人的模型基础上，用好的训练数据，加上点工艺，当然能低成本了

现在李飞飞团队用50刀成本训练出来，好像倒是可以吹一下，

我大概看了一下李飞飞团队s1论文，大概就是下面这个样子，对比一下DS，是不是很类似？

李飞飞团队的S1 = 阿里云Qwen2.5模型为基础 + 测试时间缩放训练新方法（1000个精心策划微小数据集）+ 在云计算蒸馏出来（云计算成本低于50刀）

DS = Meta 模型为基础 + OpenAI数据集（被怀疑）+ 自己的方法 + 花600万蒸馏出来

s1秘诀是什么？用了一种名为 “预算强迫 ”的技术，再加上监督微调（SFT）技术，在一个经过精心策划的、只有 1000 个示例的微小数据集上实现。

1000个精心策划微小数据集（训练数据），和“预算强迫 ”的技术（工艺）是关键。

今天早上，下载了s1的代码看了一下，训练s1需要的模块和库，竟然还有openai,