训练数据和工艺是低成本的关键

来源: 2025-02-07 07:22:34 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

昨天李飞飞团队用不到50刀的成本训练出跟OpenA1-o1和DeepSeek一样水平的模型,在网上迅速传开。

前段时间兴奋了很久用低成本只花600万做出DS,而李飞飞团队的S1只花了不到50刀,就做出同样水平的东西。

很多人觉得不可能,咋不可能呢?

我一直在说DS的低成本没啥可吹的:在别人的模型基础上,用好的训练数据,加上点工艺,当然能低成本了

现在李飞飞团队用50刀成本训练出来,好像倒是可以吹一下,哈哈

 

我大概看了一下李飞飞团队s1论文,大概就是下面这个样子,对比一下DS,是不是很类似?

李飞飞团队的S1 = 阿里云Qwen2.5模型为基础 + 测试时间缩放训练新方法(1000个精心策划微小数据集)+ 在云计算蒸馏出来(云计算成本低于50刀)

DS = Meta 模型为基础 + OpenAI数据集(被怀疑)+ 自己的方法 + 花600万蒸馏出来

 

s1秘诀是什么?用了一种名为 “预算强迫 ”的技术,再加上监督微调(SFT)技术,在一个经过精心策划的、只有 1000 个示例的微小数据集上实现。

1000个精心策划微小数据集(训练数据),和“预算强迫 ”的技术(工艺)是关键。

今天早上,下载了s1的代码看了一下,训练s1需要的模块和库,竟然还有openai, 哈哈