对Deepseek的一个主要指责是他的训练数据用了ChatGPT的输出,这个指责也延伸到豆包。搜索了一下发现硅谷的另一个当红炸子鸡Perplexity也不是完全用原始数据训练自己的大模型,而是在ChapGpt, Claude和其他大模型的基础上再训练,因为这样成本低很多。豆包好象现在是否认他们用了Chatgpt的输出做训练。不知道用其他模型的输出做训练有没有侵权的问题。
问题是这样一来做基础训练还有什么价值,训练结果不都成了给其他次级训练公司买单吗?可是OpenAI,谷歌和Anthropic 却在成百上千亿做基础模型训练,目的是什么?将来怎么挣钱?