1. 针对你说的第一条大模型互相蒸馏提取业界是常规操作。OpenAI 在大模型领域的确是先锋的作用;但没有证据DeepSeek (DS)拷贝其数据。况且网上有很多从OpenAI拷贝下来的公开数据。所以英文对话各个模型都趋同GPT4o。DS让更多的人能参与AI的研究,极大降低了普通人使用AI的门槛。DS-R1的benchmark测试都是公开的。在强推理的数学与编程类是可以比肩GPT o1的。是权重开源大模型中开源程度最高的。
2. 第二条,DS明确在其技术文档里提了是最后一轮算力的开销。见下图。DS大量的底层优化PTX编程正是因为没有最新的H100芯片。

3. 李飞飞教授的论文只是SFT (LLM post-training),与DS的V3大模型训练根本是两码事。
https://youtu.be/_1f-o0nqpEI?si=LX055F16NjByxusb
DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters。这个业界资深人士的访谈讨论基本覆盖了所有对DS的疑问及其影响。