不是蒸馏阿里的,而是蒸馏谷歌的。Gemini 2.0是谷歌的,不是阿里的。
所有跟帖:
•
说的是这个 s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。二级蒸馏
-Zhivago-
♂
(0 bytes)
()
02/06/2025 postreply
09:53:55
•
报道里我没看到提到阿里的Qwen,只提到谷歌的Gemini 2.0。
-大观园的贾探春-
♀
(0 bytes)
()
02/06/2025 postreply
09:58:12
•
那你现在看到了 再评论一下?
-Zhivago-
♂
(0 bytes)
()
02/06/2025 postreply
09:58:57
•
在你主帖链接的那篇报道里还是没看到。
-大观园的贾探春-
♀
(0 bytes)
()
02/06/2025 postreply
10:01:55
•
是蒸馏阿里Qwen, 这是李飞飞的论文。
-Knight_2024-
♂
(81 bytes)
()
02/06/2025 postreply
11:33:34
•
哈哈,被打脸的不出声了
-manyworlds-
♂
(0 bytes)
()
02/08/2025 postreply
23:11:03
•
基础模型是千问。准备的1000条推理训练数据是从Gemini Flash爬下来的。
-林诚毅德-Lincoln-
♂
(0 bytes)
()
02/08/2025 postreply
09:51:44