他们只是再次核实了 deepseek 推崇的方向:在一个比较好的 base model 基础上,鼓励它自己跟自己说话,用给予奖赏的 Reinforced Learning 可以得到意想不到的好效果。
也就是说,AI 已经慢慢从 generative AI, 跨入了 reasoning AI。
他们只是再次核实了 deepseek 推崇的方向:在一个比较好的 base model 基础上,鼓励它自己跟自己说话,用给予奖赏的 Reinforced Learning 可以得到意想不到的好效果。
也就是说,AI 已经慢慢从 generative AI, 跨入了 reasoning AI。
•
那个核心模型的理论,也不见得是deepseek首创,或早有别人的论文,科技发展彼此互为台阶很正常,加以承认就行
-老键-
♂
(0 bytes)
()
02/02/2025 postreply
21:21:32
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy