大语言模型和强化学习结合起来就不一样了

最后人工智能的研发还会回到强化学习为核心,Deepseek模型就是蒸馏加强化学习,现在主流的人工智能语言模型都在走这个路线。但这个路线也是有不少难题的,基础还得是朴素的大参数模型,否则没法蒸馏提炼。如果强化学习那么顺,谷歌也不会被OpenAI抢了人工智能的风头。总之商业投入是要追求短期回报的,否则只有家庭富有的人才能整天琢磨艺术(打个比方)。人类在人工智能方向的发展不可阻挡,但不见得是日新月异,天天有惊人的展示。相反,会有很长的严冬才有下一次的春夏

所有跟帖: 

这个的确没有明确的通用人工智能定义 -bagel_bites- 给 bagel_bites 发送悄悄话 (459 bytes) () 11/07/2025 postreply 21:17:36

这么跟您说吧 -bagel_bites- 给 bagel_bites 发送悄悄话 (312 bytes) () 11/07/2025 postreply 21:27:33

人家本来就是搞理论的 -bagel_bites- 给 bagel_bites 发送悄悄话 (99 bytes) () 11/07/2025 postreply 21:30:13

建议对人工智能有兴趣的网友去读一下Deepseek R-1模型的公开文献 -bagel_bites- 给 bagel_bites 发送悄悄话 (414 bytes) () 11/07/2025 postreply 21:25:01

这是您看过后得出的结论? -bagel_bites- 给 bagel_bites 发送悄悄话 (167 bytes) () 11/07/2025 postreply 21:28:43

哦。我尊重您的意见 -bagel_bites- 给 bagel_bites 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:31:11

请您先登陆,再发跟帖!