大语言模型和强化学习结合起来就不一样了

最后人工智能的研发还会回到强化学习为核心,Deepseek模型就是蒸馏加强化学习,现在主流的人工智能语言模型都在走这个路线。但这个路线也是有不少难题的,基础还得是朴素的大参数模型,否则没法蒸馏提炼。如果强化学习那么顺,谷歌也不会被OpenAI抢了人工智能的风头。总之商业投入是要追求短期回报的,否则只有家庭富有的人才能整天琢磨艺术(打个比方)。人类在人工智能方向的发展不可阻挡,但不见得是日新月异,天天有惊人的展示。相反,会有很长的严冬才有下一次的春夏

所有跟帖: 

最基本的问题都没有解决:怎么表征智能?不会是目前的什么token或向量 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:11:21

人类的智能来自于feeling(天生的反馈函数),计算机没有feeling -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:13:10

这个的确没有明确的通用人工智能定义 -bagel_bites- 给 bagel_bites 发送悄悄话 (459 bytes) () 11/07/2025 postreply 21:17:36

智能不仅仅是算算数学题,智能是在面对未知时做出合理的判断、更是知道自己的不足。。。目前的LLM却很善于废话连篇 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:24:02

这么跟您说吧 -bagel_bites- 给 bagel_bites 发送悄悄话 (312 bytes) () 11/07/2025 postreply 21:27:33

亨廷老了落伍了 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:28:25

人家本来就是搞理论的 -bagel_bites- 给 bagel_bites 发送悄悄话 (99 bytes) () 11/07/2025 postreply 21:30:13

见解/见识/认知。他的学生比他强 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:31:55

建议对人工智能有兴趣的网友去读一下Deepseek R-1模型的公开文献 -bagel_bites- 给 bagel_bites 发送悄悄话 (414 bytes) () 11/07/2025 postreply 21:25:01

高级/大号知识库而已 -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:27:10

这是您看过后得出的结论? -bagel_bites- 给 bagel_bites 发送悄悄话 (167 bytes) () 11/07/2025 postreply 21:28:43

essentially -喀爾判0715- 给 喀爾判0715 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:29:18

哦。我尊重您的意见 -bagel_bites- 给 bagel_bites 发送悄悄话 (0 bytes) () 11/07/2025 postreply 21:31:11

请您先登陆,再发跟帖!