最后人工智能的研发还会回到强化学习为核心,Deepseek模型就是蒸馏加强化学习,现在主流的人工智能语言模型都在走这个路线。但这个路线也是有不少难题的,基础还得是朴素的大参数模型,否则没法蒸馏提炼。如果强化学习那么顺,谷歌也不会被OpenAI抢了人工智能的风头。总之商业投入是要追求短期回报的,否则只有家庭富有的人才能整天琢磨艺术(打个比方)。人类在人工智能方向的发展不可阻挡,但不见得是日新月异,天天有惊人的展示。相反,会有很长的严冬才有下一次的春夏
大语言模型和强化学习结合起来就不一样了
所有跟帖:
•
最基本的问题都没有解决:怎么表征智能?不会是目前的什么token或向量
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:11:21
•
人类的智能来自于feeling(天生的反馈函数),计算机没有feeling
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:13:10
•
这个的确没有明确的通用人工智能定义
-bagel_bites-
♂
(459 bytes)
()
11/07/2025 postreply
21:17:36
•
智能不仅仅是算算数学题,智能是在面对未知时做出合理的判断、更是知道自己的不足。。。目前的LLM却很善于废话连篇
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:24:02
•
这么跟您说吧
-bagel_bites-
♂
(312 bytes)
()
11/07/2025 postreply
21:27:33
•
亨廷老了落伍了
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:28:25
•
人家本来就是搞理论的
-bagel_bites-
♂
(99 bytes)
()
11/07/2025 postreply
21:30:13
•
见解/见识/认知。他的学生比他强
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:31:55
•
建议对人工智能有兴趣的网友去读一下Deepseek R-1模型的公开文献
-bagel_bites-
♂
(414 bytes)
()
11/07/2025 postreply
21:25:01
•
高级/大号知识库而已
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:27:10
•
这是您看过后得出的结论?
-bagel_bites-
♂
(167 bytes)
()
11/07/2025 postreply
21:28:43
•
essentially
-喀爾判0715-
♀
(0 bytes)
()
11/07/2025 postreply
21:29:18
•
哦。我尊重您的意见
-bagel_bites-
♂
(0 bytes)
()
11/07/2025 postreply
21:31:11