杨立昆 vs 李飞飞, Jensen 在世界模型上的不同点

本帖于 2026-01-04 10:12:44 时间, 由普通用户 cnrhm2017 编辑

今年我会在更深层理论上明白目前AI发展的前景和局限, 具体把握会在时间节点和产出的数据上.

下面是3者在世界模型上的不同出发点. 我更看好Jensen和李飞飞的具体操作. Lecun偏学术, 他的动作毕竟慢. Lecun 反对目前的LLM 会发展成AGI 这点没问题,但是科学发展都是要有过程的, 没有一件事情一开头就全部想好的, 在这点上Elon 的远见和操作就是个例子, 他的tesla 在一直进步,从L1到目前的L2, 今明两年到L4完全可以达到,若他想把 L5都figure out怎么做再动手,那么我们到现在都没有电动车! 这在科技发展和商业发展上都不允许而且是可笑的.

在“世界模型(World Models)”这一概念上,杨立昆(Yann LeCun)、李飞飞(Fei-Fei Li)和黄仁勋(Jensen Huang)确实展现出了高度的共识,但他们推崇的侧重点和应用场景有所不同。

可以理解为:他们都认为 AI 必须理解物理世界,但杨立昆侧重于架构革新,李飞飞侧重于空间智能,黄仁勋侧重于产业落地


1. 杨立昆 (Yann LeCun):世界模型是通往 AGI 的唯一路径

杨立昆是“世界模型”最坚定的倡导者。他认为当前的 LLM(大语言模型)只是文字游戏,缺乏对物理现实的理解。

  • 核心主张: 提出了 JEPA(联合嵌入预测架构)。他认为 AI 应该像人类婴儿或动物一样,通过观察视频或真实世界来学习物理规律(例如:松手物体会下落),而不是只学习文本。

  • 目的: 解决 AI 的常识问题,使其具备推理和规划能力,从而超越现有的自回归模型。

2. 李飞飞 (Fei-Fei Li):从视觉走向“空间智能”

李飞飞近期提出的**空间智能(Spatial Intelligence)**概念,本质上就是三维空间中的世界模型。

  • 核心主张: 她认为智能离不开“感知”与“行动”的循环。AI 不仅要能识别图片,还要理解物体在三维空间中的关系、遮挡以及物理属性。

  • 目的: 赋予 AI 像人类一样在现实空间中导航、交互的能力。这与杨立昆强调的“通过观察学习世界规律”在逻辑上是高度一致的。

3. 黄仁勋 (Jensen Huang):世界模型是具身智能的基石

作为 NVIDIA 的掌舵人,黄仁勋对世界模型的推崇更多集中在具身智能(Embodied AI)数字孪生上。

  • 核心主张: 他认为下一波 AI 浪潮是机器人。要让机器人工作,必须先在虚拟的 Omniverse(NVIDIA 的模拟平台)中建立一个符合物理定律的世界模型。

  • 目的: 物理仿真。他认为 AI 需要在模拟的物理世界中进行成千上万次的训练,才能进入现实世界。


三者的异同对比

维度 杨立昆 (LeCun) 李飞飞 (Fei-Fei Li) 黄仁勋 (Jensen Huang)
关注核心 认知架构 (JEPA) 空间感知 (Spatial Intelligence) 物理仿真 (Simulation/Omniverse)
主要痛点 现在的 AI 没常识、会胡说八道。 现在的 AI 缺乏对三维物理空间的理解。 现在的 AI 难以直接驱动机器人和工业。
实现路径 视频自监督学习预测缺失信息。 结合计算机视觉与生成式 AI。 在高性能 GPU 支撑的模拟器中训练。

 

 


更多我的博客文章>>>

 

 

请您先登陆,再发跟帖!