今年我会在更深层理论上明白目前AI发展的前景和局限, 具体把握会在时间节点和产出的数据上.
下面是3者在世界模型上的不同出发点. 我更看好Jensen和李飞飞的具体操作. Lecun偏学术, 他的动作毕竟慢. Lecun 反对目前的LLM 会发展成AGI 这点没问题,但是科学发展都是要有过程的, 没有一件事情一开头就全部想好的, 在这点上Elon 的远见和操作就是个例子, 他的tesla 在一直进步,从L1到目前的L2, 今明两年到L4完全可以达到,若他想把 L5都figure out怎么做再动手,那么我们到现在都没有电动车! 这在科技发展和商业发展上都不允许而且是可笑的.
在“世界模型(World Models)”这一概念上,杨立昆(Yann LeCun)、李飞飞(Fei-Fei Li)和黄仁勋(Jensen Huang)确实展现出了高度的共识,但他们推崇的侧重点和应用场景有所不同。
可以理解为:他们都认为 AI 必须理解物理世界,但杨立昆侧重于架构革新,李飞飞侧重于空间智能,黄仁勋侧重于产业落地。
1. 杨立昆 (Yann LeCun):世界模型是通往 AGI 的唯一路径
杨立昆是“世界模型”最坚定的倡导者。他认为当前的 LLM(大语言模型)只是文字游戏,缺乏对物理现实的理解。
-
核心主张: 提出了 JEPA(联合嵌入预测架构)。他认为 AI 应该像人类婴儿或动物一样,通过观察视频或真实世界来学习物理规律(例如:松手物体会下落),而不是只学习文本。
-
目的: 解决 AI 的常识问题,使其具备推理和规划能力,从而超越现有的自回归模型。
2. 李飞飞 (Fei-Fei Li):从视觉走向“空间智能”
李飞飞近期提出的**空间智能(Spatial Intelligence)**概念,本质上就是三维空间中的世界模型。
-
核心主张: 她认为智能离不开“感知”与“行动”的循环。AI 不仅要能识别图片,还要理解物体在三维空间中的关系、遮挡以及物理属性。
-
目的: 赋予 AI 像人类一样在现实空间中导航、交互的能力。这与杨立昆强调的“通过观察学习世界规律”在逻辑上是高度一致的。
3. 黄仁勋 (Jensen Huang):世界模型是具身智能的基石
作为 NVIDIA 的掌舵人,黄仁勋对世界模型的推崇更多集中在具身智能(Embodied AI)和数字孪生上。
-
核心主张: 他认为下一波 AI 浪潮是机器人。要让机器人工作,必须先在虚拟的 Omniverse(NVIDIA 的模拟平台)中建立一个符合物理定律的世界模型。
-
目的: 物理仿真。他认为 AI 需要在模拟的物理世界中进行成千上万次的训练,才能进入现实世界。
三者的异同对比