我认为他说的图像视频的理解还是通常的CV能力,和Li和Lecun的世界模型不是一回事,后者涉及到三维建模和物理的理解

来源: 2025-11-22 13:07:29 [旧帖] [给我悄悄话] 本文已被阅读: