Google Research这篇新论文,可能会改写AI的未来

来源: 未完的歌于 2025-11-25 16:55:53 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (89437 bytes)

的确现在模型的记忆力是有缺陷的，跟人类不一样。。

这个新的方式，就接近人类了，为AI的自我学习开辟的道路，

发展下去就是自我进化，再发展下去AI有自我意识

https://arxiviq.substack.com/p/nested-learning-the-illusion-of-deep

这篇论文题为**《Nested Learning: The Illusion of Deep Learning Architectures》（嵌套学习：深度学习架构的幻觉）**，由 Google Research 的研究人员（如 Ali Behrouz 等）提出，并被 NeurIPS 2025 接收。

这篇文章提出了一个新的机器学习范式——嵌套学习 (Nested Learning, NL)，挑战了传统“深度学习”中关于“深度”的定义。

以下是该论文的要点总结：

1. 核心观点：深度学习的“幻觉” (The Illusion)

层数不等于深度：论文认为，目前的“深度”神经网络（通过堆叠层数）实际上并没有带来真正的“计算深度”或算法上的深度。增加层数往往只是在“压缩”上下文流 (Context Flow)，而没有提升模型解决复杂嵌套优化问题的能力。
真正的深度是“嵌套”：真正的智能不仅仅是处理输入到输出的映射，而是包含多层级的学习过程（即“学习如何学习”）。

2. 嵌套学习范式 (Nested Learning Paradigm)

模型即优化问题的集合：NL 将一个机器学习模型视为一组嵌套的、多层级的优化问题。
- 每个层级都有自己的“上下文流” (context flow) 和更新频率。
- 这类似于人类大脑：有的部分学习得很快（短期记忆），有的部分学习得很慢（长期记忆/巩固）。
重新定义优化器：在 NL 框架下，优化器（如 SGD, Adam）不再仅仅是更新规则，而是被视为联想记忆模块 (Associative Memory Modules)。它们实际上是在尝试基于过去的梯度信息来预测最佳更新方向。

3. 关键创新与贡献

深度优化器 (Deep Optimizers)：
- 既然优化器也是一种“学习模块”，论文提出可以设计具有“深度记忆”和更强表达能力的优化器，而不仅仅是简单的点积相似度（如传统动量）。
- 这使得模型能够进行更高级的上下文学习。
HOPE 模型 (Hierarchical Optimizing Processing Ensemble)：
- 论文提出了一种名为 HOPE 的新架构（基于 "Self-Modifying Titans" 概念）。
- 自修正能力：HOPE 能够通过学习自己的更新算法来修改自身。它不仅仅是被动地被训练，而是主动地调整自己的学习策略。
- 连续体记忆系统 (Continuum Memory System)：模拟大脑的记忆巩固过程，允许在不同时间尺度上更新记忆。