挖了一下Meta LLM的灵魂人物Jason Wei，终于有点理解为什么本科生在AI顶级科研里有机会完胜博士生的原因了

来源: whaled 于 2026-05-21 14:27:34 [档案] [旧帖] [给我悄悄话] 阅读数 : (14438 bytes)

本帖于 2026-05-21 14:28:32 时间, 由普通用户 whaled 编辑

在人工智能（特别是大模型）领域，只有本科毕业却成为顶尖科学家，其实并不是特例，反而正在成为一种新常态。 Jason Wei（魏杰森）在 2020 年从达特茅斯学院本科毕业后，直接进入顶级大厂并改变了行业方向，这背后有几个非常特殊的时代和行业原因：

1. 踩中了“大模型时代”的爆发奇点

大模型（LLM）作为一个独立且具有统治地位的研究方向，其实是在 2020 年之后才真正爆发的。

Jason Wei 2020 年毕业时，正值 GPT-3 发布，整个大模型领域刚刚开启新一轮的范式转移。

在那个时间点，大学教授和博士生们在学校里也无法接触到海量的算力和上万张显卡，大家都处于同一起跑线上。工业界实验室（如 Google Brain 和 OpenAI）变成了绝对的研究中心，而他毕业后恰好直接进入了这些中心的风暴眼。

2. 顶级大厂的“AI 驻留计划”（AI Residency）

本科毕业后，他并没有去读博，而是加入了著名的 Google Brain AI Residency（人工智能驻留计划）。

这个项目专门从全球选拔那些极具潜力的本科生或跨学科天才，直接把他们丢进最顶级的科学家团队里，给他们提供学校里根本无法想象的顶级算力资源和海量数据。

在这里，他完成了“以战代练”。在 Google 期间，他作为核心作者发表了奠定大模型推理基石的《Chain-of-Thought Prompting Elicits Reasoning in Language Models》（思维链）和关于提示词微调、大模型涌现能力的几篇划时代论文。这些成果的含金量和影响力，已经远远超过了普通博士研究生的毕业论文。

3. 大模型研究更看重“直觉”与“工程实操”

大模型是一门非常依赖经验科学和工程直觉的学科。

在传统 AI 时代，你可能需要极其深厚的数学公式推导（比如传统的统计学、支持向量机等），因此更依赖博士期间的深度理论钻研。

但大模型的开发和调优，很多时候是在和规模（Scaling Laws）做游戏，非常依赖研究员对模型行为的敏锐直觉、提示词工程（Prompt Engineering）的设计、以及大规模强化学习（RL）的实操经验。Jason Wei 恰恰展现出了极其恐怖的“技术直觉”，他提出的“思维链（CoT）”，本质上是一个极其天才且优雅的策略创新，而不是靠复杂的数学推导。

4. 行业看重的是“代表作”，而非学历

Jason Wei 自己曾在个人博客中写过一段话，非常生动地解释了 AI 领域的生态。他认为 AI 研究是一个“极限性能驱动的领域”（Max-Performance Domain）：

“在这个领域，衡量你的标准是你在职业生涯中做出的前 5 个最顶尖的成果（Seminal Work），而不是你的平均水平或相邻技能。只要你能开创一个新的范式、训练出最好的模型、或者创建被广泛采纳的基准，即使你没有读过博、甚至不会通过传统的常规代码面试，都完全不影响你成为世界级的研究员。”

从 Google Brain 的研究科学家，到 OpenAI 期间作为核心创作者打造出震惊世界的 OpenAI o1 推理模型，再到如今被 Meta 挖角至超级智能实验室（MSL）联手打造 Muse Spark，Jason Wei 用事实证明了：在大模型这个日新月异、大力出奇迹的时代，顶级的直觉、无与伦比的算力平台、以及划时代的代表作，远比一张博士文凭更有统治力。