挖了一下Meta LLM的灵魂人物Jason Wei,终于有点理解为什么本科生在AI顶级科研里有机会完胜博士生的原因了

本帖于 2026-05-21 14:28:32 时间, 由普通用户 whaled 编辑

在人工智能(特别是大模型)领域,只有本科毕业却成为顶尖科学家,其实并不是特例,反而正在成为一种新常态。 Jason Wei(魏杰森)在 2020 年从达特茅斯学院本科毕业后,直接进入顶级大厂并改变了行业方向,这背后有几个非常特殊的时代和行业原因:

1. 踩中了“大模型时代”的爆发奇点

大模型(LLM)作为一个独立且具有统治地位的研究方向,其实是在 2020 年之后才真正爆发的。

 Jason Wei 2020 年毕业时,正值 GPT-3 发布,整个大模型领域刚刚开启新一轮的范式转移。

 在那个时间点,大学教授和博士生们在学校里也无法接触到海量的算力和上万张显卡,大家都处于同一起跑线上。工业界实验室(如 Google Brain 和 OpenAI)变成了绝对的研究中心,而他毕业后恰好直接进入了这些中心的风暴眼。

2. 顶级大厂的“AI 驻留计划”(AI Residency)

本科毕业后,他并没有去读博,而是加入了著名的 Google Brain AI Residency(人工智能驻留计划)。

 这个项目专门从全球选拔那些极具潜力的本科生或跨学科天才,直接把他们丢进最顶级的科学家团队里,给他们提供学校里根本无法想象的顶级算力资源和海量数据。

 在这里,他完成了“以战代练”。在 Google 期间,他作为核心作者发表了奠定大模型推理基石的《Chain-of-Thought Prompting Elicits Reasoning in Language Models》(思维链)和关于提示词微调、大模型涌现能力的几篇划时代论文。这些成果的含金量和影响力,已经远远超过了普通博士研究生的毕业论文。

3. 大模型研究更看重“直觉”与“工程实操”

大模型是一门非常依赖经验科学和工程直觉的学科。

 在传统 AI 时代,你可能需要极其深厚的数学公式推导(比如传统的统计学、支持向量机等),因此更依赖博士期间的深度理论钻研。

 但大模型的开发和调优,很多时候是在和规模(Scaling Laws)做游戏,非常依赖研究员对模型行为的敏锐直觉、提示词工程(Prompt Engineering)的设计、以及大规模强化学习(RL)的实操经验。Jason Wei 恰恰展现出了极其恐怖的“技术直觉”,他提出的“思维链(CoT)”,本质上是一个极其天才且优雅的策略创新,而不是靠复杂的数学推导。

4. 行业看重的是“代表作”,而非学历

Jason Wei 自己曾在个人博客中写过一段话,非常生动地解释了 AI 领域的生态。他认为 AI 研究是一个“极限性能驱动的领域”(Max-Performance Domain):

 

“在这个领域,衡量你的标准是你在职业生涯中做出的前 5 个最顶尖的成果(Seminal Work),而不是你的平均水平或相邻技能。只要你能开创一个新的范式、训练出最好的模型、或者创建被广泛采纳的基准,即使你没有读过博、甚至不会通过传统的常规代码面试,都完全不影响你成为世界级的研究员。”

 

从 Google Brain 的研究科学家,到 OpenAI 期间作为核心创作者打造出震惊世界的 OpenAI o1 推理模型,再到如今被 Meta 挖角至超级智能实验室(MSL)联手打造 Muse Spark,Jason Wei 用事实证明了:在大模型这个日新月异、大力出奇迹的时代,顶级的直觉、无与伦比的算力平台、以及划时代的代表作,远比一张博士文凭更有统治力。

所有跟帖: 

他这个情况和机遇关系挺大的。 -风景线2- 给 风景线2 发送悄悄话 (0 bytes) () 05/21/2026 postreply 14:33:54

他去了Google做了AI residence是关键事件,好多孩子本科时不太重视丢掉了机会 -whaled- 给 whaled 发送悄悄话 (0 bytes) () 05/21/2026 postreply 14:35:14

他在本科期间发了很多生物图像处理的文章。那个方向出文章快,对进ai residency很有帮助。现在就不是这个形势了 -风景线2- 给 风景线2 发送悄悄话 (0 bytes) () 05/21/2026 postreply 14:55:59

爱生成的?真爱来自热情追求 -米汤- 给 米汤 发送悄悄话 米汤 的博客首页 (6912 bytes) () 05/21/2026 postreply 14:35:21

说的很对 -whaled- 给 whaled 发送悄悄话 (0 bytes) () 05/21/2026 postreply 14:37:57

天花板应该是Olin本科生Alec Radford;另方面,Wei申博好几次,很多名校DEI,教授也是overrated -米汤- 给 米汤 发送悄悄话 米汤 的博客首页 (446 bytes) () 05/21/2026 postreply 14:46:54

MIT 这么不喜欢小中男啊,算了不给它交钱献媚了 -飞黎- 给 飞黎 发送悄悄话 (0 bytes) () 05/21/2026 postreply 15:07:53

爱著引用名人榜上排wei前面还有个没上过大学的小中,据说前不久非正式回去了一学期;榜上另个没上过的是Chris Olah -米汤- 给 米汤 发送悄悄话 米汤 的博客首页 (0 bytes) () 05/21/2026 postreply 15:33:40

这个是早先一步,如今竞争完全不一样了 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (98 bytes) () 05/21/2026 postreply 14:35:33

transformer的作者中只有三个人有博士学位 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (20 bytes) () 05/21/2026 postreply 14:38:21

AI更多地依靠raw talent 和大型应用的机会,博士阶段获得的科研经验和直觉作用有限。知识方面本科基础足够了。 -whaled- 给 whaled 发送悄悄话 (0 bytes) () 05/21/2026 postreply 14:40:32

所以你根本 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (38 bytes) () 05/21/2026 postreply 14:51:36

把deepseek 去年那论文拿给本科生看 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (144 bytes) () 05/21/2026 postreply 14:55:38

比如 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (0 bytes) () 05/21/2026 postreply 14:58:52

有本科生的论文被DeekSeek报告引用过 -米汤- 给 米汤 发送悄悄话 米汤 的博客首页 (0 bytes) () 05/21/2026 postreply 15:00:34

transformer一堆本科生啊 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (73 bytes) () 05/21/2026 postreply 15:14:09

呵呵,娃和他同学本科就在FAIR做过。他朋友还有做research的。 -whaled- 给 whaled 发送悄悄话 (53 bytes) () 05/21/2026 postreply 15:01:25

VR 组和组不一样,有的要本科有的不要 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (0 bytes) () 05/21/2026 postreply 15:13:00

未开垦的领域,需要的是机遇,挑战和勇气,没有成熟路径可以论资排辈,江湖地位也是以成果为论啊。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 05/21/2026 postreply 14:36:01

州大ucb的cs比苦寒之地的小藤校的强得多,他这是白白多花了20万的学费? -youtub- 给 youtub 发送悄悄话 youtub 的博客首页 (0 bytes) () 05/21/2026 postreply 15:08:58

哪个学校都有牛人 -凊荷- 给 凊荷 发送悄悄话 凊荷 的博客首页 (0 bytes) () 05/21/2026 postreply 15:14:49

大学校相对比较卷,大猫小而精: 当年算法书作者之一在那里,还教写作课 -米汤- 给 米汤 发送悄悄话 米汤 的博客首页 (160 bytes) () 05/21/2026 postreply 15:20:08

这个小中男还特别会演讲,在很多大学里演讲过 -小松松- 给 小松松 发送悄悄话 (0 bytes) () 05/21/2026 postreply 15:52:14

Meta 在LLM 上好象跟不上节奏,堆积了很多人才,但没有顶尘产品岀来。 -QualityWithoutName- 给 QualityWithoutName 发送悄悄话 QualityWithoutName 的博客首页 (0 bytes) () 05/21/2026 postreply 16:29:31

神经网络本身不需要高深的理论,本科生所学的理论已经是绰绰有余,缺的是经验。 -IT-guy- 给 IT-guy 发送悄悄话 (0 bytes) () 05/21/2026 postreply 16:38:28

神经网络好像60年代就出来了。 -Pilsung- 给 Pilsung 发送悄悄话 (0 bytes) () 05/21/2026 postreply 16:51:59

是这样 -whaled- 给 whaled 发送悄悄话 (0 bytes) () 05/21/2026 postreply 17:38:00

请您先登陆,再发跟帖!