圣诞前夕,AI 芯片领域爆发了近五年最具战略深度的变局:英伟达以约 200 亿美元的高价格,通过“非独占许可+核心团队吸纳”的逆向收购模式,将 Groq 的技术灵魂收入囊中。这笔交易是一次精准的架构降维打击。它标志着 英伟达正在从“暴力计算”的训练时代,全面转向以“极致延迟”为核心的推理霸权时代。
英伟达GPU(从 Hopper 到 Blackwell)本质上是高度灵活的并行处理器。为了通用性,GPU 内部集成了复杂的硬件调度层,这在处理超大规模并行训练任务时效率极高,但在执行实时 LLM 推理时,其硬件动态分配机制会导致性能抖动(Jitter)和延迟增加。
Groq LPU (Language Processing Unit) 则代表了另一端的工程哲学:软件定义硬件。
确定性计算(Deterministic Performance): Groq 的 144路 VLIW(超长指令字)架构抛弃了硬件调度器。它将复杂度推给了编译器——每一比特数据在芯片栅极间通过的路径、消耗的纳秒,在编译阶段就已完全确定。
整合逻辑: NVIDIA 吸纳 Jonathan Ross 团队后,核心目的并非维持 LPU 独立产品线,而是要将其确定性编译逻辑整合进未来的 Rubin 或下一代架构。通过在 GPU 内部嵌入类似的“确定性执行流”模块,NVIDIA 将抹平专用推理芯片(ASIC)最后的一点延迟优势,实现对实时 AI(如瞬时语音、高频交易、自动驾驶)市场的生态收割。
目前 AI 芯片的生命线被台积电的 CoWoS 封装和海力士/美光的 HBM3e/4 产能死死掐住。Blackwell 的强悍建立在极高的存储成本之上。
SRAM 的独特性: Groq 架构的核心是抛弃 HBM,全片内 SRAM 存储。虽然这限制了其单卡显存容量,但提供了高达 80TB/s 的带宽,且不依赖昂贵的 2.5D/3D 封装。
战略冗余: NVIDIA 收购 Groq IP,本质上是在后 CoWoS 时代寻找供应链冗余。通过吸收 Groq 的片内存储管理技术,NVIDIA 可以开发出一种基于标准封装的、面向特定推理场景的高能效卡,从而摆脱对 HBM 稀缺产能的过度依赖。这不仅是技术选型,更是为了在潜在的供应链风险中保持毛利。
明确排除 GroqCloud 云业务,仅吸纳团队和授权 IP,展现了其作为商业巨头的冷酷与精明。这种非传统收购模式巧妙避开了类似 ARM 收购案的监管铁幕。Groq 公司名义上依然独立,但其“大脑”已悉数进入 NVIDIA。
GroqCloud 积累了超过 200 万开发者,这些代码针对 LPU 架构进行了大量底层优化。现在 NVIDIA 拥有了 IP 授权,意味着它可以在 CUDA 中增加一个兼容层,瞬间将这些高性能推理开发者“吸附”回 NVIDIA 全栈生态中。
失去核心研发团队后,GroqCloud 现有的硬件迭代将陷于停滞。在计算硬件每 18 个月性能翻番的背景下,缺乏后续架构支撑的 GroqCloud 将迅速从技术先驱退化为“过时产能”,最终在巨头的生态碾压下自然消亡。
当前,Google (TPU)、Meta (MTIA) 和 Amazon 等巨头正试图通过博通提供的物理设计服务,绕过 NVIDIA 昂贵的 GPU,构建自有的 Custom ASIC(定制化芯片) 体系。
收购 Groq 核心团队,实际上是针对博通联盟的一次精准阻击:博通提供的是“代工厂+标准 IP”的服务模式。通过吸收 Groq,现在拥有了全球最顶尖的、能与 TPU 创始人对话的 ASIC 架构师团队。这意味着 NVIDIA 未来可以提供比博通更高效、与 CUDA 生态结合更紧密的“半定制化”服务。既然巨头想自研,NVIDIA 就要成为那个“代研者”,从根源上截断博通在 AI 芯片市场的增量空间。
对 Groq 的消化整合,预示着 2026-2030 年数据中心将进入“乐高化”时代:训练中心将继续由搭载海量 HBM 的重型 GPU 集群(Blackwell/Rubin)统治。推理边缘将出现大量整合了 Groq 确定性计算思想的轻量化、极低功耗的专用单元。
这笔交易,本质上是 NVIDIA 在为自己的帝国修筑最后一道护城河:它不仅要统治如何生成智能,还要统治智能分发每一毫秒的确定性。 在这场博弈中,技术初创公司再次被证明,如果没有生态的护城河,再惊艳的架构也只能成为巨头进化过程中的养料。
这笔“逆向收购”是一场典型的资源重组与生态肃清。在二级市场上,这不仅是 NVIDIA 的利好,更是对整个 AI 芯片产业链的一次资产重新定价。
基于目前的行业态势和这笔交易的深层逻辑,相关公司股价的预期走势:
NVIDIA (NVDA):长期看涨(Strong Buy)。市场会将此视为 NVIDIA 统治力的“补完计划”。200 亿美元虽然是史上最大手笔,但相对于其 600 多亿的现金储备和近 5 万亿的市值,仅是一次“战术消费”。这一动作锁死了初创公司通过架构创新(如 Groq 的 LPU)实现弯道超车的路径。市场会因其推理效率的潜在飞跃而给予更高的估值溢价。
台积电 (TSM):稳健上升。无论 NVIDIA 整合 Groq 后是做专用卡还是半定制 ASIC,最终大概率都要回流到台积电的先进工艺(3nm/2nm)。NVIDIA 生态越强,台积电作为唯一底层地基的地位就越稳固。
Marvell (MRVL):战略溢价。作为光互连与定制芯片的“第二供应商”,NVIDIA 吞噬 Groq 会让那些感到不安的巨头(如 AWS、Microsoft)产生更强的“去 NVIDIA 化”焦虑,从而把更多订单塞给 Marvell 以维持平衡。
Broadcom (AVGO):短期承压,长期博弈。博通目前是 Google TPU、Meta MTIA 的核心代工者。NVIDIA 吸收 Groq 意味着 NVIDIA 具备了直接抢夺博通 ASIC 生态的能力。如果 NVIDIA 开始通过 Groq 的 IP 提供更便宜、性能更强的半定制方案,博通的高毛利 AI 业务将面临直接竞争。市场可能会下调其在定制芯片领域的垄断预期。
Intel (INTC):面临边缘化。Intel 的 Gaudi 系列主打的就是“高性价比推理”。现在 NVIDIA 拿到了世界上推理效率最高的架构,这相当于直接在 Intel 的“降级替代”路线上架了一挺机枪。除非 Intel 能证明其 18A 工艺有突破性的代工进展,否则其 AI 芯片业务的估值将继续萎缩。
AMD:战术性震荡。AMD 刚刚通过收购 MK1 强化了推理。现在 NVIDIA 的动作更快、手笔更大。AMD 的股价取决于它能否迅速证明其 MI350/MI450 系列在软件生态(ROCm)上能像 NVIDIA 整合 Groq 这样丝滑。如果被拉开身位,AMD 的估值倍数可能会收缩。
更多我的博客文章>>>