2026年,光通信 以及其他联网新技术对NVIDIA 的 NVLink 护城河的削弱影响

2026 年,“NVLink 护城河”确实正在遭遇自诞生以来最严峻的挑战。动摇它的不再仅仅是性能参数的对比,而是光通信(CPO)的物理质变、开源标准(UALink)的集群效应以及以太网(UEC)的算力民主化。
以下是 2026 年针对 NVLink 护城河的最新动态分析:
1. 光通信(CPO):“距离”不再是护城河
NVLink 过去最大的优势是极低的延迟和巨大的带宽,但它受限于铜缆,只能在单个机柜(如 NVL72)内横行。
物理层瓦解: 2026 年,CPO(共封装光学) 技术的成熟让光引擎直接进入 GPU 封装。这意味着“光互连”可以实现 百米级 的近乎零损耗传输。
影响: 以前只有 NVIDIA 的机柜能让 72 颗 GPU 像一颗芯片一样工作。现在,利用光互连,AMD 或其他 ASIC 厂家可以将分布在多个机柜的成百上千颗芯片连接成一个逻辑整体,NVLink 的“单机柜密度优势”被光通信带来的“跨机柜水平扩展”所对冲。
2. UALink 1.0 的商业化落地:反垄断的物理标准
2026 年,由 AMD、Intel、Broadcom、Meta 和 Google 推动的 UALink (Ultra Accelerator Link) 已经从纸面协议变成了实物芯片。
更大规模的集群: NVLink 5.0 的单集群上限通常在 576 颗 GPU 左右,而 UALink 1.0 规范支持多达 1,024 个加速器。在超大规模模型(如 GPT-6 等级)的训练中,UALink 提供了更大的横向扩展潜力。
解绑效应: UALink 是开源标准。2026 年初,Broadcom 推出了首款支持 UALink 的交换机芯片,这打破了只有 NVIDIA 拥有高性能 GPU 交换机(NVSwitch)的局面。这意味着 Meta 和微软可以绕过 NVIDIA 的整机方案,用 AMD 的 GPU 配合 Broadcom 的交换机,搭建出性能对标 DGX 的系统。
3. 以太网的“逆袭”:UEC 协议的普及
Ultra Ethernet Consortium (UEC) 在 2026 年已经发布了 1.0 版本,专门针对 AI 负载优化了以太网。
成本与通用性: 尽管 NVLink 依然在延迟上有 10%-20% 的微弱优势,但以太网的性价比和通用性无可匹敌。
Broadcom 的 SUE(Scale-Up Ethernet): 博通在 2026 年推出的 SUE 技术,让以太网也能处理以前只有 NVLink 能做的“节点内/近节点”通信。对于很多不追求极限延迟、但追求万卡规模稳定性的企业来说,以太网正在成为比 NVLink 更务实的底层选择。
2026 年格局对比表
| 特性 | NVIDIA NVLink 5.0 | UALink (2026 阵营) | 光通信 / CPO (趋势) |
|---|---|---|---|
| 生态系统 | 封闭协议,仅限 NVIDIA | 开源标准,跨厂商支持 | 物理层革新,全行业共识 |
| 单集群规模 | ~576 GPU | 1,024+ GPU | 理论上无限扩展 |
| 传输介质 | 强力推行铜缆 (短距) | 支持铜缆 & 光纤 | 全光化 (无距离限制) |
| 对 AMD 影响 | 压制 AMD 的多卡协同 | 救命稻草,让 MI400 实现无缝互连 | 抹平与 NVIDIA 的物理连接差距 |
总结:护城河消失了吗?
没有消失,但正在从“护城河”变成“高端孤岛”。
NVIDIA 的策略已经转向 NVLink Fusion:它意识到无法阻挡光通信和开源标准,于是开始允许部分合作伙伴(如 ARM、某些定制 ASIC)接入 NVLink 生态。
对 AMD 的利好:
2026 年的今天,AMD 已经不再孤军奋战。由于有 Broadcom 提供的“骨架”(交换机)和光通信提供的“血液”(光模块),AMD 的 Instinct MI400 系列 在构建大规模 AI 集群时,不再需要为了适配 NVLink 而向 NVIDIA 缴纳“机柜税”。

请您先登陆,再发跟帖!