NVDA AI芯片光互连相关。 今天看到说华为用自家AI芯片光互连如何遥遥领先,查了查。
—光互连(Optical Interconnect)在 AI 芯片中的成本问题,几乎就是决定它能否普及的核心因素。
?
???? 光互连的成本构成
1. 光电转换器件(E/O、O/E)
? 电信号 → 光信号(激光器/调制器)
? 光信号 → 电信号(探测器/放大器)
? 这是最贵的一环,因为需要 硅光子器件 + 精密封装。
? 目前单个光收发模块的成本 = 数百美元 ~ 上千美元。
2. 光纤/波导布线
? 光纤本身便宜(1 美元/米级别),但在芯片和板级封装里,需要 光波导 / 光耦合器,封装成本很高。
3. 散热与封装
? 光器件需要高精度对准(alignment),生产良率低。
? 相比电互连(铜线焊接),光互连的封装工艺更复杂,成本至少 高 3–5 倍。
4. 可靠性和量产
? 电互连工艺成熟,量产良率 >95%。
? 光互连还在研发/小规模试产阶段,良率可能只有 60–80%,成本自然高。
?
???? 为什么没有大规模普及?
1. 成本高、产业链不成熟
? 电互连(SerDes + PCB + 铜线)非常成熟,成本极低。
? 光互连还在实验室/小规模应用,缺乏规模效应。
2. 软件生态缺失
? 目前 AI 框架和硬件生态都是为 GPU + 电互连(NVLink、IB) 优化的。
? 光互连虽然带宽更高,但如果软件栈不能调度/利用,优势无法发挥。
3. 功耗不一定全面占优
? 光纤传输能耗低,但 光电转换模块功耗高。
? 如果在芯片之间需要频繁转换(电?光?电),总能耗优势会被抵消。
4. 短期“没到瓶颈”
? NVIDIA 的 NVLink + InfiniBand 还能继续升级(比如 800 Gbps NDR)。
? 只要电互连还能支撑 1–3 代 GPU 的发展,厂商没动力大规模转向光互连。
5. 产能受限 & 技术壁垒
? 光互连需要 硅光子工艺 + 先进封装,这在台积电/英特尔/中芯国际等产线并不是大规模量产的主流工艺。
?
???? 成本量级(对比)
互连方式 带宽 单通道成本 功耗 成熟度
电互连(SerDes+铜线) ~100–200 Gbps 几美元 高 极成熟
InfiniBand NDR/HDR 400–800 Gbps 数百美元 高 成熟
光互连(芯片级 Optical I/O) 800 Gbps–1 Tbps 500–1000+ 美元 中(E/O 损耗高) 研发中
?
???? 什么时候可能普及?
? 2025–2027
? 小规模商用(高性能计算、国防、金融超算)。
? 美国 Ayar Labs、Lightmatter 已经在做 400–800 Gbps 光 I/O 原型。
? 2028–2030
? 成本下降到和高端 InfiniBand 相当时(单模块 ? 可能率先在 AI 超算中心/云厂商 普及。
? 2030 以后
? 如果电互连彻底遇到瓶颈(>1 Tbps/通道难以实现),光互连才会成为 主流方案。
?
? 结论:
光互连 AI 芯片现在还没有大规模普及,根本原因是:
? 成本高(光电转换+封装良率低)
? 生态不足(软件栈还不支持大规模调度光互连)
? 短期电互连还能继续迭代(NVLink/InfiniBand 足够支撑数年)。
时间表:2026–2030 年左右,光互连才有可能进入大规模商用。
?
NVDA AI芯片光互连相关。
所有跟帖:
•
这文章是不是去年的,光模块今年已经爆发,看中际旭创和新易盛的业绩和股价,妥妥的十倍股
-z10-
♀
(0 bytes)
()
08/26/2025 postreply
19:37:03
•
这两家做的是网络光互连, 不是芯片级的光互连。
-wavegreen-
♂
(0 bytes)
()
08/26/2025 postreply
20:30:00