Token = 推理量 = GPU 需求(NVDA 的核心商业模式)token 消耗是指数级增长,而不是线性增长。

来源: 2026-03-28 12:48:14 [旧帖] [给我悄悄话] 本文已被阅读: