女大受到政府限制外,自己产品似乎问题也不少最终导致一再延期。主要的是几个出问题部件都是单一供货商,一出问题没有替代可用
NVLINK接口和调制电源都是单一供货商,YIELD一出问题只能延期。要命的是如果温度上升,MTBF 指数式变短。。幸亏是distributed computing, 否则这样的产品.....
设计的MARGIN似乎没留下足够余地。都已经到了要大规模生产的程度了,机柜由于散热不良还在改动。这些问题在做工程设计和验证时就该解决了。
如去看看APPLE就知道了产品上市一般如果没有2个供货商就不会上大规模生产。。
nvidia没有宣布下一代的ROBIN 具体时间是对的,BLACKWELL的教训要好好吸取,最好不要在ROBIN上犯同样错误