说的没有错,但老黄没有说清楚

推理(Thinking/Reasoning)比 直接给出答案(Zero-shot)需要10~100x 的算力和电力消耗。推理时间越长,算力消耗越大。

如果要想支持100M用户同时使用,就需要巨大的算力。

请您先登陆,再发跟帖!