DeepSeek自己说是用了260万个H800的GPU小时,现在开源了,Alex Wang要是觉得H800是个阉割版不足以训练出这么复杂的模型,自己跑一下不就知道了?开源了DeepSeek还敢在训练时间上造假?
我觉得扯淡
所有跟帖:
•
CIA和FBI都没说,他怎么知道的?
-新年2012-
♀
(0 bytes)
()
01/26/2025 postreply
00:28:10