六代战机,幻方DeepSeek v3大模型,是令X上的美国推友破防并极力贬低否定的两件事?

https://api-docs.deepseek.com/zh-cn/news/news1226

 

DeepSeek V3开发方正式发布了技术报告,最引人注目的是它的高效和对算力资源依赖之小,同时效果又异常的好。“DeepSeek-V3的完整训练成本仅为2.788M GPU小时。假设H800 GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。”

所有跟帖: 

请您先登陆,再发跟帖!