https://api-docs.deepseek.com/zh-cn/news/news1226
DeepSeek V3开发方正式发布了技术报告,最引人注目的是它的高效和对算力资源依赖之小,同时效果又异常的好。“DeepSeek-V3的完整训练成本仅为2.788M GPU小时。假设H800 GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。”
https://api-docs.deepseek.com/zh-cn/news/news1226
DeepSeek V3开发方正式发布了技术报告,最引人注目的是它的高效和对算力资源依赖之小,同时效果又异常的好。“DeepSeek-V3的完整训练成本仅为2.788M GPU小时。假设H800 GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。”
•
正常的推友没破防,尤其是幻方大模型,都是为人类做贡献,庆幸科技掌握在文明手里嘛
-StewartPlatform-
♂
(0 bytes)
()
12/30/2024 postreply
14:30:25
•
拜登遗产就剩ai泡沫了
-美国老师-
♂
(0 bytes)
()
12/30/2024 postreply
14:33:39
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy