策划 “阿里云Qwen2.5模型为基础 + 测试时间缩放训练新方法(1000个精心策划微小数据集)+ 在云计算蒸馏出来” 这个过程需要几天?不说李飞飞团队了。就算只用一人,花了一天,工资也远不止50刀。
策划 “阿里云Qwen2.5模型为基础 + 测试时间缩放训练新方法(1000个精心策划微小数据集)+ 在云计算蒸馏出来” 这个过程需要几天?不说李飞飞团队了。就算只用一人,花了一天,工资也远不止50刀。
•
训练的运算成本,你以为DS的那个600万算的啥成本?是运算成本吧,
-未完的歌-
♂
(0 bytes)
()
02/07/2025 postreply
09:05:17
•
那就再扛一下。。。
-种西瓜-
♂
(101 bytes)
()
02/07/2025 postreply
09:45:25
•
抬杠要切中要点,还需自己做功课。知道DS号称的6百万是啥费用吗?对比要同样的事做对比啊。给你看一下吧,GPUhours
-未完的歌-
♂
(157 bytes)
()
02/07/2025 postreply
11:00:10
•
你想简单了。。咱的扛正是切中了要害。。。
-种西瓜-
♂
(344 bytes)
()
02/07/2025 postreply
11:55:06
•
那说明你不了解AI届说成本是啥意思啊,比的就是训练一个模型需要的运算成本,用多少GPU时间
-未完的歌-
♂
(212 bytes)
()
02/07/2025 postreply
13:16:36
•
嗯.咱就欣赏杠精。杠精同学,咱说的就是只比拼电脑gpu时间不公平
-种西瓜-
♂
(259 bytes)
()
02/07/2025 postreply
15:23:01
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy