因为,做两个同样规模的LLM,性能远不如做一个两倍规模的LLM。
GPT基于的LLM模型的理论特性是,随着硬件规模增大,智能呈现指数级别上升。所以,大公司会带头抢GPU。
所有跟帖:
• ChatGPT 的优越性能靠的是超大规模模型,需要的算力比传统ML大多了 -study169- ♂ (191 bytes) () 02/11/2024 postreply 16:50:21
• 类似于传统ML和GPT的差距,尼安德特人的大脑尽管能发明工具,但是语言和认知能力很有限,和现代人类在智能上差好几个等级。 -uptrend- ♂ (0 bytes) () 02/11/2024 postreply 16:56:03