“数据蒸馏”决定了DeepSeek输出的基础性产品无法超越原创AI大模型。而且“数据蒸馏”只能在别人已经原创的成果基础上进行。
在更多的AI实际应用领域,如生物医疗服务、自动驾驶、AI机器人等还在开发的应用中,“数据蒸馏”在原创模型获得成功前无法做到,在原创模型获得成功后又可能遇到不会开源分享的难题(因为利益冲突),因而没有用武之地。一切原创的AI应用模型,只能老老实实投入算力、时间和资金。这可能也是目前的DeepSeek无法从根本上改变全球AI格局的深层原因。
“数据蒸馏”决定了DeepSeek输出的基础性产品无法超越原创AI大模型。而且“数据蒸馏”只能在别人已经原创的成果基础上进行。
在更多的AI实际应用领域,如生物医疗服务、自动驾驶、AI机器人等还在开发的应用中,“数据蒸馏”在原创模型获得成功前无法做到,在原创模型获得成功后又可能遇到不会开源分享的难题(因为利益冲突),因而没有用武之地。一切原创的AI应用模型,只能老老实实投入算力、时间和资金。这可能也是目前的DeepSeek无法从根本上改变全球AI格局的深层原因。
•
V3是从DeepSeek自己的671b参数的大模型上蒸馏的
-maniac63-
♂
(171 bytes)
()
01/28/2025 postreply
19:05:18
WENXUECITY.COM does not represent or guarantee the truthfCCPA ulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy