当然,但是首先要用别人的大模型蒸馏,训练自己的,而且还要再加上谎报芯片的数据

回答: 全球投资人已经知道了可以小钱办大事猛熊2025-01-28 10:38:14

所有跟帖: 

具体方法不重要,思路已经打开 -猛熊- 给 猛熊 发送悄悄话 猛熊 的博客首页 (0 bytes) () 01/28/2025 postreply 10:44:08

悲观的人永远能鸡蛋里挑骨头,乐观的人看到的是希望和方向。 -lanyin0314- 给 lanyin0314 发送悄悄话 (0 bytes) () 01/28/2025 postreply 10:46:32

如果是假数据的话可不是鸡蛋里挑骨头。看别人能否复制吧。 -Lisland_2013- 给 Lisland_2013 发送悄悄话 (0 bytes) () 01/28/2025 postreply 10:53:42

是呀,这跟发表学术论文一样很快就能获得验证,目前信息来看positive居多。一上来就认为别人造假,跟官司还没打就有罪 -lanyin0314- 给 lanyin0314 发送悄悄话 (33 bytes) () 01/28/2025 postreply 10:59:53

看“很快”怎么定义了。学术上的很快对金融市场就很久了。 -Lisland_2013- 给 Lisland_2013 发送悄悄话 (0 bytes) () 01/28/2025 postreply 11:06:33

没有证据那就看着办,不能有罪推定。从过度宣传到部分造假到完全抄袭,中间也是隔了很多条长安街的。 -lanyin0314- 给 lanyin0314 发送悄悄话 (0 bytes) () 01/28/2025 postreply 11:12:57

这样讲比承认Deepseek的成绩会感觉良好一些? -太阳从西边出来- 给 太阳从西边出来 发送悄悄话 (0 bytes) () 01/28/2025 postreply 10:52:28

成绩是有的,问题是他说他是天才,没复习考的。。。 -Lisland_2013- 给 Lisland_2013 发送悄悄话 (0 bytes) () 01/28/2025 postreply 10:55:09

Deepseek很谦虚的吧。美国同行对他们的夸奖也比中国的夸奖多。你们这些人到底是在不忿什么。 -太阳从西边出来- 给 太阳从西边出来 发送悄悄话 (0 bytes) () 01/28/2025 postreply 12:32:36

蒸馏的是自己的大模型,我就好奇了你们这帮不学无术的下载个technical paper这么难吗 -maniac63- 给 maniac63 发送悄悄话 (0 bytes) () 01/28/2025 postreply 11:02:22

v3 671b个参数,比任何模型都大,蒸馏个毛 -maniac63- 给 maniac63 发送悄悄话 (107 bytes) () 01/28/2025 postreply 11:05:01

蒸馏是指对模型的压缩,数据端是另一面。你厉害617b全激活啊。617b公开吗?能验证吗? -此恶要吾持久- 给 此恶要吾持久 发送悄悄话 此恶要吾持久 的博客首页 (0 bytes) () 01/28/2025 postreply 12:06:06

请您先登陆,再发跟帖!