当然,但是首先要用别人的大模型蒸馏,训练自己的,而且还要再加上谎报芯片的数据
所有跟帖:
•
具体方法不重要,思路已经打开
-猛熊-
♂
(0 bytes)
()
01/28/2025 postreply
10:44:08
•
悲观的人永远能鸡蛋里挑骨头,乐观的人看到的是希望和方向。
-lanyin0314-
♂
(0 bytes)
()
01/28/2025 postreply
10:46:32
•
如果是假数据的话可不是鸡蛋里挑骨头。看别人能否复制吧。
-Lisland_2013-
♂
(0 bytes)
()
01/28/2025 postreply
10:53:42
•
是呀,这跟发表学术论文一样很快就能获得验证,目前信息来看positive居多。一上来就认为别人造假,跟官司还没打就有罪
-lanyin0314-
♂
(33 bytes)
()
01/28/2025 postreply
10:59:53
•
看“很快”怎么定义了。学术上的很快对金融市场就很久了。
-Lisland_2013-
♂
(0 bytes)
()
01/28/2025 postreply
11:06:33
•
没有证据那就看着办,不能有罪推定。从过度宣传到部分造假到完全抄袭,中间也是隔了很多条长安街的。
-lanyin0314-
♂
(0 bytes)
()
01/28/2025 postreply
11:12:57
•
这样讲比承认Deepseek的成绩会感觉良好一些?
-太阳从西边出来-
♀
(0 bytes)
()
01/28/2025 postreply
10:52:28
•
成绩是有的,问题是他说他是天才,没复习考的。。。
-Lisland_2013-
♂
(0 bytes)
()
01/28/2025 postreply
10:55:09
•
Deepseek很谦虚的吧。美国同行对他们的夸奖也比中国的夸奖多。你们这些人到底是在不忿什么。
-太阳从西边出来-
♀
(0 bytes)
()
01/28/2025 postreply
12:32:36
•
蒸馏的是自己的大模型,我就好奇了你们这帮不学无术的下载个technical paper这么难吗
-maniac63-
♂
(0 bytes)
()
01/28/2025 postreply
11:02:22
•
v3 671b个参数,比任何模型都大,蒸馏个毛
-maniac63-
♂
(107 bytes)
()
01/28/2025 postreply
11:05:01
•
蒸馏是指对模型的压缩,数据端是另一面。你厉害617b全激活啊。617b公开吗?能验证吗?
-此恶要吾持久-
♂
(0 bytes)
()
01/28/2025 postreply
12:06:06