简体 | 繁体

loading...

热点论坛

全部论坛列表

【使用一种奖惩机制训练模型】，所有的模型训练都用的吧？要不然会overfit

来源: 我是谁的谁于 2025-01-25 07:51:42 [档案] [旧帖] [给我悄悄话] 阅读数 : (0 bytes)

字体:调大/重置/调小 | 加入书签 | 打印 | 所有跟帖 | 加跟贴 | 当前最热讨论主题

回答: 一分钟读懂deepseek 由静静的顿河02 于 2025-01-25 07:42:56

您的位置：文学城 » 论坛 » AI 潮流社 » 【使用一种奖惩机制训练模型】，所有的模型训练都用的吧？要不然会overfit

所有跟帖：

• 这个就比较technical 了。网上有详细解释的。 -静静的顿河02- ♀ (0 bytes) () 01/25/2025 postreply 08:01:35

• 我的意思是，大家都用奖惩函数（Lasso/Ridge），你列举的第一条并不是DeepSeek独特的机制啊？ -我是谁的谁- ♂ (0 bytes) () 01/25/2025 postreply 08:05:36

• 找到/发明独特的奖惩函数才是牛人 -我是谁的谁- ♂ (0 bytes) () 01/25/2025 postreply 08:11:17

• 梁文颂的公司叫做量化同方。而且，deep seek一旦开始 -大宋- ♂ (253 bytes) () 01/25/2025 postreply 08:19:45

• 有个预感 -大宋- ♂ (264 bytes) () 01/25/2025 postreply 08:03:16

• 这才是正确的方向 -我是谁的谁- ♂ (0 bytes) () 01/25/2025 postreply 08:04:12

• 应该是找对了训练模型的更有效方法。当年Google 打败Yahoo肯定不是因为更有钱。 -静静的顿河02- ♀ (0 bytes) () 01/25/2025 postreply 08:11:19

• 不是都开源了吗？算法是啥你们牛人们不是看看就懂？ -专业潜水妈- ♀ (0 bytes) () 01/25/2025 postreply 08:16:47

• 我要能一看就懂，还有空在这聊天吗？哈哈。 -静静的顿河02- ♀ (0 bytes) () 01/25/2025 postreply 08:20:48

请您先登陆，再发跟帖！