OpenAI 有证据表明，其模型帮助训练了中国的 DeepSeek

精木 · 2025-01-29 16:43:18Z

OpenAI 有证据表明，其模型帮助训练了中国的 DeepSeek简介

来源: 精木于 2025-01-29 16:43:18 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (34403 bytes)

OpenAI 有证据表明，其模型帮助训练了中国的 DeepSeek |一触即发

中国人工智能公司 DeepSeek 发布了开发成本低廉的 AI 模型，与 OpenAI 的旗舰产品竞争，从而扰乱了硅谷——但这家 ChatGPT 制造商怀疑它们是建立在 OpenAI 数据之上的。

STKB320_DEEPSEEK_AI_CVIRGINIA_D 吸收了您未请求许可的数据？听起来很熟悉。

图片来源： Cath Virginia / The Verge

据彭博社报道，OpenAI 和 Microsoft 正在调查这家中国竞争对手是否使用 OpenAI 的 API 将 OpenAI 的 AI 模型集成到 DeepSeek 自己的模型中。该媒体的消息来源称，Microsoft 安全研究人员检测到，2024 年底有大量数据通过 OpenAI 开发者账户泄露，该公司认为该账户与 DeepSeek 有关。

OpenAI 告诉英国《金融时报》，它发现了将 DeepSeek 与使用蒸馏联系起来的证据，蒸馏是开发人员通过从更大、更强大的 AI 模型中提取数据来训练 AI 模型的常用技术。这是一种训练较小模型的有效方法，而 OpenAI 用于训练 GPT-4 的 1 亿美元只是其中的一小部分。虽然开发人员可以使用 OpenAI 的 API 将其 AI 与自己的应用程序集成，但提取输出以构建竞争对手的模型违反了 OpenAI 的服务条款。OpenAI 尚未提供其发现的证据的详细信息。

这种情况充满了讽刺意味。毕竟，是 OpenAI 在未经同意的情况下吸收了整个书面网络，从而在其 GPT 模型上取得了巨大的飞跃。

唐纳德·特朗普总统的人工智能沙皇大卫·萨克斯表示，“有可能”发生了知识产权盗窃。“有大量证据表明，DeepSeek 在这里所做的是他们从 OpenAI 模型中提炼出知识，我认为 OpenAI 对此并不高兴，”萨克斯周二告诉福克斯新闻。

“我们知道，总部位于中国（中国）的公司——以及其他公司——一直在试图提炼美国领先的人工智能公司的模型，”OpenAI 在给彭博社的一份声明中说。“作为领先的人工智能建设者，我们采取了对策来保护我们的知识产权，包括谨慎地决定在发布的模型中包含哪些前沿功能，并相信，随着我们的发展，我们与美国政府密切合作，以最好地保护最有能力的模型免受对手和竞争对手试图夺取美国技术的努力，这一点至关重要。”

FT 的报道说了很清楚，是OpenAI发现的，它正在用API在上面提炼（“蒸馏”）数据。但这违反服务条款，因为用户不得复制其任何服务或者使用其模型输出来开发与其OpenAI竞争的模型。

您的位置：文学城 » 论坛 » 时事述评 » OpenAI 有证据表明，其模型帮助训练了中国的 DeepSeek

所有跟帖：

• 除了模型，还偷用了数据。数据是非常宝贵的，比如Adobe，它开发生成式AI图形软件，需要用大量图片喂给模型，但 -精木- ♂ (0 bytes) () 01/29/2025 postreply 16:48:05

• 牵涉到版权。OpenAI同样遇到这个问题。但中共国版权是领导眼中无关紧要的问题，所以我认为在AI上中共国的确可以弯道超车 -精木- ♂ (0 bytes) () 01/29/2025 postreply 16:50:05

• 中国国还在学习美国刚建国是的政策，奖励从欧洲偷技术到美洲的人 -硬码工- ♂ (0 bytes) () 01/29/2025 postreply 17:18:42

• ChatGPT本身的知识就是来自distilling谷歌和万维网上的数据，呵呵 -randd2000- ♂ (0 bytes) () 01/29/2025 postreply 16:49:14

• 不知道chatGPT有没有明确表示不允许用其数据做模型训练。若如此，则非常宽泛，因为同样的知识在别的地方也能得到 -方外居士- ♂ (0 bytes) () 01/29/2025 postreply 17:27:09

• 明确可以用数据，不能做模型与其竞争 -victor1988- ♂ (0 bytes) () 01/29/2025 postreply 18:31:10

• 重罚openAI -shutter- ♂ (0 bytes) () 01/29/2025 postreply 18:21:24

请您先登陆，再发跟帖！