OpenAI 有证据表明,其模型帮助训练了中国的 DeepSeek

OpenAI 有证据表明,其模型帮助训练了中国的 DeepSeek |一触即发

中国人工智能公司 DeepSeek 发布了开发成本低廉的 AI 模型,与 OpenAI 的旗舰产品竞争,从而扰乱了硅谷——但这家 ChatGPT 制造商怀疑它们是建立在 OpenAI 数据之上的。

STKB320_DEEPSEEK_AI_CVIRGINIA_D吸收了您未请求许可的数据?听起来很熟悉。

图片来源: Cath Virginia / The Verge

彭博社报道,OpenAI 和 Microsoft 正在调查这家中国竞争对手是否使用 OpenAI 的 API 将 OpenAI 的 AI 模型集成到 DeepSeek 自己的模型中。该媒体的消息来源称,Microsoft 安全研究人员检测到,2024 年底有大量数据通过 OpenAI 开发者账户泄露,该公司认为该账户与 DeepSeek 有关。

OpenAI 告诉英国《金融时报》,它发现了将 DeepSeek 与使用蒸馏联系起来的证据,蒸馏是开发人员通过从更大、更强大的 AI 模型中提取数据来训练 AI 模型的常用技术。这是一种训练较小模型的有效方法,而 OpenAI 用于训练 GPT-4 的 1 亿美元只是其中的一小部分。虽然开发人员可以使用 OpenAI 的 API 将其 AI 与自己的应用程序集成,但提取输出以构建竞争对手的模型违反了 OpenAI 的服务条款。OpenAI 尚未提供其发现的证据的详细信息。

这种情况充满了讽刺意味。毕竟,是 OpenAI 在未经同意的情况下吸收了整个书面网络,从而在其 GPT 模型上取得了巨大的飞跃。

唐纳德·特朗普总统的人工智能沙皇大卫·萨克斯表示,“有可能”发生了知识产权盗窃。“有大量证据表明,DeepSeek 在这里所做的是他们从 OpenAI 模型中提炼出知识,我认为 OpenAI 对此并不高兴,”萨克斯周二告诉福克斯新闻

“我们知道,总部位于中国(中国)的公司——以及其他公司——一直在试图提炼美国领先的人工智能公司的模型,”OpenAI 在给彭博社的一份声明中说。“作为领先的人工智能建设者,我们采取了对策来保护我们的知识产权,包括谨慎地决定在发布的模型中包含哪些前沿功能,并相信,随着我们的发展,我们与美国政府密切合作,以最好地保护最有能力的模型免受对手和竞争对手试图夺取美国技术的努力,这一点至关重要。”

FT 的报道说了很清楚,是OpenAI发现的,它正在用API在上面提炼(“蒸馏”)数据。但这违反服务条款,因为用户不得复制其任何服务或者使用其模型输出来开发与其OpenAI竞争的模型。

 

 
 
 
 
 
 
请您先登陆,再发跟帖!