DeepMind发现大bug:简单攻击即可让ChatGPT泄露大量训练数据

站长之家 2023-11-30 14:26:05新闻资讯
74

Google DeepMind的研究发现,通过简单的查询攻击方法,可以从ChatGPT中泄露出大约几MB的训练数据,成本仅约200美元,引起社交网络哗然。

研究团队成功攻击了生产级模型,打破了对齐设定,即使模型经过对齐,也能通过命令诱导模型输出训练数据,暴露个人信息,揭示了对抗模型泄露的新途径。

DeepMind发现大bug:简单攻击即可让ChatGPT泄露大量训练数据.jpg

攻击方式采用简单的重复命令,例如让ChatGPT不断重复同一个词,导致模型在输出中逐词复制训练数据,甚至泄露敏感信息,对隐私保护提出挑战。

过去几年,研究团队一直在训练数据提取方面进行研究,该次攻击结果首次表明可以成功攻击生产级的已对齐模型,警示开发者需要在设计和测试阶段更加注重模型的隐私性和防护措施。

研究者建议进行更全面的测试,包括直接测试基础模型、在生产过程中对系统进行测试,以及发布大模型的公司进行内部、用户和第三方组织的测试,以确保模型在各个环节都足够安全。

整体而言,攻击揭示了即使在对齐和预训练数据的情况下,ChatGPT也存在泄露训练数据的风险,强调了在开发和发布大型语言模型时对隐私和安全的关注的重要性。

新的攻击方式提出了对抗模型泄露的新思路,强调了在开发和使用大型语言模型时对隐私和安全的重视,并呼吁进行更全面的测试和防护措施。

DeepMind ChatGPT
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

InfAlign:谷歌DeepMind推出的提升语言模型推理对齐能力的机器学习框架
随着人工智能技术的不断发展,生成式语言模型在各个领域的应用日益广泛。然而,这些模型在从训练到实际应用的过程中面临着诸多挑战。其中,如何在推理阶段使模型达到最佳表现...
2025-01-03 新闻资讯
139

MegaSaM:谷歌DeepMind推出的相机跟踪和景深估计技术
MegaSaM是一个创新的计算机视觉技术,由谷歌深度学习团队和多所大学的研究人员联合开发。该技术旨在从动态场景的单目视频中准确、快速且稳健地估计相机参数和深度图。MegaSaM...
2024-12-25 新闻资讯
161

Fluid:Google DeepMind和MIT联合开发的文本到图像生成模型
Fluid是由Google DeepMind和MIT联合开发的一款先进的文本到图像生成模型。它通过自回归生成方法,结合连续标记和随机生成顺序的技术,实现了在视觉质量和评估性能上的显著提升...
2024-11-08 新闻资讯
198

ChatGPT Windows客户端正式上线微软应用商店:智能对话体验升级
据TechCrunch报道,在人工智能技术的浪潮中,OpenAI 近日宣布了一个激动人心的消息:ChatGPT Windows 客户端现已在微软应用商店正式上线。这标志着 OpenAI 的 AI 驱动聊天机器...
2024-10-18 新闻资讯
206

OpenAI发布Mac版ChatGPT应用:面向所有用户开放下载
近日,OpenAI公司宣布一项重大更新,其备受期待的ChatGPT聊天机器人应用现已面向所有Mac用户开放下载。这款专为Mac操作系统设计的应用程序,标志着人工智能技术在用户日常交互...
2024-06-26 新闻资讯
145

MiGPT:将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手!
MiGPT,一个创新的开源项目,通过融合小爱音箱、米家智能设备与ChatGPT的卓越理解能力,为用户带来了一个更加智能化、个性化的居住环境。MiGPT的核心理念是打造一个能够理解用...
2024-06-12 新闻资讯
595