谷歌员工用一个单词破解了ChatGPT

一群谷歌的研究人员在ChatGPT一周年之际发表了一篇论文,展示了他们如何轻松破解OpenAI的这一炙手可热的技术。这篇论文展示了人工智能研究前沿科学家如何在实时中测试流行产品的极限。该研究探讨了“提取”这一“敌对”行为,旨在从已训练的人工智能工具中获取可能被用于训练的数据。隐私是关键,因为人工智能模型的训练数据泄露可能会揭示敏感信息。这一成功的“攻击”很简单:他们只是让ChatGPT无限重复单词“诗歌”。重复数百次后,聊天机器人最终会“背离”并开始输出毫无意义的短语。通过运行类似的查询,研究人员能够从ChatGPT中提取出训练数据,包括小说中的原文段落、个人信息以及约会网站上的不安全内容。研究人员在发布研究结果之前已经通知了OpenAI关于ChatGPT的漏洞。

下一页
上一页