ChatGPT生成虚假数据集以支持科学假设

研究人员利用人工智能(AI)聊天机器人ChatGPT的技术创建了一个虚假的临床试验数据集,以支持一个未经验证的科学主张。

在《JAMA眼科学》杂志上发表的一篇论文中,作者们使用了与Advanced Data Analysis(ADA)配对的GPT-4来生成数据,比较了两种眼部疾病角膜圆锥的手术治疗方法的结果。AI生成的数据错误地表明一种名为深层前层角膜移植术(DALK)的治疗方法比穿透性角膜移植术(PK)更有效,这与真实的临床试验结果相反。

人工智能制造出逼真数据的能力引发了对研究诚信的担忧。研究人员和期刊编辑担心,人工智能生成的数据集可能会被用于制造虚假的测量数据、问卷调查的虚假答案和动物实验的大量数据。

这个生成的数据集乍一看看起来很真实,但专家们在仔细检查时发现了它被伪造的迹象。参与者的性别标识与根据他们的姓名推断的预期性别不符。此外,术前和术后的视力能力测量和眼部成像测试之间没有相关性。一些参与者的年龄数值也聚集在一个在真实数据集中极不寻常的方式。

研究作者承认他们的数据集有缺陷,但声称如果不仔细审查,很难辨认出它是非人类起源的。专家建议期刊需要更新质量检查措施,以识别由人工智能生成的合成数据,并建议开展合作项目设计工具,评估潜在问题研究。然而,生成式人工智能的进步可能会找到规避这些协议的方法。

下一页
上一页