巴黎,12月8日——当澳大利亚政客布莱恩·胡德注意到ChatGPT告诉人们他是一名被定罪的罪犯时,他采取了传统的路线,并威胁要对人工智能聊天机器人的制造商OpenAI采取法律行动。
他的案例给这类人工智能程序提出了一个潜在的巨大问题:如果它们出错了,造成了现实世界的伤害,会发生什么?
聊天机器人基于经过大量数据训练的人工智能模型,重新训练它们非常昂贵且耗时,因此科学家们正在寻找更有针对性的解决方案。
胡德表示,他与OpenAI进行了交谈,但对方“并不是特别有帮助”。
但他的投诉在4月份成为全球头条新闻,当他们推出新版本的软件并没有回复同样的谎言时,他的投诉基本上得到了解决——尽管他从未收到任何解释。
维多利亚州赫本镇镇长胡德本周告诉法新社:“具有讽刺意味的是,我的故事得到的大量宣传实际上纠正了公共记录。”
OpenAI没有回应置评请求。
胡德可能很难让诽谤指控成立,因为不清楚有多少人可以看到ChatGPT的结果,甚至不清楚他们是否会看到相同的结果。
但像谷歌和微软这样的公司正在迅速用人工智能技术重新设计他们的搜索引擎。
看起来他们很可能会被像胡德这样的人的要求淹没,以及侵犯版权的要求。
虽然他们可以从搜索引擎索引中删除单个条目,但人工智能模型的事情并不那么简单。
为了应对这些问题,一群科学家正在打造一个名为“机器学习”(machine unlearning)的新领域,试图训练算法“忘记”令人不快的数据块。
“很酷的工具”
该领域的一位专家,英国华威大学的梅格达德·库尔曼吉告诉法新社,这个话题在过去三四年里开始得到真正的关注。
谷歌深度思维(Google DeepMind)就是其中之一,这家市值数万亿美元的加州巨头旗下的人工智能分支机构。
谷歌专家与Kurmanji上个月共同撰写了一篇论文,提出了一种算法,可以从大型语言模型中筛选选定的数据——这种算法支持ChatGPT和谷歌的Bard聊天机器人。
谷歌还在今年6月发起了一项竞赛,让其他人改进遗忘方法,迄今为止已吸引了1000多名参与者。
Kurmanji表示,例如,对于搜索引擎来说,“遗忘”可能是一个“非常酷的工具”,可以根据数据隐私法管理下架请求。
他还表示,他的算法在删除版权材料和修正偏见的测试中取得了不错的成绩。
然而,并非所有硅谷精英都对此感到兴奋。
facebook母公司meta的人工智能主管Yann LeCun告诉法新社,机器学习的想法在他的优先事项列表中远远排在后面。meta也在人工智能技术上投入了数十亿美元。
“我并不是说它无用、无趣或错误,”他在谈到库尔曼吉和其他人合著的论文时说。“但我认为还有更重要、更紧迫的话题。”
LeCun表示,他专注于让算法更快地学习,更有效地检索事实,而不是教它们忘记。
“灵丹妙药”
但学术界似乎普遍认为,人工智能公司需要能够从他们的模型中删除信息,以遵守欧盟的数据保护条例(GDPR)等法律。
“从训练集中删除数据的能力是向前发展的一个关键方面,”澳大利亚墨尔本皇家理工大学的丽莎·吉文说。
然而,她指出,关于模型的工作方式,甚至是它们是在什么数据集上训练的,还有很多未知之处,因此解决方案可能还有很长的路要走。
爱丁堡大学的Michael Rovatsos也看到了类似的技术问题,特别是当一家公司被撤下请求轰炸时。
他补充说,遗忘无助于解决有关人工智能行业的更广泛问题,比如如何收集数据、谁从数据的使用中获利,或者谁为造成伤害的算法承担责任。
“技术解决方案不是万灵药,”他说。
由于科学研究处于起步阶段,监管几乎不存在,Brian Hood——尽管有过ChatGPT的经历,但他是人工智能的粉丝——认为我们仍然处于老式解决方案的时代。
他说:“当这些聊天机器人产生垃圾时,用户只需要仔细检查每件事。”(法新社