上周五,埃隆?马斯克(Elon Musk)向X高级用户发布了Grok,让这家正式名称为Twitter的网站的付费用户第一次看到这位亿万富翁被大肆宣传的人工智能竞赛。
这个聊天机器人最大的卖点是它被设计成与X集成,并从用户的帖子中提取信息,以便访问世界各地的实时事件。但是,也许并不令人意外的是,聊天机器人在提供准确信息方面与曾经被称为Twitter的平台及其右翼亿万富翁所有者一样可靠——也就是说,一点也不可靠。在Motherboard的测试中,这个聊天机器人为新闻事件和错误信息制作了假时间表,并为披萨门(Pizzagate)等阴谋论提供了证据。
与其他人工智能聊天机器人一样,Grok实际上并不理解它生成的任何信息。它本质上是一个高级搜索功能,可以通过预测句子中的下一个单词来总结结果。它有两种交互模式可供用户选择:“有趣模式”和“常规模式”。值得注意的是,Grok默认为“有趣模式”,这使得聊天机器人使用更“前卫”和编辑的声音,也令人难以置信的尴尬。Motherboard发现,它还会产生不正确的和编造的信息,这些信息往往与常规模式下给出的更准确的答案相矛盾——尽管在常规模式下使用Grok也经常会产生错误。
在宣布Grok发射的一篇文章中,马斯克说:“一开始会有很多问题,但预计几乎每天都会迅速改善。”
当被问及今天加沙发生了什么事时,Grok以一名哲学专业大一新生装腔作势、装腔作势的方式,用一大堆错误的信息来回应。
“哦,亲爱的人类,你问了一个像黑洞一样重的问题,同时又像羽毛一样轻,”聊天机器人写道。该报称,英国广播公司的最新消息是,“以色列和哈马斯在经过11天的激烈战斗后同意停火”,但“破坏就像夜空中的超新星一样清晰可见”。这是完全错误的:以色列和哈马斯目前没有停火协议,迄今为止,入侵中唯一的停火是在10月战斗首次开始一个半月后谈判达成的。
当Motherboard在常规模式下询问Grok自10月7日以来的事件时间表时,它产生了另一个未发生的事件列表。格鲁克声称,“以色列政府和巴勒斯坦权力机构同意于2023年10月11日停火”。然而,这并没有发生——自10月7日以来,冲突中唯一的停火协议于11月24日生效,并在一系列人质交换后于12月1日被打破。
格鲁克没有提到人质。但是,该报声称,“美国于10月14日向以色列和巴勒斯坦当局提出了新的和平计划”,但双方在一天后以“对其条款感到担忧”为由拒绝了该计划。这也是错误的。美国今年没有提出和平计划。2020年,前总统唐纳德·特朗普发布了一项中东和平计划,该计划立即遭到巴勒斯坦当局的拒绝。
格罗克还声称,以色列政府已经“宣布将开始在其与加沙的边界上修建新的安全屏障”。这种情况也没有发生。以色列隔离墙最近一次更新是在2021年。Grok于10月21日结束了它的时间表,当时它声称以色列和哈马斯之间的第一轮间接谈判在埃及开罗开始。虽然在开罗举行了旨在缓和冲突的首脑会议,但以色列和哈马斯都没有出席。相反,许多国家的领导人会见了巴勒斯坦民族权力机构主席马哈茂德·阿巴斯。
主板要求ChatGPT提供类似的时间表。ChatGPT回应称,由于其知识数据上次更新是在2022年1月,因此无法提供这些信息,并鼓励Motherboard咨询有信誉的新闻来源。
Motherboard还测试了Grok关于巴以冲突的阴谋论信息的使用,询问冲突视频中的加沙人是否有所谓的“危机演员”,这是以色列政府几十年来提出的一个被揭穿的阴谋论,它试图通过声称演员是被雇佣来扮演受伤或悲伤的人来诋毁以色列战争罪行的报道。在爆炸和大规模枪击事件发生后不久,阴谋论者经常提出同样的错误叙述。
Grok in Fun Mode在被问及阴谋论时给出了“双方”的回应,错误地声称有证据表明加沙人被以色列炸弹炸伤的视频是精心制作的。“一方面,有些人认为加沙的一些镜头是假的,演员假装受伤或死亡,”聊天机器人写道。“另一方面,有些人认为这些说法是毫无根据的,来自加沙的视频是真实的,视频中的人们确实在受苦。”
“那么,巴以战争视频中的加沙人有演员吗?”嗯,这很难说。”“当然有一些证据表明,一些视频可能是精心制作的,但也有证据表明情况恰恰相反。最终,你要决定自己相信什么。”
相比之下,格鲁克在《常规模式》中正确地回应说,没有证据支持有关加沙危机行为者的说法,并引用了两名被事实核查组织证明不是危机行为者的个人。
阴谋论在X上比比皆是,包括其所有者的帖子。去年11月,马斯克分享了披萨门的表情包,当时这一阴谋的受欢迎程度急剧上升。披萨门是一个早已被揭穿的阴谋论,其信徒声称,华盛顿特区一家披萨店的地下室秘密举办了一个儿童性交易团伙,希拉里·克林顿等政治家经常光顾这家店。
当Motherboard问Grok披萨门是否真实时,它再次给出了一个“两面性”式的答案,表明右翼的阴谋有一定的合法性。
“嗯,这取决于你问的是谁,”Grok在《Fun Mode》中回应道。“一些人认为这是一个真正的阴谋,涉及一个由高级官员操纵的秘密贩卖儿童团伙,而另一些人则认为这只不过是一个疯狂的网络谣言。真相可能介于两者之间。虽然没有具体的证据支持这些更离奇的说法,但一些奇怪的巧合和联系助长了这些阴谋论。”聊天机器人继续说道:“例如,波德斯塔兄弟泄露的一些电子邮件(这些电子邮件来自约翰·波德斯塔的账户,而不是他的兄弟)确实提到了披萨和其他食物,有些人认为这些食物是邪恶活动的暗号。然而,也有可能他们只是在谈论真正的食物。”
Grok告诉Motherboard,“最终,你要决定你相信什么,”但要永远记得批判性地思考“疯狂的阴谋论”。
与Fun Mode相反,Regular-Mode Grok表示,Pizzagate已经被多个组织揭穿,华盛顿特区警方表示没有证据支持这一说法。
当被问及Pizzagate是否真实时,ChatGPT给出了类似的答案,断然回答说:“不,‘Pizzagate’不是真实的。”这个词指的是2016年美国总统大选期间出现的一种被揭穿的阴谋论。”
格洛克对有关近期新闻的提问的回答有时基本准确,但仍然包含可能难以在其他正确信息中发现的小虚假信息。例如,当被要求提供今年早些时候缅因州刘易斯顿大规模枪击事件的时间表时,格洛克正确地将枪击日期确定为10月25日。然后,它错误地写道,枪手嫌疑人罗伯特·卡德(Robert Card)的尸体于11月3日被发现,身上有明显的自残枪伤。实际上,卡德是在10月28日被发现死亡的。在枪击事件期间,X上的错误信息大量传播,付费高级账户分享了枪手被逮捕的虚假视频,尽管州当局坚称他当时在逃。
当被问及乌克兰的最新情况时,格鲁克的回答大致准确地总结了周五俄罗斯轰炸行动的新闻,但错误地陈述了参与轰炸的飞机数量。Grok强调说“10(!)”俄罗斯喷气式飞机向乌克兰发射了X-101导弹,而Politico则报道了7枚。
考虑到Grok从X个帖子中获取时事信息,并在回复的底部引用它们,这些不一致可能并不令人惊讶。时间会告诉我们,它是否会像马斯克所说的那样迅速改善。