Grok 出现“白人种族灭绝”倾向疑因“未经授权的修改”

这已经是 Elon Musk 的 xAI 第二次将 Grok 的问题归咎于恶意员工了。 这已经是 Elon Musk 的 xAI 第二次将 Grok 的问题归咎于恶意员工了。 作者:Dominic Preston 2025年5月16日,上午8:52 UTC

STK262_GROK_B_A STK262_GROK_B_A 图片来源:The Verge Dominic Preston Dominic Preston 是一位新闻编辑,拥有十多年的新闻从业经验。他之前曾在 Android PoliceTech Advisor 工作。

在 xAI 的聊天机器人 Grok 在周三花了几个小时告诉每个愿意听的 X 用户,关于南非白人种族灭绝的说法极具争议之后,该公司将此行为归咎于对 Grok 代码的“未经授权的修改”。

周三持续数小时的爆发 中,无论话题如何,Grok 都会在 X 上的各种回复中插入关于南非所谓的白人种族灭绝的讨论。Grok 在回复一段猫喝水的视频时讨论了白人农民的死亡事件,将歌曲“Kill the Boer”与关于 Spongebob Squarepants 的问题联系起来,并且用完整的混合语分解了这个问题。甚至连 OpenAI 的 CEO Sam Altman 也参与其中,取笑竞争对手聊天机器人的公开崩溃。

该公司在 X 上的声明 中表示,有人修改了 AI 机器人的系统提示,“该提示指示 Grok 对某个政治话题提供特定的回应。” 该修改“违反了 xAI 的内部政策和核心价值观”,该公司表示已“进行了彻底的调查”,并正在实施新的措施来提高“透明度和可靠性”。

这些措施包括在 GitHub 上公开发布 Grok 的系统级提示,启动一个 24/7 的监控团队以更快地发现此类问题,并增加“额外的检查和措施,以确保 xAI 员工未经审查无法修改提示”。

xAI 以前也遇到过这个问题。该公司在 2 月将责任归咎于一名前 OpenAI 员工,原因是该员工推动了对 Grok 提示的更改,导致聊天机器人无视任何指责 Elon Musk 或 Donald Trump 传播虚假信息的来源。当时 xAI 的工程主管 Igor Babuschkin 表示该员工 能够做出更改“而无需征求公司任何人的确认”。