你的手机并非在秘密监听你,但真相更令人不安:关于 Facebook 等的广告追踪
[中文正文内容]
或许最持久且广泛的技术阴谋论之一就是,你的智能手机一直在监听你的私人对话。几乎每个人都曾体验过看到社交媒体平台上推送的广告,与最近的谈话内容完全一致的诡异同步性。这当然令人不安,而最简单的解释就是直接的监视。当然,Facebook、Google 和 Apple 都在监听你与朋友的私人对话,捕捉关键词,然后为你提供量身定制的广告。当然,他们会否认这一切。
问题是,除了个别案例外,没有人能够找到明确的证据表明这实际上正在发生。
More Stories
Military
Anduril reinvents undersea surveillance with Seabed Sentry network
Drones
Flying-squirrel-inspired drone uses extendable wings ... to STOP flying
编者按:读者经常要求我们跟进一些令人难忘的故事。这些年来,这个故事发生了什么变化?本文最初发表于 2019 年,但经过重新编辑,并更新了截至 2025 年 4 月 15 日的最新信息。尽情享受吧!
2024 年,一则重大新闻出现,声称最终提供了确凿的证据,证明智能手机会跟踪私人对话,以便为个人定制广告。调查新闻网站 404 Media 透露,大型媒体集团 Cox Media Group (CMG) 开发了一个名为 Active Listening 的系统。该系统显然可以使用智能设备的麦克风捕获所谓的“实时意图数据”。然后,可以将这些“语音数据”与 AI 流程和其他“行为数据”配对,以提供高度定向的广告。
Active Listening 系统究竟如何运作尚不清楚,但几乎所有大型科技公司都立即与 CMG 保持距离。Amazon 声称从未与 CMG 合作作为广告合作伙伴,而 Google 和 Meta 迅速切断了与该公司的任何联系。甚至 CMG 也进入了损害控制模式,声明 Active Listening 产品已“停止使用,以避免误解”。
据大家所知,拟议的 CMG 系统并非 24/7 全天候通过手机的麦克风进行监听,而是使用在你使用“Hey Google”或“Hey Siri”命令激活语音助手后的瞬间录制并上传到云端的那一小段语音数据。虽然这一披露无疑重新点燃了“我的智能手机一直在监听我”的阴谋论,但它并没有推翻一些基本原因,即为什么这种想法在技术上仍然站不住脚。要理解这一点,我们需要回到几年前。
2019 年,移动网络安全公司 Wandera 进行了一系列实验,以了解你的智能手机如何持续监听你的私人对话。这些实验打破了都市神话,但也指出了像 Facebook 这样的公司有时会提供如此令人不安的准确广告的真相,这更加复杂和令人不安。
Facebook 承认监听私人对话
2019 年 8 月初,Bloomberg News 发表了一篇报道,揭示了 Facebook 如何与一家外部公司签订合同,转录通过 Facebook Messenger 应用程序进行的音频对话。该过程旨在测试 Facebook 正在推出的自动转录算法的准确性,该公司声称所有选择加入转录服务的用户都知道潜在的人工审核系统。虽然一些报道质疑 Facebook 的通知过程实际上有多透明,但该故事迅速传遍了媒体,大量头条新闻戏剧性地证实“Facebook 承认它在监听你的私人对话。”
对于普通的头条浏览者来说,他们对新闻的主要了解来自浏览社交媒体信息流中弹出的头条新闻,这足以重新激活多年的阴谋假设。这则新闻故事类似于向几乎被扑灭的神话的燃烧余烬上泼洒汽油。
甚至发布原始故事的媒体也在某种程度上虚伪地联系了旧的麦克风广告阴谋和这一新发现,引用了 Mark Zuckerberg 在 2018 年 4 月向美国国会作证时的证词,好像是在呈现一个“抓到”他撒谎的时刻。在回应参议员 Gary Peters 的提问时,他质疑 Facebook 是否监听用户的麦克风以生成定向广告,Zuckerberg 回答说:“你谈论的是这个阴谋论,它四处传播,说我们监听你的麦克风上发生的事情,并将其用于广告。我们不这样做。”
事实上,多年来,Facebook 一直否认它监听用户对话以生成定向广告。早在 2016 年年中,该公司首次尝试揭穿这一阴谋论。
“Facebook 不会使用你手机的麦克风来告知广告或更改你在信息流中看到的内容。最近的一些文章表明,我们必须监听人们的对话才能向他们展示相关的广告。这不是真的。我们根据人们的兴趣和其他个人资料信息展示广告,而不是你大声谈论的内容。”
数据不符
因此,在 2019 年,移动网络安全公司 Wandera 开始测试“手机窃听”理论,称其客户似乎一直担心这个问题。Wandera 的实验非常简单。将一部 iPhone 和一部 Samsung Galaxy 放在一个房间里,然后在三天内每天播放 30 分钟的宠物食品广告音频循环。
已启用大量应用程序的用户权限,并且在静音测试室中使用相同的手机进行相同的实验以作为对照。该实验有两个主要目标。首先,在实验后扫描了大量应用程序,以确定宠物食品广告是否突然出现在任何信息流中。其次,也许更重要的是,密切检查设备以跟踪数据消耗、电池使用情况和后台活动。
结果可能会让大家大吃一惊。在测试后,没有宠物食品广告出现在任何应用程序上。更具说服力的是,音频室测试和静音室测试之间的数据消耗、电池使用情况和后台活动几乎没有差异。这一事实很重要,因为如果一个应用程序正在访问麦克风并将音频发送到云服务器进行分析,则会有可检测到的数据消耗痕迹。
Android 数据在 30 分钟内的消耗量与 Google 语音助手在同一时间段内使用的数据量相比
Wandera
“我们观察到,我们的测试数据远低于 30 分钟内虚拟助手的数据,这表明在任何这些测试的应用程序上都不会发生持续录制对话并上传到云端的情况,”参与测试的 Wandera 工程师 James Mack 说。“如果是这样,我们预计数据使用量会与虚拟助手的数据消耗量一样高。”
iOS 数据在 30 分钟内的消耗量与 Siri 在同一时间段内使用的数据量相比
Wandera
这些测试中缺乏任何数据消耗的证据,这可能是最能揭穿长期存在的迷思的确凿证据。Antonio Garcia-Martinez 是 Facebook 的前产品经理,在 2013 年离开公司后,多年来一直对该公司持批评态度。然而,在 2017 年,他为 Wired 撰写了一篇非常简洁的社论,总结了为什么 Facebook 不会通过你的智能手机麦克风监听你。与 Wandera 一样,Garcia-Martinez 认为,麦克风监控所需的数据消耗量不仅使该技术难以执行,而且几乎不可能隐藏。
“Garcia-Martinez 在 2017 年解释说,要实现这一点,Facebook 需要录制你的手机在开启时听到的所有内容。“这在功能上等同于你与 Facebook 之间始终开启的电话通话。你平均的互联网语音通话单向需要大约 24 kbps,这相当于每秒大约 3 kBs 的数据。假设你有一半的时间打开手机,那么每天每个用户大约 130 MB。美国大约有 1.5 亿日活跃用户,因此仅在美国每天大约 20 petabytes。为了便于理解,Facebook 的整个数据存储“只有”大约 300 petabytes,每天的摄取率为大约 600 terabytes。”
一些人反驳说,Facebook 可以简单地扫描进入设备麦克风的音频中的关键词。这意味着它不需要持续地将来自你麦克风的开放音频通道流式传输到云端。但 Garcia-Martinez 也驳斥了这种想法,认为 Facebook 不仅需要跟踪数百万个定向广告关键词,而且你的手机 CPU 的压力会立即显现出来 - 而且同样几乎不可能隐藏。
“然后我们开始看到我们没有预料到的事情”
2017 年初,Northeastern University 的博士生 Jingjing Ren 和本科生 Elleen Pan 设计了一项研究来调查手机是否在用户不知情的情况下监听对话的问题。研究人员很快就清楚地意识到手机的麦克风没有被秘密激活,但同时也清楚地表明还有许多其他令人不安的事情正在发生。
“该项目的计算机科学家 Christo Wilson 说,根本没有音频泄露 - 没有一个应用程序激活了麦克风。“然后我们开始看到我们没有预料到的事情。应用程序会自动截取自己的屏幕截图并将其发送给第三方。在一种情况下,该应用程序录制了屏幕活动的视频并将该信息发送给了第三方。”
在检查的 17,000 多个 Android 应用程序中,超过 9,000 个具有截取屏幕截图的潜在权限。并且发现许多应用程序正在积极地这样做,截取屏幕截图并将其发送到第三方来源。
“这有可能比摄像头拍摄天花板的照片或麦克风录制毫无意义的对话更糟糕,”该项目的另一位计算机科学家 David Choffnes 说。“没有简单的方法来关闭这个隐私缺口。”
因此,你的手机可能没有监听你的对话,但它有能力以许多其他方式跟踪你。正是通过这种大量可跟踪的数据,像 Facebook 和 Google 这样的公司才能够为你提供定向广告,这些广告有时看起来令人恐惧地准确。
“使你的手机有用的所有功能,例如知道你在哪里、拍照、启用在线购物和银行业务 - 这些正是潜在的弱点和漏洞所在,”Wandera 工程副总裁 Mike Campin 说。“你的手机越有用,对广告商、黑客或任何想要你的数据的人就越有吸引力。”
正是在这里,你的智能手机偶尔令人不安的定向广告背后的真相变得比任何麦克风监控阴谋论都更加令人毛骨悚然。
严酷的真相
“Garcia-Martinez 写道,严酷的真相是,Facebook 不需要执行技术奇迹来通过微弱的信号来定位你。它已经有了更好的方法来做到这一点。“你看到的每一个令人毛骨悚然的准确广告都不是你认知偏见的纯粹虚构。请记住,Facebook 可以在你曾经查看过 Facebook 的任何设备上找到你。它可以利用零售商了解你的所有信息,甚至有时可以跟踪你的店内、仅限现金的购买;会员折扣卡与电话号码或电子邮件相关联是有原因的。”
因此,你可能会坚定地声称 Facebook 肯定监听了你昨天关于朋友婚礼的私人对话,然后为你提供量身定制的婚纱广告,因为你多年来没有在 Google 上搜索过任何与婚礼相关的内容。但是,系统有大量其他数据点来确定你在任何给定时间应该看到什么。该系统不仅确切地知道你每时每刻都在哪里,而且还知道你的朋友是谁、他们对什么感兴趣以及你与谁共度时光。它可以跨所有设备跟踪你,记录 Android 手机上的通话和短信元数据,甚至监视你写的东西,而你最终会删除它并且永远不会实际发送。
所有这一切的深刻令人不安的含义是,不断收集的大量数据可以被算法处理,以基本上预测你和你的朋友在谈论什么,并为你提供一个完美地满足你当前需求的广告。即使这些广告算法并不完美(请注意你收到的与你的兴趣完全无关的广告的频率),它们如此令人毛骨悚然地正确,即使只是在某些时候,也是这里真正的阴谋。
随着语音控制智能设备的出现,你肯定几乎一直都在被监听。但是,了解这些设备的确切工作方式是理解为什么它们不能一直录制你的关键。语音控制设备一旦在本地检测到关键命令(例如“Hey Google”),就会立即打开。然后,它会录制接下来的几秒钟语音数据,快速将其上传到云端,处理响应,并将最终结果发送到你的设备。所有这些数据传输都可以被检测和跟踪。我们知道它正在发生。我们可以看到它。
另一方面,人类大脑几乎不可能理解这些复杂的算法如何跟踪关于你和你的行踪的大量数据点。他们如何处理大量的个人数据来决定现在是投放炸鸡广告的正确时机,这可能超出了甚至设计这些算法的工程师的理解范围。在许多方面,这么多人仍然相信麦克风阴谋是有道理的。如果我们想象 Facebook 只是无意中听到了你昨天与朋友的谈话,那么更容易理解 Facebook 如何为你提供那则有先见之明的广告。但与生活中的许多事情一样,真相恰好更加复杂、更加难以理解,也更加令人不安。
本文的早期版本发表于 2019 年。