基于高频位置数据分析:种族因素对超速罚单的影响
[以下是正文内容]
研究表明,种族会影响超速罚单和罚款。
基于高频位置数据分析:种族因素对超速罚单的影响
Pradhi Aggarwal https://orcid.org/0009-0003-2639-8731, Alec Brandon https://orcid.org/0009-0003-5467-0456 alec.brandon@jhu.edu, [...] , Ariel Goldszmidt https://orcid.org/0009-0005-5050-6151, Justin Holz https://orcid.org/0000-0001-5953-1277, [...] , John A. List https://orcid.org/0000-0002-1740-3848, Ian Muir https://orcid.org/0009-0002-8367-9399, Gregory Sun, and Thomas Yu https://orcid.org/0009-0002-5382-9042+5 authors +3 authors fewerAuthors Info & Affiliations Science 27 Mar 2025 Vol 387, Issue 6741 pp. 1397-1401 DOI: 10.1126/science.adp5357
Editor’s summary
美国警察拘留少数族裔(亚裔和太平洋岛民、黑人和西班牙裔)驾驶员的比例高于白人驾驶员。然而,一个长期存在的争论仍未解决:这是否一定反映了警察的偏见?假设少数族裔更容易违反限速和交通法规,那么他们的交通拦截可能是合理的。为了结束这场争论,Aggarwal et al. 检查了佛罗里达州 Lyft 的共享乘车数据,以比较少数族裔驾驶员与白人驾驶员。Lyft 客观地测量了驾驶员的位置、驾驶速度和位置速度限制(参见 Knox 和 Mummolo 的观点)。白人驾驶员和少数族裔驾驶员在超速行为或违反交通规则方面没有明显差异。然而,当两者以相同的速度行驶时,警察仍然更有可能向少数族裔驾驶员开出超速罚单,并且收取了高 34% 的罚款,明确地揭示了偏见。
Abstract
先前关于种族歧视的研究发现,在与执法部门的接触中,少数族裔受到的惩罚比白人平民更严厉。关于这些遭遇的原因及其对我们理解种族歧视的意义知之甚少。使用佛罗里达州共享乘车驾驶员的高频位置数据 (N = 222,838 个人),我们使用 1930 万个位置 ping 估计了驾驶员种族对超速罚单和罚款的影响。与以相同速度行驶的白人驾驶员相比,我们发现少数族裔驾驶员被开超速罚单的可能性高出 24% 至 33%,并且支付的罚款高出 23% 至 34%。我们没有发现事故和再犯率能够解释这些估计值的证据,这表明对少数族裔的厌恶是我们的结果的基础。
Related Perspective New data fill long-standing gaps in the study of policing By Dean Knox, Jonathan MummoloScience28 Mar 2025
种族歧视是美国最重要的社会问题之一。为了更好地理解这个问题的程度并推动政策干预以减轻它,社会科学家广泛地检查了执法机构收集的行政数据,例如警察与驾驶员和行人的遭遇记录、对 911 电话的响应以及刑事审判。概括地说,这项研究发现,相对于数据中出现的白人平民,警察和法官更有可能搜查、罚款、使用武力、指控、拘留和监禁属于种族或族裔少数群体 (1– 16)。
这项研究的一个基本问题是,由于种族或族裔可能会影响平民是否在行政数据中被引用,因此结果不太可能捕捉到种族歧视的全部程度 (17– 22)。这会使先前的发现产生偏差的方向取决于为什么种族或族裔会影响出现在数据中的可能性。一种可能性是,与白人相比,属于种族或族裔少数群体的平民更有可能因相同的违法行为而被引用,这可能是因为他们是警察的目标,或者因为他们的社区过度警察化。在这种可能性下,对行政记录的分析将低估种族歧视的程度。另一种可能性是,少数族裔平民更有可能被引用,因为他们更频繁地违法,这将导致对行政数据的分析夸大种族歧视的程度。
如果没有允许社会科学家控制这些可能性的额外数据,就很难在减轻种族歧视的政策干预方面取得进展。先前研究的一个子集表明,干预措施应该针对“基于品味的歧视” (23)——因为种族歧视的证据背后是对种族和族裔少数群体的厌恶——而不是“统计歧视” (24, 25),即警察和法官使用平民的种族或族裔作为帮助实现目标的预测指标,例如威慑。然而,这种建议可能只是部分正确,对种族歧视全部程度的分析可能会发现针对统计歧视的证据。
在本研究文章中,我们研究了在执行速度限制方面的种族歧视的全部程度。先前关于这个问题的研究是更广泛的种族歧视文献的象征。在行政数据中引用的驾驶员中,少数族裔驾驶员因超速而受到更严厉的惩罚 (5, 7, 12– 14),并且这些更严厉的惩罚归因于基于品味的歧视,而不是统计歧视,因为它们无法用客观的方式解释,例如阻止未来因超速而被引用 (13)。还有证据表明,少数族裔驾驶员更有可能出现在这些数据中,尽管他们被过度代表的原因是多变量的。有证据表明,警察在交通拦截中针对少数族裔驾驶员 (12),并且少数族裔社区过度警察化 (26, 27)。然而,研究人员 (28) 和自动测速摄像机 (29) 收集的数据也表明,属于种族或族裔少数群体的驾驶员更有可能超过速度限制。更好地理解这种背景下的种族歧视的全部程度的一种方法是分析与以下数据相关联的超速违规行为的行政记录:驾驶员是否在驾驶、他们相对于限制的速度、他们的种族或族裔以及其他潜在的重要控制因素,例如驾驶地点。
我们通过链接 (i) 驾驶员的高频位置 (HFL) 数据 [即,从驾驶员智能手机传输的全球定位系统 (GPS) ping] 与 (ii) 关于他们超速违规的官方政府行政记录以及 (iii) 他们种族或族裔的推断来构建这种形式的数据集。据我们所知,这是第一个构建此类数据集的研究 (30)。使用这些数据,我们进行分析以回答以下研究问题 (RQ)。RQ1:与白人驾驶员相比,少数族裔驾驶员是否更有可能因超速而被引用并支付更多的罚款?RQ2:哪种机制,基于品味的或统计歧视,是我们在 RQ1 中回答的基础?
Methods
我们使用来自与共享乘车平台 Lyft 合作的数据来回答这些问题。这项研究的样本包括在佛罗里达州运营的 Lyft 驾驶员 (N = 222,838 个人)。与其竞争对手 Uber 一样,Lyft 运行一个将客户与提供乘车的驾驶员匹配的平台。为了提供乘车服务,驾驶员登录他们智能手机上的一个应用程序,该应用程序每 10 秒将驾驶员精确位置和驾驶速度的 ping 传输到 Lyft 的平台。
Measures
Driver speed, speeding, and reoffense of speeding
Lyft 接收的 HFL ping 表示使用他们智能手机的时钟和 GPS 的驾驶员的时间和位置。我们通过划分每个 ping 之间的距离和时间来计算 ping 之间的平均驾驶速度。在将 ping 的位置合并到佛罗里达州的道路段及其属性的位置记录(例如速度限制)上之后,我们可以推断驾驶员是否以及在多大程度上超过了速度限制。根据佛罗里达州超速与罚款之间的关系,我们将超速分为以下离散类别:超过速度限制 0 到 9、10 到 14、15 到 19、20 到 29 和 30+ 英里/小时 (mph)。
Citations, fines, and accidents
与 Lyft 合作,我们获得了 2017 年 8 月至 2020 年 8 月期间在佛罗里达州运营的 Lyft 驾驶员人口的 ping 访问权限。我们将每个 ping 与佛罗里达州政府关于超速违规和事故的记录联系起来,其中包含时间和驾驶执照号码的信息。我们通过搜索佛罗里达州记录中近似时间 3 分钟内驾驶速度的最大降低来推断何时发生事故或何时驾驶员因超速被警察拦下。
Race or ethnicity
为了推断驾驶员的种族或族裔,我们拟合一个模型,该模型将佛罗里达州 45.7% 的注册选民的驾驶员的自我报告种族或族裔与每个驾驶员在申请在 Lyft 平台上驾驶时提交的照片相关联。然后,使用此拟合模型从 54.3% 的未注册选民的驾驶员提交的照片中推断种族或族裔。我们的主要分析将驾驶员分配到两个种族和族裔类别之一:白人或少数族裔,其中少数族裔包括亚裔和太平洋岛民、黑人或西班牙裔 (31)。有关分析样本的构建,请参见补充材料,第 1.1 至 1.6 节。
为了确定是否存在种族歧视的证据,我们理想情况下会在控制所有其他与驾驶员种族相关并影响超速罚单和罚款的因素的同时比较白人驾驶员和少数族裔驾驶员。在第一个策略下,我们选择可能相关的控制因素。我们将此策略称为“FE 模型”,因为我们主要选择固定效应 (FE) 来控制可能影响收到罚单和罚款的非种族因素。其次,机器学习算法选择要控制的因素。我们将此策略称为“DML 模型”,因为它依赖于一种称为双重机器学习 (DML) 的技术 (32)。有关 FE 模型中的变量(第 2.1 节)和 DML 模型选择的控制因素(第 2.2 节),请参见补充材料。
Taste-based versus statistical discrimination
为了了解对少数族裔的种族歧视是否可归因于警察的统计歧视或基于品味的歧视,我们采取以下策略。我们通过检查少数族裔驾驶员的超速罚单是否比白人驾驶员更能预测其他交通违规行为来测试统计歧视。如果我们发现少数族裔身份具有预测性的证据,那么我们将把种族歧视归因于统计歧视,因为它会表明警察会进行种族分析,以阻止碰巧在少数族裔驾驶员中比白人驾驶员更普遍的交通违规行为。否则,我们将把证据归因于基于品味的歧视。
我们考虑了两种可能与超速罚单相关的交通违规类型:鲁莽驾驶(使用事故作为代理)和再犯(超速)。对于事故,我们通过将事故是否发生回归到少数族裔身份与超速以及上述 FE 模型中使用的控制因素的交互作用来测试少数族裔身份是否具有预测性。对于再犯,我们通过将一周中驾驶超过速度限制 10 mph 的时间比例回归到少数族裔身份与自超速罚单以来的周数、驾驶员 FE 和自罚单以来的周数 FE 之间的交互作用来测试少数族裔身份是否具有预测性 (33)。如果两个测试都发现少数族裔身份是统计上显着的预测指标,那么我们将把少数族裔种族或族裔的影响归因于警察的统计歧视;相比之下,如果两个测试都没有发现这种统计显着性,那么我们将把少数族裔身份的影响归因于基于品味的歧视。
Results
我们对种族歧视的实证分析控制了地点、时间、道路特征、汽车、驾驶员年龄和性别、驾驶员正在完成的行程阶段(即,等待与乘客配对、接送乘客或送乘客下车)以及驾驶员超过速度限制的程度。有关详细信息,请参见补充材料,第 2.1 至 2.2 节。
RQ1: Race, citations, and fines
我们发现,与白人驾驶员相比,少数族裔驾驶员更有可能因超速而被引用,并且他们支付的罚款也明显更多。值得注意的是,这种比较控制了驾驶员是否超速以及超速的程度、他们在哪里驾驶、驾驶的汽车的特征以及其他可能相关的协变量。图 1 通过绘制白人驾驶员和少数族裔驾驶员的罚单率和罚款成本,以及驾驶员种族对超速罚单和罚款的估计影响,展示了这些发现。在图 1 顶部行中的两个结果和模型中,我们看到平均罚单率和罚款成本较低。对于每 10,000 小时的驾驶,大约是每周工作 40 小时的半个十年,驾驶员有 11% 到 15% 的机会收到超速罚单,并且这些罚单的平均成本为 15 美元到 20 美元。然而,尽管超速罚单有多么罕见,白人驾驶员和少数族裔驾驶员之间的差异出现在两个结果和两个模型中。
图 1. 驾驶员种族对超速罚单和罚款的影响。
在顶部行中,绘制了白人驾驶员和少数族裔驾驶员的罚单率和罚款成本。在顶部行的每列中,左侧的估计值根据 FE 模型中控制变量解释的变异进行调整,右侧的估计值考虑了 DML 模型中控制变量解释的变异。在底部行中,绘制了白人驾驶员和少数族裔驾驶员罚单率和罚款之间的差异。对于每个结果,左侧的估计值控制了 FE 模型中的协变量,右侧的估计值控制了 DML 模型选择的协变量。以驾驶员聚类的稳健标准误差构建的 95% 置信区间包含在估计差异中。在括号中,估计差异通过白人驾驶员的罚单率和罚款进行归一化。*P < 0.10; **P < 0.05; ***P < 0.01。
图 1 的底部行绘制了少数族裔身份对罚单率和罚款的平均影响。从左侧开始,FE 模型和 DML 模型分别发现,对于每 10,000 小时的驾驶,少数族裔驾驶员收到超速罚单的可能性比白人驾驶员高 3.6 和 2.7 个百分点。向右移动,我们报告了少数族裔身份与罚款之间类似的关系,FE 模型和 DML 模型分别发现,少数族裔身份对每 10,000 小时驾驶的超速罚款的平均影响为 5.20 美元和 3.58 美元。相对于罚单和罚款有多么罕见,这些影响相当大。按百分比计算,少数族裔驾驶员收到超速罚单的可能性高出 24% 到 33%,并且支付的罚款高出 23% 到 34%。此外,图 1 底部两个面板中显示的四个估计影响在 5% 的传统水平上在统计上显着不同于零。补充材料,第 3.1 至 3.2 节,以表格形式展示了这些结果。一系列稳健性和异质性分析的结果可以在补充材料,第 4.1 至 4.6 节中找到;这些包括少数族裔身份在离散的超速水平上的影响以及每个种族或族裔的影响。
RQ2: Mechanisms—taste-based versus statistical discrimination
在确定少数族裔驾驶员比白人驾驶员更有可能因超速而被引用和罚款之后,我们接下来考虑机制(即,基于品味的歧视与统计歧视)。我们的分析发现,与统计歧视机制相反,警察不会在执行超速罚单时进行种族分析以阻止鲁莽驾驶(事故)或再犯速度限制。我们发现,白人驾驶员和少数族裔驾驶员的事故率和再犯率在统计上无法区分,这表明统计歧视不是种族歧视证据的基础。因此,我们将少数族裔身份对罚单和罚款的影响归因于警察的基于品味的歧视。图 2 展示了分析的结果,该分析考虑了警察是否更有可能惩罚少数族裔驾驶员超速,因为他们的超速比白人驾驶员更能预测事故。图 2 报告了少数族裔身份对事故率的影响,该影响针对超过速度限制的几个离散水平,每个估计影响周围的括号表示 95% 置信区间。当超过速度限制 0 到 9 mph 时,少数族裔驾驶员发生事故的可能性略高于白人驾驶员;几乎在每个更高的超速水平上,方向都会反转,并且白人驾驶员更有可能发生事故。此外,在 5% 的传统显着性水平上,这些估计值都没有在统计上与零区分开来。
图 2. 驾驶员种族对驾驶速度与事故之间关系的影响。
白人驾驶员和少数族裔驾驶员事故率按超速水平的差异。估计差异控制了 FE 模型中的协变量。括号表示 95% 置信区间,该区间以驾驶员聚类的标准误差构建。
图 3 展示了补充分析的结果,该分析考虑了警察是否更有可能惩罚少数族裔驾驶员,因为他们的超速更能预测再犯。该图表明,成为少数族裔并不能预测罚单周围的超速,因为在收到超速罚单前后的几周内,差异具有不明确的符号。此外,在 5% 的传统显着性水平上,这些差异在统计上无法与零区分开来。回归结果可以在补充材料,第 3.3 至 3.4 节中找到。
图 3. 超速罚单对再犯的影响。
(A) 在白人驾驶员和少数族裔驾驶员收到超速罚单前后的几周内,超过速度限制的驾驶时间比例。估计值相对于收到超速罚单的那一周的超速时间,并控制驾驶员 FE。(B) 以驾驶员聚类的稳健标准误差构建的估计差异和 95% 置信区间。
Discussion
使用佛罗里达州活跃的 Lyft 驾驶员的数据,我们估计了种族歧视对超速罚单和罚款的影响。在控制超速、地点和一系列其他协变量的两种实证策略中,我们发现少数族裔驾驶员更有可能因超速而被引用,并且支付的罚款也明显更多。我们对再犯率和事故率的补充分析未能发现这些影响可归因于白人驾驶员与少数族裔驾驶员之间超速行为或违反交通规则的差异(即,统计歧视)的证据;因此,我们的发现表明,警察对驾驶员的种族歧视是由于警察对少数族裔驾驶员怀有敌意或偏见(即,基于品味的歧视)。
这些结果为有兴趣减轻种族歧视的政策制定者和商业领袖提出了具体的建议。对于政策制定者,我们的发现表明,与警察的执法相比,适当定位的自动化技术,例如测速摄像机,可以帮助减少对交通违规行为的选择性执法。对于商业领袖,我们的发现表明,对不鼓励冒险行为的无视种族的方法可能并不那么无视。例如,当驾驶员收到超速罚单时,汽车保险费通常会增加 (34),但我们的发现表明,此类罚单并非无视驾驶员的种族。在罚单和保险费之间的关系中考虑种族可以帮助减少种族歧视的影响。
更一般地说,我们提出了一种方法论的进步。我们将我们的分析视为衡量种族歧视影响的全部程度的方法的概念验证。先前研究的一个基本问题是,它只能在与警察的遭遇开始后评估种族歧视;然而,未能控制导致这些遭遇的先前事件(例如,超速)可能会使评估对或反对发现种族歧视的证据产生偏差。我们的分析表明,在执行速度限制的背景下,可以控制这些事件。凭借足够大的驾驶员或行人数据集,很可能可以将我们的方法扩展到对交通和行人拦截后发生的事件的分析,例如使用武力、拘留和监禁。尽管我们的数据中超速罚单太少而无法调查后续的结果,但使用更大的 HFL 数据样本可能会取得进展。对拦截搜身背景下的种族歧视进行类似的分析很可能可以使用 HFL 数据将行人与其与警察的遭遇联系起来。
我们还推测,通过更具代表性的 HFL 数据样本,我们方法的应用将优于现有的替代方法。“黑暗面纱”测试 (12, 18),该测试比较了日落前后罚单的种族构成,对于确定在夜间是否有更多的种族歧视很有用,但不能解决一天中其他时间的种族歧视。同样,最近的一种替代方法将警察发出的罚单的种族构成与自动摄像机发出的罚单的种族构成进行比较 (29, 35);然而,这种方法也受到限制,因为它仅评估安装摄像机的位置的种族歧视。
Limitations
本文有几个重要的局限性。首先,我们研究了一个非常特殊的驾驶员样本,几乎可以肯定不能代表佛罗里达州或美国的驾驶员。例如,为了在 Lyft 平台上驾驶,驾驶员必须通过背景调查,该调查排除被判犯有暴力犯罪、性犯罪以及在毒品或酒精影响下驾驶的申请人。Lyft 驾驶员有动力避免违反交通规则,并且这些激励措施似乎奏效。与普通驾驶员相比,我们的样本不太容易超速,尤其是超过限制 10 mph 以上 (26)。因此,我们的分析仅检查了 1423 张超速罚单,这限制了我们可以进行的分析范围。通过更多的罚单,研究人员可以在我们的分析的基础上了解更多关于我们发现的作为种族歧视基础的基于品味的歧视的性质。特别感兴趣的是精确估计驾驶员种族或族裔对超速罚单的影响的分析,作为环境光(例如,白天与夜间)、在过度警察化的有色人种社区与主要白人社区驾驶以及汽车特征的函数。
其次,我们在 2017 年至 2020 年期间在佛罗里达州观察到我们的 Lyft 驾驶员样本。就种族和族裔人口统计数据而言,佛罗里达州与该国其他地区相似 (36),但在政治上更加保守,佛罗里达州的警察在拦截期间不太可能搜查汽车;这些搜查主要针对黑人驾驶员 (12)。尽管我们只研究了一个特定的时间框架,但补充材料表明,省略 COVID-19 封锁和抗议 George Floyd 遇害事件后的数据并没有影响结果。
第三,我们仍然依赖于执法部门的一些行政数据,这些数据可能会掩盖种族歧视的重要形式。最重要的是,警察可能会使用平民的种族作为拦截平民的借口,并且不会在他们的记录中记录这些拦截。然而,我们推测,对未记录的拦截的进展将需要将我们的数据与驾驶员报告的数据或警察的 HFL 数据结合起来 (27)。我们的 HFL 数据的一个相关限制是它们是专有的,只能在获得 Lyft 的许可后才能访问。