全球格点人口数据集系统性低估农村人口数量

摘要

许多旨在实现可持续发展的倡议都依赖于全球格点人口数据。这些数据主要针对城市环境进行了校准,但其在农村地区的准确性在很大程度上仍未被探索。本研究基于35个国家307个大型水坝建设项目的人口安置报告,系统性地验证了全球格点人口数据集在农村地区的准确性。我们发现不同数据集之间存在巨大差异,并且毫无例外地存在显著的负偏差:WorldPop为-53%,GWP为-65%,GRUMP为-67%,LandScan为-68%,GHS-POP为-84%。这意味着即使在最准确的数据集中,农村人口也被低估了一半。为了确保农村社区公平地获得服务和资源,过去和未来对这些数据集的应用都必须根据已识别出的偏差进行批判性的讨论。可以通过加强人口普查、采用替代的人口统计方法以及对人口模型进行更平衡的校准来提高数据集在农村地区的准确性。

其他人正在浏览的相似内容

图片:拉丁美洲和加勒比地区使用官方统计数据的高分辨率格点人口数据集

图片:美国国家合成人口数据集

图片:西班牙历史人口格点数据汇编 (1900–2021)

引言

准确估计人口分布是许多科学、社会和环境工作的核心,范围从资源分配到疾病流行病学和灾害风险管理。近年来,地理空间技术的进步以及卫星图像和遥感数据的广泛可用性促进了全球格点人口数据的开发。这些综合数据集将地球划分为均匀分布的高分辨率网格单元,并包含人口数量,使研究人员和政策制定者能够深入了解全球范围内人口的空间分布(图1)。

图1:五个全球格点人口数据集示例。

图片:五个全球格点人口数据集示例

该地图显示了越南北部宣光省的部分农村地区,其中包含a GWP、b GRUMP、c GHS-POP、d LandScan 和 e WorldPop 在 2000 年的人口数据。该地区的 Na Hang 水库于 2008 年竣工,造成 4000 人的安置。补充图 1 显示了面板 d 的放大图。国家边界由 ©EuroGeographics 提供。

全尺寸图片

迄今为止,已有八个开放获取的人口数量数据集具有(近)全球覆盖范围,即 GWP (Gridded Population of the World)、GRUMP (Global Rural-Urban Mapping Project)、GHS-POP (Global Human Settlement Population)、LandScan、WorldPop、HYDE (History database of the Global Environment)、HRSL (High Resolution Settlement Layer) 和 Kontur(表1)。这些产品背后的模型具有不同程度的复杂性,从简单的普查计数区域分解(如GWP)到涉及众多辅助数据源的dasymetric mapping 方法,例如基于卫星的基础设施和夜间灯光探测(如WorldPop)。Leyk等人、TReNDS以及POPGRID数据协作网站(https://www.popgrid.org)记录了人口数据集及其基础方法的详细信息。

表1 全球格点人口数据集的特征

全尺寸表格

由于其较大的空间覆盖范围以及与无数学科的相关性,全球格点人口数据集的使用和应用近年来急剧增加,但迄今为止,对其准确性的持续全球范围评估仍然缺乏。这些数据集主要在分散的国家或地区进行了验证和评估,或者侧重于选定的城市区域,在这些区域中,人口密度相对较高,并且地面实况数据的可用性更高。相反,以分散和异质人口为特征的农村地区,由于地面数据的有限性和固有的空间复杂性,给人口估计带来了独特的挑战。结果,这些数据集在农村地区的准确性和可靠性在很大程度上仍未被探索,从而导致对其适用于城市领域之外的应用的评估中存在重大知识差距。

本文旨在弥补这一知识差距,并系统地评估全球格点人口数据集在地球上农村地区的准确性。作为地面实况数据,我们采用了来自35个国家/地区307个大型水坝建设项目的人口安置报告数量和水库表面多边形(图2)的组合。人口安置报告数量是由国家水坝管理部门报告的,主要来自水坝项目规划和建设阶段进行的综合实地影响评估。水库多边形通常来自卫星图像,代表了水坝竣工后淹没的区域,因此提供了报告人数流离失所的空间范围。有关所采用的数据以及用于将地面实况数据与格点人口数据集进行比较的方法的更多详细信息,请参阅“方法”部分。

图2:本研究分析的307个农村地区的位置。

图片:本研究分析的307个农村地区的位置

报告的人口数量用标记大小表示,而农村地区的参考年份用标记颜色表示。国家边界由 ©EuroGeographics 提供。

全尺寸图片

使用人口安置数据和水库多边形组合的主要优势在于,评估的空间单元与水库覆盖的区域有关,而不是用于人口普查收集和创建人口数据集的行政边界。据我们所知,全球格点人口数据集以前从未经过使用完全独立于人口普查的多国参考数据的验证。参考数据包含过去几十年的人口安置历史数据,这使我们能够对1975-2010年的人口地图参考年份进行多时相的准确性评估(图3)。

图3:评估的农村地区和人口数据集的特征。

图片:评估的农村地区和人口数据集的特征

a 307 个评估的农村地区的时间分布。b 本研究中检查的五个数据集的时间覆盖范围和模型复杂性。

全尺寸图片

我们表明,所有五个经过检查的人口数据集都系统地低估了农村人口,存在显着的负偏差,范围从 -53% (WorldPop) 到 -84% (GHS-POP)。我们发现的偏差要求对过去和未来这些数据集的应用进行批判性讨论,以减轻农村人口在资源和服务分配中遭受系统性劣势的风险。此外,鉴于国家人口普查是人口模型的主要输入,我们的结果表明,农村地区人口普查的不完整性是一个比以前认为的更为严重的问题。

结果

本节介绍五个全球格点人口数据集在农村地区的准确性评估:GWP、GRUMP、GHS-POP、LandScan 和 WordPop。首先,我们根据所有五个数据集覆盖的33个农村地区,确定人口网格之间的系统性差异。接下来,我们将结果分解为地图参考年份和国家收入水平,这是通常被怀疑会影响地图准确性的两个方面。最后,我们提供了35个国家/地区中每个数据集的偏差百分比。

格点人口数据集之间的系统性差异

2000年是所有五个经过检查的人口数据集中唯一存在的参考年份(图3)。因此,该参考年份提供了一个独特的机会来检查数据集之间的系统性差异,从而将时间影响隔离。图4对比了报告的水库多边形 P_reported 中安置的人员与五个格点人口数据集预测的这些区域中的人口 P_predicted(请参阅“方法”部分)。在2000年,五个数据集中的绝大多数预测都显着低估了报告的值,而高估主要限于报告人数少于10的数据点。在视觉上比较五个网格的结果时,巨大的差异变得显而易见,同一农村地区的估计值通常跨越几个数量级(图4)。GWP、GRUMP、LandScan 和 WorldPop 之间的差异很大,但主要位于同一数量级内。但是,GHS-POP 与其他数据集的差异更大:它显示了所有33个农村地区的最低估计值,并且始终低估报告的人口。此外,GHS-POP 在农村地区似乎存在重大差距,对于几个报告人数超过1000的地区,估计值接近于零。

图4:将报告的农村人口(_x_轴)与五年人口数据集预测的参考年份2000人口(_y_轴)进行比较。

图片:将报告的农村人口与五年人口数据集预测的参考年份2000人口进行比较

每个垂直对齐的五个数据点组代表了针对参考年份2000评估的33个农村地区之一。请注意,两个轴均使用对数刻度。

全尺寸图片

按参考年份的结果

图5a–e将分析扩展到其他参考年份,并揭示了所有五个数据集中的系统性和显着性负偏差,范围从-53.4%(WorldPop),-65.0%(GWP),-66.9%(GRUMP)和-68.4%(LandScan)到-83.8%(GHS-POP)。这意味着即使对于偏差最小的数据源(WorldPop),预测的农村人口也少于报告数据的一半。在误差变异性方面,数据源之间的结果非常相似,对称平均绝对百分比误差(sMAPE;参见“方法”部分)为0.52–0.53,除了GHS-POP 显示出比其他数据源明显更高的扩展(sMAPE = 0.87)。将这些结果与基础模型复杂度联系起来(图3b),看来更复杂的人口模型不一定会导致农村地区更高的准确性。

图5:五个分析的人口数据集的验证散点图,将报告的农村人口(_x_轴)与人口数据集预测的农村人口(_y_轴)进行比较。

图片:五年分析的人口数据集的验证散点图

每个数据点代表307个分析的农村地区之一,并根据参考年份(ae)进行着色,并使用世界银行分类(fj)根据国家收入水平进行着色。所有图中显示的准确性指标代表偏差百分比和对称平均绝对百分比误差(sMAPE)。请注意,所有轴均使用对数刻度。

全尺寸图片

尽管在所有参考年份中都存在强烈的负偏差和较高的误差变异性,但对于最近几年,它们往往变得不那么明显(图6a,b)。由于加强了人口普查工作以及随着时间的推移辅助数据可用性的提高,这是合理的。虽然对于GWP,GRUMP,GHS-POP和LandScan,没有明显的偏差趋势可见,但WorldPop的改进非常显着,分别在2000年和2010年将偏差从约-80%降至-32%(图6a)。误差变异性得到了显着改善,2010年显示了所有五个数据集的最低sMAPE(图6b)。

图6:地图参考年份和国家收入水平对数据集准确性的趋势分析。

图片:地图参考年份和国家收入水平对数据集准确性的趋势分析

ab地图参考年份对数据集准确性的影响。cd国家收入水平对数据集准确性的影响。cd中的分析仅基于参考年份2000-2010的63个区域,以排除不同人口数据集所涵盖的不同时间段的影响。使用的准确性指标是偏差百分比和对称平均绝对百分比误差(sMAPE);对于这两个准确性指标,最佳值为零。

全尺寸图片

按国家收入水平划分的结果

人口建模者通常认为,由于更高收入的国家普查的频率更高,也更可靠,并且辅助数据的可用性更高,因此他们的数据集在高收入国家中更为准确,并且GHS-POP 确实显示出城市地区的这种行为。图5f–j显示了按世界银行分类的国家收入水平分类的验证结果。在307个农村地区中,只有22个位于高收入国家,所有国家的参考年份都在2000年之前。绝大多数分析的农村地区位于低收入或中等偏下收入国家。在图5f–j中,无法观察到国家收入对五个数据集准确性的明显影响。图6c、d中提出的趋势分析证实了这种初步印象,我们在其中重点关注参考年份为2000-2010的63个农村地区,以实现独立于随时间变化的数据准确性的分析(如图6a、b中所示)。趋势分析证实,国家收入水平不会显着影响农村地区人口数据集的准确性(图6c,d)。

按国家/地区划分的结果

最后,我们分别提供了35个评估了农村地区的国家/地区的结果。图7中偏差百分比的全球地图显示,即使在国家/地区级别,格点人口数据集也在很大程度上低估了农村人口。相对准确的估计值仅限于奥地利,莱索托,柬埔寨和越南(图7),但是这些国家/地区仅由1-2个数据点代表(图8),因此结果非常不确定。对于数据点数量较多的国家/地区,尤其是中国(203),巴西(30),澳大利亚(10),波兰(9)和哥伦比亚(6),可以得出更可靠的结论。在所有这些国家/地区,所有五个数据集都显着低估了农村人口(图7和8)。只能在少数数据点(即委内瑞拉,加纳,阿尔巴尼亚,北马其顿,莱索托,柬埔寨和越南)的七个国家/地区中观察到正偏差,并且在这五个数据集中,没有一个国家/地区的一致高估(图8)。

图7:在35个评估了农村地区的国家/地区中,五个数据集的平均偏差百分比。

图片:在35个评估了农村地区的国家/地区中,五年人口网格的平均偏差百分比

请注意,由于图8所示,大多数国家/地区仅包括五个数据集中的部分数据集的数据点。国家边界由 ©EuroGeographics 提供。

全尺寸图片

图8:在35个评估了农村地区的国家/地区中,五个数据集的偏差百分比。

图片:在35个评估了农村地区的国家/地区中,五个数据集的偏差百分比

国家/地区按ISO3国家/地区代码按字母顺序排序。ISO3国家/地区代码下面的数字表示每个国家/地区评估的农村地区总数。缺少用于计算给定数据集的偏差百分比的参考年份由x符号表示。

全尺寸图片

除奥地利、北马其顿和柬埔寨外,GHS-POP 在所有国家/地区均表现出很大的低估。其他四个数据集显示出略微平衡的行为。WorldPop 似乎在许多国家/地区的偏差最小,尤其是在数据点数量较多的国家/地区(例如,在中国、波兰和巴基斯坦)。但是,在巴西,WorldPop 的表现不如 GWP 和 GRUMP。有关每个国家/地区的数字偏差得分和评估地图年份的完整列表,请参阅补充表1。

许多国家/地区仅由几个数据点代表,这阻碍了对地图在其农村地区的总体准确性的可靠声明。因此,我们在这些国家/地区的结果包含重大不确定性,并且不一定提供国家一级数据准确性的代表性视图。但是,它们提供了有关准确性的第一个迹象,应通过进一步的国家规模准确性评估来证实这一点。

讨论

结果的主要影响。 本研究的结果对考虑农村地区及其人口的广泛研究和政策领域具有重大意义,包括备灾、公共卫生规划、环境保护以及最终的可持续发展。我们使用来自 300 多个水坝项目的人口安置报告数量评估了全球范围内农村地区全球格点人口数据集的准确性,这些项目提供了完全独立于人口普查的多国参考数据。我们发现所有数据集都存在低估农村人口的显着且系统性的趋势,偏差范围从 -53% (WorldPop) 到 -85% (GHS-POP)。这非常值得注意,因为无数的研究都采用了这些数据集,但没有质疑它们在农村领域的准确性,而且农村人口的系统性低估直接传播到他们的结果中。这意味着此类研究的结果,尤其是那些关注农村应用的研究,在不知不觉中低估了农村人口的利益。例如,对人口可能受灾影响进行绘图的研究可能低估了农村地区受灾人口的数量,这可能会导致风险降低工作的不公平分配,从而有利于城市人口并歧视农村人口。或者,过去对医疗保健可及性的分析可能会引导决策者对农村地区的医疗保健服务发展不足,仅仅是因为农村人口的实际需求没有在数据中得到充分反映。建立在这些研究基础上的政策可能已经导致农村地区的人口(目前约占全球人口的 43%)在获得服务、资源和公平发展机会方面遭受系统性的劣势。为确保农村人口不会进一步落后,过去和未来采用这些数据集的研究必须对底层的不确定性和局限性进行批判性的讨论,鼓励政策制定者对研究结果进行更仔细的解释,特别是在农村地区。否则,《2030年可持续发展议程》的根本目标“不让任何人掉队”将仍然是一个未兑现的承诺。

系统性低估农村人口的根本原因。 鉴于所有五个经过检查的数据集都存在系统性低估农村人口的现象,因此其根本原因似乎主要不在于数据集背后的方法和建模方法,而在于底层的输入数据。所有人口模型最重要的输入是国家人口普查,这些普查受到基本限制:最重要的是,资金不足会损害普查的完整性和及时性。此外,难以到达偏远地区或受冲突和暴力影响的社区,而且普查员经常面临语言障碍和参与抵制。这些挑战可能导致普查的严重不完整。例如,在巴拉圭,2012年的人口普查可能漏掉了四分之一的人口。我们在格点数据集中发现的农村人口的显着低估,提出了一个问题:普查中的这种差距是否比迄今为止假设的更为普遍,以及当前全球人口估计的可靠性如何?例如,联合国(2022年为79.8亿)或世界银行(2022年为79.5亿)的全球人口估计是否可能遗漏了世界人口的重要组成部分?这两个机构都严重依赖国家人口普查。

此外,还有一个问题是,人口普查中的差距是否会对城市和农村地区格点人口数据集的准确性产生同等影响。Kuffer等人评估了全球选定城市地区GHS-POP的准确性,发现存在高度的不确定性,但没有系统性的低估。这表明,至少对于此数据集而言,普查的不完整性不会主要影响城市地区的准确性,而是不成比例地分配给农村地区。事实上,数据集的生产者也承认,现有的格点人口数据集主要针对城市地区进行了校准,因为这是大多数人居住的地方,普查数据通常以更高的空间和时间分辨率提供,并且基础设施更容易检测。对于农村地区,普查受到更多限制,由于树木覆盖茂密或建筑物类型和材料的差异,可能更难以使用遥感数据识别村庄和基础设施。GRUMP和WorldPop使用的基于卫星的夜间灯光可能会引入进一步的偏差,因为农村地区,尤其是在发展中国家,可能缺乏电气化,因此使住宅建筑显得无人居住。但是,查看我们的验证数据集,我们没有观察到农村地区国家电气化对 GRUMP 和 WorldPop 人口估计偏差的任何重大影响(请参见补充图2)。

系统性偏差的另一个潜在原因是辅助数据的空间分辨率:GHS-POP 和 WorldPop 使用的 100 米分辨率的卫星图像可能非常适合描绘城市地区,但对于检测分散的村庄和聚落来说太粗糙了。例如,GHS-POP 使用了基于卫星的建筑物足迹的刚性掩模(图1),该掩模已被证明仅能检测到农村地区约 4% 的建筑物,这可能导致它在五个数据集中存在最大的偏差。最近的HRSL人口数据集提出了一个有趣的替代方案,因为它使用了30米分辨率的遥感数据(表1),但它目前仅包括约190个国家,并且缺少几个人口稠密的国家,例如中国和俄罗斯。此外,尽管HRSL具有很高的检测农村聚落的能力(例如,在马拉维案例研究中,检测到83%的农村建筑物),但在一项最近的大规模研究中,HRSL显示出的农村人口估计值甚至低于LandScan和WorldPop,表明与我们检查的这两个数据集相比,农村地区的负偏差更加明显。

最后,重要的是要提到,由于普查和辅助数据集的质量不均匀,农村人口低估的主要根本原因可能在各个国家之间差异很大。在普查数据相对可靠的各国进行进一步的比较研究将有助于提高我们对不同人口模型在各种环境中的优势和局限性的理解。

减轻负偏差的建议。 本研究的结果呼吁改善农村领域的人口数据收集和人口模型校准。显然,应将更多资源专门分配给农村地区的人口普查工作。此外,我们认为,数据生产者还应采用替代的人口统计方法,以丰富从普查中收集的数据并改善农村地区的模型校准。替代的人口统计方法包括选定农村地区的代表性家庭调查,例如Boo等人所证明的刚果民主共和国的调查,还包括地表采矿或大型基础设施项目的人口安置报告,例如本研究中用于验证的数据。辅助数据源在农村地区存在局限性(例如建筑物足迹或夜间灯光),尽管包含对城市领域非常有用的信息,但也应谨慎对待,并在人口模型中分配合理较低的影响力,以避免系统地惩罚农村人口。POPGRID 数据协作平台 ([https://www.popgrid.org](https://www.nature.com/articles/https://www.popgrid.org/)) 提供了一个极好的平台,可以在人口建模者社区中分享农村领域的高级校准和验证方法。

格点人口数据集的几个过去应用表明,研究结果,尤其是在人口稀疏地区,对人口数据集的选择非常敏感,而我们发现的检查数据集之间的巨大差异证实了这些先前的发现。但是,大多数研究仅使用可用的人口数据集之一,而没有批判性地讨论其选择。使用特定数据集的决定通常是由易于访问和使用所驱动的,而不是由数据集对给定研究环境的适用性所驱动的。我们的比较分析直接支持用户选择数据集,尤其是在涉及农村地区的研究中:由于在五个数据集中发现的系统偏差最小(但显着),因此我们建议将WorldPop用于全球和大规模分析。WorldPop 也得到了包含城市地区的先前分析的支持。对于侧重于农村地区的小规模研究,我们在图8和补充表1中提供的国家/地区特定偏差分数提供了有关感兴趣区域中最准确数据集的定量指导。为充分支持知情的数据集选择,人口建模者本身可以常规评估其产品,并公开提供农村和城市领域中数据的可靠性估计值。

本研究的局限性。 本研究的结果存在不确定性,主要涉及各国水坝管理部门报告的并用于验证的人口安置数量(请参阅“方法”)。这些数字有时可能代表了知情的估计值,而不是确切的基于地面的人口统计。不幸的是,没有关于人口安置数据中潜在偏差的信息。一种可能的偏差来源是各国水坝管理部门倾向于少报人口安置数量,以淡化水坝的社会影响。在我们分析的背景下,这种少报将进一步扩大我们为格点人口数据集确定的负偏差。

其次,我们对预测的人口值应用的简单偏差调整,以减轻GeoDAR数据集中水库区域的低估影响(请参阅“方法”),会影响我们对误差变异性的评估,因为某些水库区域的表示比其他区域更准确。这人为地增加了以sMAPE得分表示的误差变异性结果。但是,构成这项研究主要结果的偏差百分比不会受到影响,并且考虑到评估的农村地区数量众多(N = 307),偏差百分比应该是稳健的。

第三,由于缺乏2010年以后的验证数据,因此阻碍了对2015年和2020年人口网格的准确性评估。我们的分析显示,对于最新的评估参考年份2010年,平均偏差最小,并且数据集的准确性可能在最近几年中进一步提高,例如由于许多国家/地区采用了人口登记册和登记册支持的普查的实施增加。这意味着对于我们在这里确定的1975-2010年期间,偏差的显着性低于我们所确定的偏差。

最后,尽管分析的307个农村地区的集合显示出很大的差异,但就统计而言,它不是一个具有代表性的样本,无法评估整个人群的