年龄与认知技能:用进废退 (Age and Cognitive Skills: Use it or Lose it)

文章主体内容开始

横断面年龄-技能曲线表明,如果不在30岁或更早开始使用认知技能,它们就会开始下降。如果这种年龄驱动的技能损失是准确的,那么它将对人口快速老龄化社会的人力资本构成重大威胁。 我们通过不同年龄段的识字和计算能力变化的个体数据,来估计实际的年龄-技能曲线。我们利用了德国“国际成人能力评估计划 (PIAAC-L)” 独有的纵向数据部分,该计划在3.5年后重新测试了大量具有代表性的成年人样本。我们的实证方法将年龄与同cohort效应分开,并纠正了从均值回归产生的测量误差。 出现了两个主要结果。首先,在识字能力方面,平均技能水平在四十多岁时迅速提高,然后略有下降,而在计算能力方面则下降幅度更大。 其次,只有那些技能使用率低于平均水平的人,其技能水平才会在老年时期下降。 使用率高于平均水平的白领和受过高等教育的工人,即使超过四十多岁,其技能也在不断提高。 女性在老年时期技能损失更大,尤其是在计算能力方面。

注册第一时间发布提醒

获取 Science 最新的第一时间发布论文

引言

人们普遍接受的结论是,认知技能会随着年龄的增长而下降,并且在成年早期就开始出现这种下降趋势 (1), 这种情况可能对经济产生越来越重要的影响。通过识字和计算能力衡量的认知技能与个人收入 (2 4) 和国家增长率 (5, 6) 密切相关, 这意味着社会年龄构成发生的稳步和显著变化 (7) 可能会直接影响国家的经济福祉。 然而,这种假定的技能模式主要来自横断面数据, 这些数据不仅必然包含老龄化模式,还包含技能方面的cohort差异。 如果负面的年龄模式仅仅是由于年龄和cohort效应的混淆造成的, 那么对经济的担忧就会大大减轻。 最近开发的针对具有代表性的成年人群体的纵向个人技能测试使我们能够提供证据,证明技能随着年龄的实际变化及其与成年人技能使用情况的关系。

我们利用德国成年人口的特殊纵向数据,研究了年龄驱动的技能下降的必然性。“国际成人能力评估计划 (PIAAC)”由经济合作与发展组织 (OECD) 管理,测试了与参与社会生活和工作相关的识字和计算能力,并调查了39个国家/地区中16至65岁人口随机抽样样本的经济和社会状况 (8)。 在所有参与国家中,德国是独一无二的,它创建了一个来自PIAAC样本的参与者小组, 这些参与者在原始调查后3.5年再次接受调查和测试。

我们利用数据的panel维度来估计成年人口可靠的平均年龄-技能曲线。观察整个年龄段的成年人技能的实际变化,使我们能够打破年龄和cohort模式的混淆, 这种混淆在对成年人技能进行一般横断面分析时普遍存在。 我们估计每个年龄的平均年度边际技能变化,并将它们跨不同年龄的人进行连接,从而得出完整的年龄-技能曲线。 然而,panel数据引入了新的方法学问题,在分析年龄-技能模式之前必须解决这些问题。

要创建基于个人老龄化的可靠年龄-技能模式,需要解决测量误差带来的偏差, 这些误差不可避免地伴随着技能的长期测试。对测试分数的观察包括真实分数和测量误差的组合, 这导致在查看随年龄变化的个体变化时出现系统性误差。 直观地说,较低的观察测试分数更可能包括负误差。 当我们观察到最初得分较低的个体的另一次评估时, 测量误差不太可能像第一次那样是负面的,这意味着对于得分较低的个体, 真实测试分数的改变被向上偏倚了。 对于最初得分较高的个体,情况正好相反。 当技能因年龄而异时,这种均值回归会使整体年龄-技能关系产生偏差。 因此,我们在整个过程中纠正了观察到的测试分数变化,以使其恢复到均值 (9), 以获得误差调整后的年龄-技能模式。

我们发现,对于识字和计算能力,平均(误差校正后的)技能在四十多岁时都大幅提高。 随后,识字能力方面的平均技能略有下降,而计算能力则大幅下降。 然而,这些平均值掩盖了重要的异质性。

通过适当调整后的年龄-技能曲线,我们可以进一步研究技能使用情况的作用。 之前的分析已经考虑了个人的背景或职业是否会影响年龄-技能模式的演变。 对年龄模式异质性的这些研究通常是由各群体之间技能使用情况的假定差异所驱动的, 但通常无法获得有关技能使用情况的数据。 由于PIAAC调查的背景数据提供了有关参与者在工作和家庭中技能使用情况的详细性质和频率的信息, 因此我们能够更深入地探索人口老龄化模式。

在工作和家庭中技能使用率高于平均水平的个人,平均而言永远不会面临技能下降(至少在我们的数据上限65岁之前)。 与先前研究的假设一致,技能使用情况与各种背景特征密切相关。 因此,如果白领和受过高等教育的工人具有高于中位数的技能使用率, 那么他们在工作生涯的后半段,其识字和计算能力都将继续提高,但如果技能使用率低于中位数,则不会这样。 技能发展也因性别而异:女性在老年时期技能下降幅度更大,尤其是在计算能力方面。

我们的分析对认知老龄化文献的主要贡献是,利用大型代表性样本的纵向变化,为识字和计算能力技能开发了丰富的年龄-技能曲线,这些技能已被证明在劳动力市场中具有经济回报。 数据使我们能够超越平均水平,考虑异质性的重要维度,并描述曲线差异与个人行为和背景之间的联系。 与我们的分析最接近的研究使用了不同的,具有识字和计算能力的大规模代表性调查 (1, 10),但这些调查并未跟踪个人技能随时间的实际变化。 一组平行的心理学和神经科学研究提供了相关的年龄模式及其来源的估计, 虽然是针对不同维度的技能和非代表性样本 (11 16), 但缺乏关于它们与激发我们工作的经济成果之间关系的证据。

结果

平均年龄-技能曲线

我们分析的起点来自认知技能随年龄变化的横断面图。图 1Opens in image viewer描述了PIAAC测试中,参与OECD所有国家的具有代表性的人口样本的成年人识字和计算能力 ([另见 8, 17] )。在横截面中,平均识字和计算能力得分在二十多岁末至三十多岁初开始下降。这种模式在定性上与我们的分析国家德国的情况相同,在德国,平均识字分数从20岁开始稳步下降,而计算能力分数略有上升,然后在三十多岁末开始下降(图S1)。

图 1. 横断面年龄-技能曲线(OECD国家)。

PIAAC (2012) 中年龄与技能之间的横断面关联。点:按年龄划分的平均技能。线:二次拟合(在21至65岁年龄范围内估计)。技能以 SD 单位衡量。样本:具有连续年龄数据的25个OECD国家;全部人口,年龄16至65岁,按抽样权重加权 (N = 147,667)。数据来源:PIAAC。

然而,很难解释这些横断面模式,因为它们混淆了年龄和cohort效应。不同年龄段的个人也来自不同的cohort,因此经历了不同的技能决定因素的历史, 这意味着这些图表未能描述任何个人随时间推移的年龄-技能关系的真实模式。因此,如果不引入关于cohort和个人时间模式性质的强烈假设,它们也无法可靠地用于了解导致技能随年龄变化的原因。

随着时间的推移,个体观察到的计算和识字能力的变化,显示出与横断面数据所暗示的截然不同的模式。图 2BOpens in image viewer描述了德国总人口样本中,个人在每个年龄段的技能得分随年龄变化的年度边际变化(3263个观察值)。该分析纠正了均值回归,并且包括二次拟合和95%置信区间。二次预测表明,在识字能力方面,个人的技能提升到45岁,在计算能力方面,个人的技能提升到40岁。超过这些年龄,技能变化变为负值,计算能力的下降明显强于识字能力。在两个学科中,技能的边际变化都随着年龄的增长而稳步下降。最初,这种下降接近线性,但最终变得平缓。

图 2. 纵向年龄-技能曲线。

(A) 每个年龄段预测的技能边际变化的累积描述。(B) 通过年龄划分的两波之间,技能的边际年度变化,调整为均值回归。点:按年龄划分的平均个人边际年度技能变化。线:二次拟合。灰色区域:95%置信区间。技能以 SD 单位衡量。样本:全部人口,年龄16至65岁,按抽样权重加权 (N = 3263)。数据来源:PIAAC-L。

连接这些边际变化的累积年龄-技能曲线显示在图 2AOpens in image viewer中。识字技能在二十多岁和三十多岁时大幅提高,并且从三十多岁末开始趋于稳定和平缓。峰值出现在46岁,但随后的下降是有限的。计算能力在年轻时也大幅提高,但峰值出现较早,为41岁,并且在年龄较大时大幅下降,但没有低于二十多岁初观察到的水平。当仅针对25岁及以上的个人估计时,技能随年龄的变化和年龄-技能曲线看起来非常相似(图S2), 这意味着完整的样本结果并非由16至24岁年龄组的模式驱动的,该年龄组中的许多人仍在接受教育。

各学科的年龄模式差异似乎出乎意料,尤其是在横截面中,这两个学科的成绩呈强正相关(相关系数为0.86)。 然而,它与各学科技能使用情况总体模式的差异一致(图S3)。 尽管如此,这些平均曲线隐藏了重要的行为驱动变化,这将在下一节中进行讨论。

按技能使用情况和背景划分的年龄-技能模式

先前的研究经常表明,具有不同背景的个人之间,年龄-技能模式存在相当大的异质性,这是由认知活动的假定差异所驱动的。 我们通过明确考虑技能轨迹与个人技能使用情况的关系来扩展这一研究思路。 对于这些分析,我们专注于受雇工人样本(2497个观测值),对于他们,我们可以观察到工作中的职业和技能使用模式。 受雇样本的总体年龄-技能曲线(图S4)与总人口的年龄-技能曲线(图 2Opens in image viewer](https://www.science.org/doi/full/10.1126/<#F2>))非常相似。

按使用情况划分的异质性

当我们按技能使用频率分隔年龄-技能曲线时,我们会得到明显不同的结果。 我们重复了先前的分析,样本按工作和家庭中技能使用情况的总体指标的中位数进行划分,该指标来自初始调查。 具体来说,我们创建了一个指标,该指标基于报告的在工作和日常生活中与阅读和数学相关的活动频率。 例如,对于数学,包括“计算价格、成本或预算”,对于阅读,包括“阅读信件、备忘录或电子邮件”,频率范围从“从不”到“每天”。

值得注意的是,对于每个技能,那些使用率高于中位数的人,平均而言,在观察到的年龄范围内,从未表现出技能下降(图 3Opens in image viewer)。他们的技能在五十多岁时急剧提高,然后趋于平缓,没有迹象表明平均水平下降。 相比之下,对于那些使用率低于中位数的人,技能下降从三十多岁中期开始。 与总体的模式相反,特定于使用情况的模式在两个技能维度上非常相似。 同样,如果在分析中忽略25岁以下的个人,则该模式在质量上保持不变(图S5)。 这些结果与技能使用在确定技能是获得、保持还是随时间推移而失去方面起着主导作用的观点相一致。

图 3. 按技能使用情况划分的年龄-技能曲线。

(A) 每个年龄段预测的技能边际变化的累积描述。(B) 通过年龄划分的两波之间技能的边际年度变化的二次拟合 [带95%置信区间 (CI)],调整为均值回归。技能以 SD 单位衡量。样本按工作和家庭中技能使用情况的中位数划分。样本:受雇工人,年龄16至65岁,按抽样权重加权 (N = 2497)。数据来源:PIAAC-L。

当分别考虑工作和家庭中的技能使用情况时,结果在质量上看起来相似(图S6和S7)。 在非受雇样本的全部人口样本中,也观察到了家庭中的技能使用情况;全部人口的结果看起来也非常相似(图S8)。

图 3Opens in image viewer中关于低使用率和高使用率群体的年龄-技能模式的发现,也生动地证明了调整均值回归的重要性。当查看原始的、未调整的技能数据时,技能的年龄-技能模式与使用情况的关键差异会被扭曲。高使用率群体具有高于平均水平的测试表现,这意味着如果未进行校正,误差模式会使变化向下偏倚。使用未经校正的数据,高使用率群体在年龄较大时,识字技能的增长似乎较低,并且在40岁后,计算能力似乎有所丧失(图S9)。另一方面,对于这两种技能类别,低使用率群体在年龄较大时,技能的下降似乎要低得多,这是均值回归导致初始得分较低的观察结果产生的积极偏差。因此,使用未调整的数据查看这些模式,会改变关于年龄-技能模式的结论。

按背景特征划分的异质性

先前的分析侧重于模式如何在容易观察到的职业、教育水平和性别亚组中发生变化。 这些分析通常由假定的平均使用情况差异驱动,这些假设确实在我们的数据中得到了验证,但忽略了群体内的使用情况差异。 平均而言,白领和受过高等教育的工人的技能使用率要高得多(参见图S3)。

这些亚组在使用情况上的差异会体现在年龄-技能模式中。区分蓝领和白领职业会产生与低使用率和高使用率个体之间的总体划分大致相似的结果。 对于白领工人,技能持续在整个年龄范围内提高,而对于蓝领工人,技能从早期开始下降(图 4AOpens in image viewer)。 当区分具有和不具有高等教育的人员时,几乎观察到相同的模式(图 4BOpens in image viewer)。

图 4. 按背景特征划分的年龄-技能曲线。

在每个年龄段,两波之间预测的技能边际年度变化的累积描述,调整为均值回归。(A) 按职业划分。(B) 按教育程度划分。(C) 按性别划分。技能以 SD 单位衡量。样本分别按蓝领/白领职业、(无)高等教育和性别划分。样本:受雇工人,年龄16至65岁,按抽样权重加权 (N = 2497)(对于完成高等教育的年龄22至65岁)。参见图S10至S12,了解按年龄划分的边际技能变化。数据来源:PIAAC-L。

性别差异也很有趣。 在识字能力方面,技能轨迹最初在不同性别之间相似,但随后男性趋于平缓,而女性从四十多岁中期开始略有下降(图 4COpens in image viewer)。 男性在计算能力方面的模式相似,而女性的计算能力从三十多岁初开始下降,并且下降幅度更大。 虽然男性在计算能力方面的更明显的性别差异可能是由于男性更频繁地使用数学(图S3)所致,但我们将在下面展示,这些差异不仅仅在于此。

为了总结亚组曲线中的总体差异,我们进行了回归分析,允许同时存在多种影响(表 1Opens in image viewer)。回归将技能变化表示为年龄的二次函数,并通过技能变化中所有年龄的线性变化来近似亚组效应。 在所有测量的使用类别中,从不每月使用技能到至少每月使用技能(即,使用指标从0到1)与识字能力方面平均每年技能提高0.108 SD,计算能力方面平均每年提高0.100 SD相关(列1和6),统计学意义非常显著。蓝领工人和白领工人之间技能变化的平均差异在识字能力方面为0.056 SD,在计算能力方面为0.030 SD(列2和7)。年龄-技能模式在具有和不具有高等教育的工人之间转移了识字能力方面0.057 SD,计算能力方面0.039 SD(列3和8),并且在男性和女性之间转移了识字能力方面0.014 SD,计算能力方面0.026 SD(列4和9)。通常,当共同考虑整套测量时,系数值估计会减小,但它们保持其相对排序和显著性(列5和10)。主要的例外是计算能力的白领职业系数变得很小,并且失去了统计显著性。

识字能力| 计算能力 ---|--- (1)| (2)| (3)| (4)| (5)| (6)| (7)| (8)| (9)| (10) 年龄| −0.0041*** (0.0015)| −0.0047*** (0.0015)| −0.0052*** (0.0015)| −0.0033** (0.0015)| −0.0055*** (0.0015)| −0.0059*** (0.0018)| −0.0063*** (0.0019)| −0.0068*** (0.0018)| −0.0054*** (0.0018)| −0.0067*** (0.0018) 年龄平方| 0.030 (0.019)| 0.034* (0.019)| 0.039** (0.019)| 0.020 (0.019)| 0.043** (0.019)| 0.054** (0.023)| 0.055** (0.024)| 0.060*** (0.023)| 0.046** (0.023)| 0.061*** (0.023) 技能使用情况| 0.108***(0.015)| 0.055*** (0.016)| 0.100*** (0.018)| 0.074*** (0.018) 白领职业| 0.056*** (0.006)| 0.034*** (0.007)| 0.030*** (0.008)| 0.011 (0.010) 高等教育| 0.056*** (0.007)| 0.030*** (0.008)| 0.039*** (0.009)| 0.024** (0.012) 女性| −0.014** (0.006)| −0.017*** (0.006)| −0.026*** (0.008)| −0.022*** (0.008) 常数| 0.065** (0.027)| 0.115*** (0.027)| 0.136*** (0.027)| 0.119*** (0.028)| 0.108*** (0.027)| 0.115***| 0.150*** (0.033)| 0.165*** (0.033)| 0.159*** (0.034)| 0.142*** (0.033) (0.033) R 2 (adj.)| 0.046| 0.050| 0.048| 0.020| 0.070| 0.036| 0.025| 0.029| 0.023| 0.046 观察| 2497| 2497| 2497| 2497| 2497| 2497| 2497| 2497| 2497| 2497 展开以获取更多

表 1. 技能边际变化的异质性。

按抽样权重加权的最小二乘回归。 因变量:两波之间个体边际年度技能变化,调整为均值回归。 技能以 SD 单位衡量。 年龄平方除以 1000。技能使用情况:工作和家庭中不同类别的技能使用情况至少每月一次的平均指标。 样本:受雇工人,年龄16至65岁。 回归对每个观察值(个体)使用 10 个合理的技能测量值。 SE 在括号中在个体层面进行聚类。 显著性水平:*** 1%,** 5%,* 10%。 数据来源:PIAAC-L。

使用回归框架中的各种替代技能使用指标,结果是稳健的(表S1)。 工作中的技能使用情况和家庭中的技能使用情况,在单独输入时,与技能变化显著相关(列1和2)。 当共同包含时,两者仍然显著,但工作中使用情况的系数估计值是家庭中使用情况的两倍(列3)。 当共同包含阅读和数学使用情况时,数学使用情况在识字能力回归中不具有统计显著性,但阅读使用情况在计算能力回归中具有显著性(列4)。 到目前为止,所考虑的技能使用衡量标准,衡量的是是否至少每月执行一次活动。 或者,我们可以使用从未到每天的底层五点频率量表的完整信息,将五个选项从零线性化到一。 此替代使用衡量标准中的系数在两个学科中都更大(列5和6)。

按特征和使用情况划分的40岁后的技能轨迹

通过背景因素解释年龄-技能模式因其与不同技能使用量之间的相互作用而变得复杂(参见图S3)。 为了突出这些相互作用,图 5Opens in image viewer绘制了在各个亚组中,40岁以上人群的平均技能变化,大致高于人口平均年龄,先前的分析表明,任何差异都应该很明显。 图中的零表示技能没有40岁后的变化,记录为 SD 单位的平均年度变化。

图 5. 40岁后的技能变化:按背景特征和技能使用情况划分。

两波之间,个体技能的平均边际年度变化,调整为均值回归,和 95% 置信带。 技能以 SD 单位衡量。 正值表示技能提高,负值表示技能下降。 亚组平均值分别按蓝领/白领职业、(无)高等教育和性别划分。 低/高技能使用情况:低于/高于工作和家庭中技能使用的中位数。 样本:受雇工人,年龄40至65岁,按抽样权重加权。 数据来源:PIAAC-L。

在每个亚组中,个体是否经常使用各自技能,技能轨迹存在很大差异。即使在40岁后技能平均增长的那些群体中,白领和受过高等教育的工人也只有那些经常使用技能的个体才会表现出增长。在这些群体中,使用率低于平均水平的个人没有表现出显著变化。类似地,在先前显示与年龄相关的平均下降的群体中,蓝领和受教育程度较低的工人中,对于那些技能使用率高于平均水平的人,40岁以后也没有显著的技能损失(识字能力方面蓝领工人除外)。总之,在劳动年龄生命的后半段,技能的获得或损失受到技能使用频率的强烈调节。

性别老化模式明显不同。在识字能力方面,使用情况主导着男性和女性的整体年龄-技能关系。然而,在计算能力方面,女性使用情况差异对年龄模式的差异影响明显较小。女性计算能力技能的年龄轨迹较少依赖于使用情况,只有高使用率才能阻止40至65岁女性的计算能力技能损失。这种模式并非由落在总体样本使用情况中位数之上或之下的亚组份额差异所驱动的,因为当通过其各自亚组中的中位数分割亚组时,它们也会出现类似的情况(图S13)。

这些结果不依赖于年龄样本的特定定义。对于所有亚组类别,在45岁或50岁以上工人的较小子样本中,定性结果是相似的。

讨论

人群的认知技能,例如识字和计算能力,不仅对个人收入很重要,而且对国家的经济增长也很重要 (2 6)。因此,如果普遍假定的这些技能会随着年龄增长而下降,那么世界人口老龄化会带来经济上的担忧。

我们使用个体识字和计算能力技能的纵向变化,为具有代表性的成年人样本创建了年龄-技能曲线,这些曲线可以可靠地将年龄与cohort效应区分开来。我们得出的纯年龄组成部分为老龄化人口的影响提供了不同的视角。总的来说,我们的结果与一种自然法则决定这些技能会随着年龄的增长而不可避免地下降的观点不一致。潜在的认知能力下降只发生在较晚的年龄,并且技能的使用并非不可避免。

这对于人口老龄化的国家来说是一种安慰,但避免技能损失并不是自动的,并且似乎与技能使用带来的刺激有关。因此,这些结果表明,成年人的年龄-技能关系值得政策关注,这与人们对终身学习必要性的关注是一致的。

下面,我们将讨论我们的研究与替代性先前方法所得出的发现有何关系。然后,我们将考虑我们工作的局限性。

在代表性样本中将年龄与cohort效应分开

一系列关于年龄-技能模式的研究来自先前的国际成人调查,这些调查涵盖了范围有限的国家:1994-1998年国际成人扫盲调查 (IALS) 和2003年成人扫盲和生活技能调查 (ALL)。虽然这些研究考虑了具有国家代表性的样本的技能,但它们依赖于纯粹的横断面信息来估计年龄-技能模式。因此,它们需要一个强有力的假设,即在很长一段时间内出生和接受教育的个人,在影响认知技能的因素方面,在其他方面是相似的 ([关于各种研究的详细信息,请参阅 1] 的评论)。因为这种方法依赖于不同年龄段的个人在技能方面的可观察到的群体差异,所以很自然地无法将个人的老龄化模式与潜在的cohort差异区分开来。

结论的实证差异非常显著。横断面模式显示,成年早期平均技能开始下降,但我们基于纵向数据的年龄-技能模式得出的结论是,平均技能在中年时提高。

通过组合IALS、ALL和PIAAC数据,可以创建合成cohort,从而可以随时间推移跟踪不同出生cohort的单独代表性样本的技能 (10, 18, 19)。虽然在概念上优于纯粹的横断面估计,但包括潜在抽样人口的变化、不同的就业模式以及对未经心理计量学链接的不同测试的比较在内的一系列问题,使对年龄-技能模式的任何分析变得复杂,导致可能从合成cohort方法得出错误的结论 (20)。相比之下,我们的分析能够跟踪个体在同一次心理测量测试工具上随着年龄增长而发生的实际认知技能变化。

在不关注经济相关技能的情况下,许多关于认知老龄化的研究都使用了个体纵向数据,但它们也往往来自非代表性样本。例如,开创性的西雅图纵向研究自1956年以来一直关注华盛顿州的健康维护组织中的便利样本 (15)。这种丰富个体panel数据的开发允许进行一系列详细的心理学研究。然而,有限的代表性可能会限制从选定样本中观察到的技能变化的普遍性,尤其因为我们的结果表明,年龄-技能模式会因行为和情境因素而显著变化。对智力各个组成部分和其他发展指标的调查重点也妨碍了快速转化为激发我们工作的经济技能。

在国际测试的背景下,横断面数据的一个例外是瑞典IALS数据的一个小型第二次测试,该测试使用了略有不同的后续评估,并为1994年的原始3038个观测值提供了1998年可用的622个重新测试。这已被用于研究失业期间的技能折旧 (21),但很难推广到总体年龄-技能曲线。

认知老龄化理论

大量心理学和神经科学对认知老龄化的研究表明,认知功能的各个组成部分的年龄模式可能存在显著差异 (1, 11, 14)。这项研究为我们记录的经济