大部分 AI 价值将来自广泛自动化,而非 R&D

发布于

2025年3月21日

作者

Ege Erdil Matthew Barnett

分享

Twitter LinkedIn

一个关于 AI 对经济的未来影响的流行观点是,它将主要通过 AI 自动化 R&D 来实现。在某种程度上,许多行业内的有影响力的人物都表达过这种观点:

总的来说,尽管没有任何严格的经济论证支持这种观点,但它却出人意料地具有影响力。我们将在本文中论证,这种观点很可能是错误的。

R&D 通常不像人们想象的那么具有经济价值——提高生产力和新技术对于长期增长当然至关重要,但显式 R&D 对这些过程的贡献小于人们通常认为的。此外,即使是大部分贡献也是外部的,并且没有被执行 R&D 的公司以利润的形式获得,从而降低了首先部署系统来执行 R&D 的动机。这种组合意味着大多数 AI 系统实际上将被部署并从与 R&D 无关的任务中获得收入,并且总体而言,这些任务也更具有经济价值。

自动化 R&D 工作也比表面上看起来要困难得多,因为研究人员工作中的大多数任务都不是“推理任务”,并且至关重要地依赖于诸如能动性 (agency)、多模态 (multimodality) 和长程上下文连贯性 (long-context coherence) 等能力。一旦 AI 的能力已经达到了可以完全自动化研究人员工作的程度,那么自动化经济中的大多数其他工作也是可行的,由于上述原因,这很可能会比仅仅自动化 R&D 创造更多的经济价值。

当我们结合这两个观点时,没有理由期望 AI 的大部分经济价值在未来的任何时候都来自 R&D。一个更合理的场景是,AI 的价值将由广泛的经济部署驱动,并且虽然我们应该期望这 导致人均生产力和产出的增加,因为规模报酬递增,但这种增长的大部分可能不会来自显式 R&D。

保持领先一步

在您的收件箱中获取来自 Gradient Updates 的最新信息

订阅

AI 的主要经济影响将是它 广泛地 自动化劳动力的能力

在本节中,我们想区分两个相关但略有不同的主张,一个是我们同意的,另一个是我们不同意的:

为了理解我们反驳第二个主张的论点,我们必须首先衡量 R&D 的实际经济价值。我们知道 R&D 主要通过提高生产力来获得其经济价值,因此为了量化 R&D 的影响,我们可以问过去劳动生产率的增长有多少是由于 R&D 支出及其相关的溢出效应造成的。美国劳工统计局 估计,从 1988 年到 2022 年,由私营企业资助的 R&D 仅占美国全要素生产率 (TFP) 增长的约 0.2%/年,而同期全要素生产率的总增长约为 0.8%/年,劳动生产率的增长约为 1.9%/年。

尽管 公共 R&D 支出 仅占美国经济 R&D 总支出 的四分之一左右,但我们也可能期望它具有更大的积极外部性,并且 Fieldhouse 和 Mertens (2023) 估计这两个效应大致相互抵消:公共 R&D 平均也占美国全要素生产率增长的四分之一,这使得 R&D 对美国全要素生产率增长的总贡献约为 0.4%/年,或总贡献的一半。尽管如此,这意味着自 1988 年以来,美国劳动生产率增长的只有 20% 是由 R&D 支出推动的!

资本深化解释了这一时期劳动生产率增长的大约一半,而在剩余部分中,很大一部分可以用其他生产力来源来解释,例如更好的管理、干中学、知识传播等等。R&D 剩下的解释相对于整体“增长蛋糕”的规模来说是一个较小的贡献,并且即使是大部分 R&D 可能也需要研究人员以外的其他投入,例如技术设备和实验室设施。

我们对私人 R&D 对全要素生产率增长的贡献的估计也大致符合经济实际分配给 R&D 与资本积累的投资方式,至少如果我们假设推动全要素生产率增长的许多其他因素难以直接投资,并且 R&D 和资本形成在任何给定时间都面临同样陡峭的收益递减。由于资本深化占生产率增长的 50%,而私人 R&D 占 10%,我们可能预计资本投资大约是 R&D 投资的五倍,并且这种直觉结果是正确的:美国每年在资本投资上花费约 5 万亿美元,在私人 R&D 上总共花费 1 万亿美元。

因此,如果 R&D 的比例相对较小,那么我们实际上应该在哪里部署我们的 AI 系统以加速增长?最明显的渠道是广泛地自动化人类劳动力,因为在美国经济中,产出的劳动弹性约为 0.6,这可能超过“产出的 R&D 弹性”约五倍。此外,我们花在广泛应用的劳动力上的费用大约是花在显式 R&D 上的劳动力的 20 倍。这种直觉很简单:如果你想产生最大的经济价值,你应该自动化当前经济中收入最高的任何事物,这使得劳动力成为一个明显的关注目标。由此产生的规模更大的经济可以将产出再投资于资本,并通过许多其他渠道(而非正式 R&D)加速全要素生产率的增长,例如,通过干中学。总的来说,我们有充分的理由相信这会产生规模报酬递增,从而加速经济增长,可能达到比今天快十倍或更高的水平

对这种观点的反驳是,R&D 的增长效应在数据中被低估了,并且相对于资本投资而言,R&D 支出较少是由于 R&D 中较大的积极外部性和更强的踩脚趾效应的某种组合造成的。这些论点 先验地 并非不可信,但定量地说,当全要素生产率因许多其他看起来很重要的原因在空间和时间上变化时,很难争辩说 R&D 应该单独解释全要素生产率的大部分增长。此外,即使我们遵循 Bloom 等人(2020 年) 等有影响力的论文,做出一个没有根据的假设,即全要素生产率的增长完全是由 R&D 投入驱动的,他们的参数估计也表明,R&D 支出的产出弹性约为 0.3,与资本大致相等,仅为劳动力的一半。

总而言之,目前绝大多数的经济增长并非来自 R&D,我们需要一个令人信服的理由才能相信 AI 会扭转这种模式。通常会提出两个原因:R&D 对于 AI 来说特别重要,因为 AI 系统有可能自动化自己的 R&D,并且通常来说,R&D 任务对于 AI 来说更容易,因此将比经济的其他部分更早地实现自动化。我们认为这两个原因都没有说服力,并在后续章节中解释原因。

仅自动化 AI R&D 可能不会显着加速 AI 进步

虽然 R&D 的更广泛的经济价值不如我们可能预期的那么大,但仍然有一个特定于 AI 的原因让我们相信 R&D 自动化可能是一种主导效应。如果 AI 系统能够自动化其自身软件 R&D 的过程,那么一种 纯软件奇点 可能会成为可能:在固定数量的计算资源上,我们可以运行 AI 研究人员来寻找改进自身算法的方法,这将使我们能够运行更多的虚拟研究人员来取得更多的软件进步,等等。

这种反馈回路的可信度至关重要地取决于当我们朝着更大的软件效率迈进时,“想法变得更难找到”的速度有多快。在之前的工作中,我们定量地估计了这种效应在几个软件领域中的大小,并得出结论,如果研究人员的努力是 R&D 的唯一投入,那么纯软件奇点可能差不多一样有可能发生。然而,研究人员仅凭努力就可以实现多个数量级的软件 R&D 进步的关键假设是承重的,并且很可能是错误的。

一个更合理的模型是,研究进展既需要认知努力也需要数据,并且这两个输入之间存在一定程度的互补性。这也得到了以下事实的支持:在各个软件领域中,AI 是看到实验计算扩展速度最快和软件进步速度最快的领域,目前这两者的速度都 约为每年 3-4 倍。这种巧合表明,使用实验计算来生成数据至少对软件进步很重要,尽管我们不能仅凭这一点来判断它在多大程度上是研究人员努力的补充输入。

如果这两个输入确实是互补的,那么任何软件驱动的加速只能持续到我们在计算资源上受到瓶颈,并最终不得不做 物理工作 来获得更多的 GPU 以便运行更多的实验。AI 当然也可以加速这个过程,但前提是它要在整个半导体供应链中广泛部署,并且可能更广泛地部署在经济中,以便为该行业提供来自其他地方所需的投入。

纯软件奇点在瓶颈开始发挥作用以阻止它之前可以持续多少个数量级,这至关重要地取决于 AI R&D 中实验和洞察力之间互补性的强度,不幸的是,我们不知道对这个关键参数的任何好的估计。然而,在经济的其他部分,拥有非凡的互补性是很常见的,这应该告知我们对 AI R&D 情况下可能发生的事情的评估。仅举一个例子,Oberfield 和 Raval (2014) 估计美国制造业中劳动力和资本之间的替代弹性为 0.7,这已经足够强大,足以让任何“纯软件奇点”在效率提高不到一个数量级后就消失。

支持 R&D 过程存在瓶颈的另一个证据是,我们已经自动化了 R&D 的重要部分,但没有观察到科学进步的任何显着加速。例如,我们不断地自动化大多数 R&D 所需的编程工作,首先是通过开发专门的库,最近是通过使用 LLM 驱动的工具来加速编码;随着时间的推移,我们还发明了许多种类的节省体力劳动的研究设备。然而,这些都没有引起 R&D 进步的爆发:相反,好处相当微薄,这与 R&D 任务彼此之间具有相当强的互补性的说法一致。这并没有直接告诉我们整个 R&D 努力与实验之间的互补性,但这是应该纳入我们先验的另一个证据。

所有这些证据的低质量意味着我们不能排除 AI R&D 可能是经济中一个不寻常的部分,其中关键投入之间的替代弹性等于或大于 1,这将确保互补性足够弱,以至于原则上奇点是有可能发生的。然而,与我们确实有数据的其他情况进行比较应该引导我们对任何此类预测持谨慎态度。默认情况下,纯软件或软件偏向的奇点应被视为不太可能的结果,而不是可能的结果。

完全自动化 R&D 需要非常广泛的能力

乍一看,科学家的工作似乎非常依赖于抽象推理——产生想法、形成假设、分析数据、编码和数学推理。如果这是真的,这将表明科学研究人员将是近期最有可能被推理模型取代的工作之一。这是因为这些正是当前推理模型最容易自动化的任务类型。

在这样的世界中,在 AI 广泛部署到整个经济中以接管更常见的工作(例如零售工人、房地产经纪人或 IT 专业人员)之前,AI 将大大加速 R&D。简而言之,AI 将“首先自动化科学,然后自动化一切其他”。

但这张图景可能是错误的。实际上,大多数 R&D 工作需要的不仅仅是抽象推理能力。为了说明这一点,请考虑医学科学家。以下是 与医学科学家相关的工作任务列表,摘自 O*NET 职业调查,按对职业的重要性排序。我们根据我们是否普遍认为可以使用纯粹的抽象推理能力来执行每项任务进行标记——在这种情况下,这意味着它需要纯粹的语言、逻辑或数学能力,包括撰写报告、编码或证明定理。

重要性 | 任务 | 是否可以通过抽象推理自动化? ---|---|--- 92 | 处理有毒材料时,遵循严格的安全程序,以避免污染。 | ❌ 否 91 | 评估药物、气体、农药、寄生虫和微生物在各个层面的影响。 | ❌ 否 87 | 计划和指导研究,以调查人类或动物疾病、预防方法和疾病治疗方法。 | ❌ 否 87 | 准备和分析器官、组织和细胞样本,以识别毒性、细菌、微生物或研究细胞结构。 | ❌ 否 82 | 标准化药物剂量、免疫方法和药物和药用化合物的制造程序。 | ✅ 是 78 | 进行研究以开发医学应用的方法、仪器和程序,分析数据并展示发现。 | ❌ 否 78 | 向医生、住院医师、学生和技术人员教授医学原理以及医学和实验室程序。 | ✅ 是 77 | 研究动物和人类健康以及生理过程。 | ❌ 否 75 | 在科学期刊上撰写和发表文章。 | ✅ 是 75 | 撰写研究经费申请书。 | ✅ 是 73 | 调查疾病或寄生虫的病因、进展、生命周期或传播方式。 | ❌ 否 70 | 使用原子吸收光谱仪、电子显微镜、流式细胞仪或色谱系统等设备。 | ❌ 否 67 | 与卫生部门、行业人员、医生和其他人员协商,以制定健康安全标准和公共卫生改善计划。 | ✅ 是 60 | 就物理、生物和化学的医学应用咨询并向医生、教育工作者、研究人员和其他人员提供建议。 | ✅ 是

在这 14 项任务中,我们猜测只有 6 项需要单独进行抽象推理。引人注目的是,我们仅将医学科学家最重要的前五项任务中的一项归类为仅依赖于抽象推理。总体而言,该工作最关键的方面似乎需要动手技术技能、与他人进行复杂的协调、使用专用设备、长期上下文能力以及复杂的多模态理解。

这种模式在其他常见的研究职业中也适用。为了证明这一点,我们使用 GPT-4.5 将 12 个常见 R&D 职业中的任务标记为三个类别之一,具体取决于它是否认为该任务只能使用抽象推理能力来执行,是否需要复杂的计算机使用技能(但不需要实际存在),或者是否需要实际存在才能完成该任务。请参阅 此链接 以了解我们与 GPT-4.5 的对话,以找到我们的方法和结果。

该图揭示了科学研究实际包含的内容的更细致的图景。与研究主要是一项抽象推理任务的假设相反,现实情况是,其中大部分涉及物理操作和高级能动性。为了完全自动化 R&D,AI 系统可能需要能够自主操作计算机 GUI、与人类团队有效协调、具有强大的执行功能技能以在较长时间内完成高度复杂的项目,以及操纵其物理环境以进行实验。

然而,当 AI 达到完全胜任地执行这一系列多样化技能所需的水平时,很可能已经自动化了一大批更常规的工作。这与 AI 将“首先自动化科学,然后自动化一切其他”的观点相矛盾。相反,一个更合理的预测是,AI 自动化将首先自动化很大一部分普通劳动力,跨越非常广泛的行业,然后 才能达到完全接管 R&D 所需的水平。

我们不应期望 AI 革命始于科学突破,然后才进入其他领域,而应预期一个初始阶段,其中自动化首先接管很大一部分传统工作,只有在 AI 掌握了现实世界工作中混乱和复杂的需求之后,科学和技术才会实现大规模加速。

即使在 AI 完全接管 R&D 之后,有理由期望 AI 主要通过大规模自动化与 R&D 过程互补的非 R&D 任务(例如,开发科学家使用的基础设施或通用工具的行业)来加速科学和技术,而不是直接替代 R&D 研究人员。考虑到正如前面提到的,显式 R&D 目前仅占整体经济增长的一小部分,因此这种期望是有道理的。

AI 起飞很可能是分散且引人注目的

总而言之,前面的论点表明,即使在 AI 开始产生变革性的经济或技术影响 之前,其影响也可能比许多 AI 起飞的故事所描述的要分散且引人注目得多。我们所说的 分散 是指 AI 驱动的自动化将广泛发生并改变经济的很大一部分,而不是主要狭隘地局限于 R&D 职业。我们所说的 引人注目 是指其影响对大多数人来说将是高度可见且具有高度破坏性的——例如,通过大规模取代劳动力。

此外,即使在 AI 开始对世界产生变革性影响 之后,前面的论点也表明,显式 R&D 的自动化仅会在促进这些影响方面发挥次要作用。相反,这些影响将主要由整个经济中更广泛的自动化来支持。

与其想象未来几年的 AI 起飞将采取“数据中心里的天才国家”从事 R&D 工作的形式,不如想象以下替代图景:

  1. AI 进步将继续逐步扩大 AI 在未来几年内能够执行的任务集。这种进步将主要由扩展计算基础设施来实现,而不是纯粹的认知 AI R&D 工作。
  2. 因此,AI 将在整个经济中广泛部署,以自动化越来越广泛的劳动任务。最终,这将导致经济增长大大加速。
  3. 在 AI 对世界产生 变革性 影响之前(从经济、医疗或其他技术取得爆炸性进展的意义上讲),_已经_发生了一系列高度破坏性的自动化浪潮,从根本上重塑了全球劳动力市场和公众对 AI 的看法。
  4. 在任何时刻,包括在 AI 能够有意义地加速经济、医疗或技术进步之后,AI 加速每个这些变量的主要渠道将是大规模广泛自动化非 R&D 任务。

人们可以将这张图景称为“通用自动化爆炸”,以强调加速背后的基本机制来自 AI 自动化的广度和规模,而不是来自 AI 擅长的任何特定事物。但是,我们承认这个术语不如“智能爆炸”这个短语那么吸引人。

主要收获

这种观点对我们应如何从商业、政策和个人角度看待 AI 的未来具有重要的影响。

首先,从商业角度来看,我们怀疑在可预见的未来,AI 实验室专注于尝试自动化普通工作任务(例如创建可以胜任地浏览互联网、操作商业软件和执行标准白领工作任务的计算机使用代理)将比专注于开发能够在生物学和医学等领域狭隘地帮助研究人员的“诺贝尔奖获得者”级别的推理模型更有利可图。我们还认为,与 AI 在 R&D 任务上的表现相比,这些普通能力可能更重要。

其次,从政策角度来看,我们认为重要的是要认识到,从现在到 AI 开始对世界产生变革性影响(例如爆炸性经济增长或人类寿命延长方面的重大进展)之间,公众对 AI 的看法可能会发生深刻的变化。这种转变将会发生,因为当 AI 达到那个阶段时,社会已经经历了一系列具有破坏性的自动化浪潮,这些浪潮大规模地取代了工人。因此,我们认为假设公众对 AI 的看法在大致上保持不变,直到变革性 AI 出现之前或之后是错误的。

第三,从个人角度来看,我们认为值得为 AI 在几年甚至几十年内逐步接管工作岗位的未来进行计划和投资,而不是预测人类劳动力在 AI 接管 AI R&D 过程后 立即 过时的未来。我们认为,与其想象当 AI 通过递归 AI R&D 爆炸成超级智能时的一个相对突然的事件,不如预期更平稳地过渡到经济的完全自动化,这样做更有成效。

我们认为,可能会有一个延长的时期,在此期间,AI 在某些任务中超过人类,但在其他互补任务中仍然不如人类。需要明确的是,我们同意 AI 最终会在几乎所有具有经济价值的活动中超越人类,这将导致经济增长的显着加速。但是,我们认为这可能只会在经历了几年或几十年越来越广泛和具有破坏性的自动化之后才会发生——远远超出 R&D 领域。

关于作者

Ege Erdil 是 Epoch AI 的一名研究员。他对数学、统计学、经济学和预测学感兴趣。

Matthew Barnett 获得了加州大学伯克利分校的计算机科学学位。他目前有兴趣更清楚地了解 AI 在未来几十年将如何影响世界。

将此作品引用为

Ege Erdil 和 Matthew Barnett (2025), "Most AI value will come from broad automation, not from R&D". _Published online at epoch.ai._ Retrieved from: 'https://epoch.ai/gradient-updates/most-ai-value-will-come-from-broad-automation-not-from-r-d' [online resource]

BibTeX 引用

@misc{epoch2025mostaivaluewillcomefrombroadautomationnotfromrd,
 title={Most AI value will come from broad automation, not from R&D},
 author={Ege Erdil and Matthew Barnett},
 year={2025},
 url={https://epoch.ai/gradient-updates/most-ai-value-will-come-from-broad-automation-not-from-r-d},
 note={Accessed: 2025-03-22}
}

尚未实施

我们将重定向到一个新页面,其中列出此作者的所有帖子。 对我们的工作感到兴奋?

与我们交谈 支持我们的研究

注册我们的新闻通讯,以阅读有关 AI 新闻和发展以及我们研究的最新进展的每周评论。 订阅我们的新闻通讯

研究

项目

公司

@ 2025 Epoch AI Privacy Notice Cookie Policy

我们重视您的隐私

我们的网站使用 Cookie 来改善您的浏览体验并分析网站流量。点击“全部接受”即表示您同意我们按照我们的 隐私政策Cookie 政策 中所述使用 Cookie。如果您想撤回您的同意,可以通过 infra@epoch.ai 与我们联系。