2025年 AI Index 报告:关键发现
2025 AI Index Report
AI 对社会的影响从未如此显著。
在 Stanford HAI,我们相信 AI 将成为 21 世纪最具变革性的技术。但除非我们认真引导其发展,否则其益处不会均匀分布。《AI Index》提供了关于人工智能最全面、数据驱动的视角之一。作为全球媒体、政府和领先公司公认的可靠资源,《AI Index》为政策制定者、商业领袖和公众提供了严谨、客观的洞察,包括 AI 的技术进步、经济影响和社会影响。
主要发现
1. AI 在高要求基准测试中的性能持续提高。
2023 年,研究人员引入了新的基准测试——MMMU、GPQA 和 SWE-bench——以测试高级 AI 系统的极限。仅仅一年后,性能显著提高:在 MMMU、GPQA 和 SWE-bench 上的得分分别上升了 18.8、48.9 和 67.3 个百分点。除了基准测试外,AI 系统在生成高质量视频方面也取得了重大进展,并且在某些情况下,语言模型代理在有限的时间预算内甚至在编程任务中也优于人类。
2. AI 越来越嵌入到日常生活中。
从医疗保健到交通运输,AI 正在迅速从实验室走向日常生活。2023 年,FDA 批准了 223 款支持 AI 的医疗设备,而 2015 年仅为 6 款。在道路上,自动驾驶汽车不再是实验性的:Waymo 是美国最大的运营商之一,每周提供超过 150,000 次自动驾驶服务,而 Baidu 经济实惠的 Apollo Go 自动驾驶出租车车队现在为中国众多城市提供服务。
3. 商业领域全面拥抱 AI,推动了创纪录的投资和使用,研究继续显示出强大的生产力影响。
2024 年,美国私人 AI 投资增长至 1091 亿美元——几乎是中国 93 亿美元的 12 倍,是英国 45 亿美元的 24 倍。生成式 AI 尤其表现出强劲的势头,在全球范围内吸引了 339 亿美元的私人投资——比 2023 年增长了 18.7%。AI 的商业用途也在加速:78% 的组织报告称在 2024 年使用了 AI,高于前一年的 55%。与此同时,越来越多的研究证实,AI 可以提高生产力,并且在大多数情况下,有助于缩小整个劳动力的技能差距。
4. 美国仍然在生产顶级 AI 模型方面处于领先地位——但中国正在缩小性能差距。
2024 年,总部位于美国的机构生产了 40 个值得关注的 AI 模型,大大超过了中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先地位,但中国模型的质量差距迅速缩小:在 MMLU 和 HumanEval 等主要基准测试上的性能差异从 2023 年的两位数缩小到 2024 年的接近持平。与此同时,中国继续在 AI 出版物和专利方面处于领先地位。与此同时,模型开发越来越全球化,中东、拉丁美洲和东南亚等地区也推出了值得关注的产品。
5. 负责任的 AI 生态系统不断发展——但不平衡。
与 AI 相关的事件正在急剧增加,但主要工业模型开发商中,标准化的 RAI 评估仍然很少见。然而,HELM Safety、AIR-Bench 和 FACTS 等新基准测试为评估事实性和安全性提供了有希望的工具。在公司中,认识到 RAI 风险与采取有意义的行动之间仍然存在差距。相比之下,各国政府表现出越来越强的紧迫性:2024 年,全球在 AI 治理方面的合作得到加强,包括 OECD、EU、U.N. 和 African Union 在内的组织发布了侧重于透明度、可信赖性和其他核心负责任 AI 原则的框架。
6. 全球 AI 乐观情绪正在上升——但地区差异仍然很大。
在中国 (83%)、印度尼西亚 (80%) 和泰国 (77%) 等国家/地区,绝大多数人认为 AI 产品和服务比有害更有益。相比之下,在加拿大 (40%)、美国 (39%) 和荷兰 (36%) 等地的乐观情绪仍然远低于平均水平。尽管如此,情绪正在发生变化:自 2022 年以来,在几个先前持怀疑态度的国家/地区,乐观情绪已显着增长——包括德国 (+10%)、法国 (+10%)、加拿大 (+8%)、英国 (+8%) 和美国 (+4%)。
7. AI 变得更加高效、经济实惠且易于访问。
在越来越强大的小型模型的推动下,执行达到 GPT-3.5 水平的系统的推理成本在 2022 年 11 月至 2024 年 10 月期间下降了 280 多倍。在硬件层面,成本每年下降 30%,而能源效率每年提高 40%。开放权重模型也在缩小与封闭模型之间的差距,在一年内将某些基准测试上的性能差异从 8% 降低到仅 1.7%。总之,这些趋势正在迅速降低先进 AI 的门槛。
8. 各国政府正在加强对 AI 的监管和投资。
2024 年,美国联邦机构出台了 59 项与 AI 相关的法规——是 2023 年的两倍多——并且由两倍多的机构发布。在全球范围内,自 2023 年以来,75 个国家的立法中对 AI 的提及增加了 21.3%,自 2016 年以来增加了九倍。在日益受到关注的同时,各国政府正在大规模投资:加拿大承诺提供 24 亿美元,中国启动了一项 475 亿美元的半导体基金,法国承诺投入 1090 亿欧元,印度承诺提供 12.5 亿美元,沙特阿拉伯的 Project Transcendence 是一项 1000 亿美元的计划。
9. AI 和计算机科学教育正在扩展——但访问和准备方面的差距仍然存在。
三分之二的国家/地区现在提供或计划提供 K-12 CS 教育——是 2019 年的两倍——非洲和拉丁美洲取得了最大进展。在美国,过去 10 年中,获得计算机科学学士学位的毕业生人数增加了 22%。然而,由于电力等基本基础设施的差距,许多非洲国家/地区的访问仍然有限。在美国,81% 的 K-12 CS 教师表示 AI 应该成为基础 CS 教育的一部分,但只有不到一半的人觉得自己有能力教授它。
10. 行业在 AI 领域遥遥领先——但前沿正在收紧。
2024 年,近 90% 的值得关注的 AI 模型来自行业,高于 2023 年的 60%,而学术界仍然是高引用研究的首要来源。模型规模继续快速增长——训练计算每五个月翻一番,数据集每八个月翻一番,功耗每年翻一番。然而,性能差距正在缩小:排名第一和第十的模型之间的得分差异在一年内从 11.9% 降至 5.4%,而前两名现在的差距仅为 0.7%。前沿竞争越来越激烈——也越来越拥挤。
11. AI 因其对科学的影响而荣获最高荣誉。
AI 日益增长的重要性体现在主要的科学奖项中:两个诺贝尔奖承认了导致深度学习(物理学)及其在蛋白质折叠中的应用(化学)的工作,而图灵奖则表彰了对强化学习的开创性贡献。
12. 复杂推理仍然是一个挑战。
AI 模型擅长国际数学奥林匹克问题等任务,但在 PlanBench 等复杂推理基准测试中仍然面临困难。即使存在可证明正确的解决方案,它们也常常无法可靠地解决逻辑任务,从而限制了它们在高风险环境中的有效性,在这些环境中,精确性至关重要。
章节目录
第一章:研究与开发
本章探讨了 AI 研究和开发的趋势,首先分析了 AI 出版物、专利和值得关注的 AI 系统。
第二章:技术性能
今年《AI Index》的技术性能部分全面概述了 2024 年 AI 的发展情况。
第三章:负责任的 AI
人工智能现在已深深融入我们生活的几乎方方面面。它正在重塑教育、金融和医疗保健等行业,在这些行业中,算法驱动的洞察力指导着关键决策。
第四章:经济
全球私人 AI 投资创历史新高...
第五章:科学与医学
本章探讨了 AI 驱动的科学和医学的关键趋势,反映了该技术在这些领域中日益增长的影响。
第六章:政策与治理
AI 不断提升的能力引起了政策制定者的关注,导致全球范围内与 AI 相关的政策增加。
第七章:教育
AI 通过生成式 AI 对工作的影响进入了公众意识……
第八章:公众舆论
随着 AI 继续渗透到社会的广泛领域,了解公众对该技术的看法变得越来越重要。
衡量智能趋势
《AI Index》报告跟踪、整理、提炼和可视化与人工智能 (AI) 相关的数据。我们的使命是提供公正、经过严格审查、来源广泛的数据,以便政策制定者、研究人员、高管、记者和公众能够对复杂的 AI 领域有更全面和细致的了解。
政策要点
政策制定者使用《AI Index》来了解并决策有关 AI 的事宜。我们整理了《2025 AI Index 报告》中的一些要点摘要,这些要点与政策制定者和其他政策受众尤其相关。
往期报告
2024 AI Index 报告
欢迎阅读第七版《AI Index》报告。2024 年版是迄今为止我们最全面的版本,它是在 AI 对社会的影响从未如此显著的重要时刻发布的。
2023 AI Index 报告
《AI Index》是 Stanford Institute for Human-Centered Artificial Intelligence (HAI) 的一项独立倡议,由 AI Index Steering Committee 领导,该委员会是由来自学术界和行业的跨学科专家组成的小组。
2022 AI Index 报告
《AI Index》是 Stanford Institute for Human-Centered Artificial Intelligence (HAI) 的一项独立倡议,由 AI Index Steering Committee 领导,该委员会是由来自学术界和行业的跨学科专家组成的小组。
2021 AI Index 报告
今年,我们显着扩展了报告中可用的数据量,与更广泛的外部组织合作校准我们的数据,并加深了我们与 Stanford HAI 的联系。
2019 AI Index 报告
《AI Index》报告跟踪、整理、提炼和可视化与人工智能相关的数据。
其使命是为政策制定者、研究人员、记者、高管和公众提供公正、严谨和全面的数据,以加深对复杂 AI 领域的理解。
2018 AI Index 报告
人工智能已跃居全球讨论的前沿,受到了从业者、行业领导者、政策制定者和公众越来越多的关注。今年从新闻文章中收集到的各种观点和辩论表明,AI 正在被广泛地调查、研究和应用。然而,AI 领域仍在快速发展,即使是专家也很难理解和跟踪整个领域的进展。
2017 AI Index 报告
人工智能已跃居全球讨论的前沿,受到了从业者、行业领导者、政策制定者和公众越来越多的关注。今年从新闻文章中收集到的各种观点和辩论表明,AI 正在被广泛地调查、研究和应用。然而,AI 领域仍在快速发展,即使是专家也很难理解和跟踪整个领域的进展。