2025年 AI Index 报告：关键发现

2025 AI Index Report

Source | HN Comments

《2025 AI Index 报告》指出，AI 性能持续提升，在基准测试中表现优异，并日益融入日常生活。商业领域对 AI 投入巨大，投资和应用均创纪录，生产力影响显著。美国在 AI 模型开发上仍领先，但中国正在缩小差距。负责任的 AI 生态系统正在发展，但仍存在不平衡。全球对 AI 乐观情绪上升，但地区差异明显。AI 变得更高效、经济且易于获取。各国政府加强 AI 监管和投资。AI 和计算机科学教育扩展，但存在差距。行业在 AI 领域占据主导，但前沿竞争激烈。AI 在科学领域获得认可，但复杂推理仍具挑战。

2025 AI Index Report

阅读 2025 AI Index 报告申请简报

AI 对社会的影响从未如此显著。

在 Stanford HAI，我们相信 AI 将成为 21 世纪最具变革性的技术。但除非我们认真引导其发展，否则其益处不会均匀分布。《AI Index》提供了关于人工智能最全面、数据驱动的视角之一。作为全球媒体、政府和领先公司公认的可靠资源，《AI Index》为政策制定者、商业领袖和公众提供了严谨、客观的洞察，包括 AI 的技术进步、经济影响和社会影响。

主要发现

1. AI 在高要求基准测试中的性能持续提高。

2023 年，研究人员引入了新的基准测试——MMMU、GPQA 和 SWE-bench——以测试高级 AI 系统的极限。仅仅一年后，性能显著提高：在 MMMU、GPQA 和 SWE-bench 上的得分分别上升了 18.8、48.9 和 67.3 个百分点。除了基准测试外，AI 系统在生成高质量视频方面也取得了重大进展，并且在某些情况下，语言模型代理在有限的时间预算内甚至在编程任务中也优于人类。

2. AI 越来越嵌入到日常生活中。

从医疗保健到交通运输，AI 正在迅速从实验室走向日常生活。2023 年，FDA 批准了 223 款支持 AI 的医疗设备，而 2015 年仅为 6 款。在道路上，自动驾驶汽车不再是实验性的：Waymo 是美国最大的运营商之一，每周提供超过 150,000 次自动驾驶服务，而 Baidu 经济实惠的 Apollo Go 自动驾驶出租车车队现在为中国众多城市提供服务。

3. 商业领域全面拥抱 AI，推动了创纪录的投资和使用，研究继续显示出强大的生产力影响。

2024 年，美国私人 AI 投资增长至 1091 亿美元——几乎是中国 93 亿美元的 12 倍，是英国 45 亿美元的 24 倍。生成式 AI 尤其表现出强劲的势头，在全球范围内吸引了 339 亿美元的私人投资——比 2023 年增长了 18.7%。AI 的商业用途也在加速：78% 的组织报告称在 2024 年使用了 AI，高于前一年的 55%。与此同时，越来越多的研究证实，AI 可以提高生产力，并且在大多数情况下，有助于缩小整个劳动力的技能差距。

4. 美国仍然在生产顶级 AI 模型方面处于领先地位——但中国正在缩小性能差距。

2024 年，总部位于美国的机构生产了 40 个值得关注的 AI 模型，大大超过了中国的 15 个和欧洲的 3 个。虽然美国在数量上保持领先地位，但中国模型的质量差距迅速缩小：在 MMLU 和 HumanEval 等主要基准测试上的性能差异从 2023 年的两位数缩小到 2024 年的接近持平。与此同时，中国继续在 AI 出版物和专利方面处于领先地位。与此同时，模型开发越来越全球化，中东、拉丁美洲和东南亚等地区也推出了值得关注的产品。

5. 负责任的 AI 生态系统不断发展——但不平衡。

与 AI 相关的事件正在急剧增加，但主要工业模型开发商中，标准化的 RAI 评估仍然很少见。然而，HELM Safety、AIR-Bench 和 FACTS 等新基准测试为评估事实性和安全性提供了有希望的工具。在公司中，认识到 RAI 风险与采取有意义的行动之间仍然存在差距。相比之下，各国政府表现出越来越强的紧迫性：2024 年，全球在 AI 治理方面的合作得到加强，包括 OECD、EU、U.N. 和 African Union 在内的组织发布了侧重于透明度、可信赖性和其他核心负责任 AI 原则的框架。

6. 全球 AI 乐观情绪正在上升——但地区差异仍然很大。

在中国 (83%)、印度尼西亚 (80%) 和泰国 (77%) 等国家/地区，绝大多数人认为 AI 产品和服务比有害更有益。相比之下，在加拿大 (40%)、美国 (39%) 和荷兰 (36%) 等地的乐观情绪仍然远低于平均水平。尽管如此，情绪正在发生变化：自 2022 年以来，在几个先前持怀疑态度的国家/地区，乐观情绪已显着增长——包括德国 (+10%)、法国 (+10%)、加拿大 (+8%)、英国 (+8%) 和美国 (+4%)。

7. AI 变得更加高效、经济实惠且易于访问。

在越来越强大的小型模型的推动下，执行达到 GPT-3.5 水平的系统的推理成本在 2022 年 11 月至 2024 年 10 月期间下降了 280 多倍。在硬件层面，成本每年下降 30%，而能源效率每年提高 40%。开放权重模型也在缩小与封闭模型之间的差距，在一年内将某些基准测试上的性能差异从 8% 降低到仅 1.7%。总之，这些趋势正在迅速降低先进 AI 的门槛。

8. 各国政府正在加强对 AI 的监管和投资。

2024 年，美国联邦机构出台了 59 项与 AI 相关的法规——是 2023 年的两倍多——并且由两倍多的机构发布。在全球范围内，自 2023 年以来，75 个国家的立法中对 AI 的提及增加了 21.3%，自 2016 年以来增加了九倍。在日益受到关注的同时，各国政府正在大规模投资：加拿大承诺提供 24 亿美元，中国启动了一项 475 亿美元的半导体基金，法国承诺投入 1090 亿欧元，印度承诺提供 12.5 亿美元，沙特阿拉伯的 Project Transcendence 是一项 1000 亿美元的计划。

9. AI 和计算机科学教育正在扩展——但访问和准备方面的差距仍然存在。

三分之二的国家/地区现在提供或计划提供 K-12 CS 教育——是 2019 年的两倍——非洲和拉丁美洲取得了最大进展。在美国，过去 10 年中，获得计算机科学学士学位的毕业生人数增加了 22%。然而，由于电力等基本基础设施的差距，许多非洲国家/地区的访问仍然有限。在美国，81% 的 K-12 CS 教师表示 AI 应该成为基础 CS 教育的一部分，但只有不到一半的人觉得自己有能力教授它。

10. 行业在 AI 领域遥遥领先——但前沿正在收紧。

2024 年，近 90% 的值得关注的 AI 模型来自行业，高于 2023 年的 60%，而学术界仍然是高引用研究的首要来源。模型规模继续快速增长——训练计算每五个月翻一番，数据集每八个月翻一番，功耗每年翻一番。然而，性能差距正在缩小：排名第一和第十的模型之间的得分差异在一年内从 11.9% 降至 5.4%，而前两名现在的差距仅为 0.7%。前沿竞争越来越激烈——也越来越拥挤。