大学生如何使用 Claude:Anthropic 教育报告
Skip to main contentSkip to footer Claude API Solutions Research Commitments Learn NewsTry Claude AnnouncementsSocietal Impacts
Anthropic 教育报告:大学生如何使用 Claude
2025年4月8日 ● 阅读时长12分钟
人工智能系统不再仅仅是专业的研究工具,而是成为了日常的学术伙伴。随着 AI 更深入地融入教育环境,我们需要考虑关于学习、评估和技能发展的重要问题。到目前为止,大多数讨论都依赖于调查和受控实验,而不是直接证据表明学生如何在实际环境中自然地将 AI 融入到他们的学术工作中。
为了弥补这一差距,我们进行了一项大规模研究,旨在了解 AI 在高等教育中真实的使用模式。我们分析了在 Claude.ai 上一百万条匿名学生对话。
我们的教育报告的主要发现包括:
- 理工科(STEM)学生是像 Claude 这样的 AI 工具的早期使用者,其中计算机科学专业的学生尤其突出(占学生对话的 36.8%,而他们在全美学位中所占比例仅为 5.4%)。相比之下,商科、健康和人文专业的学生的使用率相对于他们的入学人数来说较低。
- 我们发现了学生与 AI 交互的四种模式,这些模式在我们的数据中以大致相等的比例存在(每种模式占对话的 23-29%):直接问题解决(Direct Problem Solving)、直接输出创建(Direct Output Creation)、协作问题解决(Collaborative Problem Solving)和协作输出创建(Collaborative Output Creation)。
- 学生主要使用 AI 系统进行创建(利用信息学习新知识)和分析(分解已知信息并识别关系),例如创建编码项目或分析法律概念。这与 Bloom's Taxonomy 上的高阶认知功能相符。这引发了关于如何确保学生不将关键认知任务卸载到 AI 系统的问题。
识别教育领域的 AI 使用情况
在研究人们如何使用 AI 模型时,保护用户隐私至关重要。对于这个项目,我们使用了 Claude Insights and Observations,或者 "Clio," 这是一个自动化分析工具,可以深入了解人们如何使用 Claude。Clio 通过将用户对话提炼成高级使用摘要(例如“排除代码故障”或“解释经济概念”),来实现自下而上的 AI 使用模式发现。Clio 使用多层自动化流程,从对话中删除私人用户信息。我们构建这个流程是为了最大限度地减少从一层传递到下一层的信息。我们在 之前的博客 中描述了 Clio 的隐私优先设计。
我们使用 Clio 分析了大约一百万条来自 Claude.ai Free 和 Pro 账户的匿名对话,这些账户与高等教育电子邮件地址相关联。然后,我们筛选了这些对话,以确定与学生和学术相关的对话,例如与课程作业或学术研究相关的对话,从而产生了 574,740 条对话。然后,Clio 对这些对话进行分组,以得出与教育相关的总体见解:不同学科的代表性如何;学生与 AI 的互动有何不同;以及学生将哪些类型的认知任务委派给 AI 系统。
学生们使用 AI 做什么?
我们发现,学生主要使用 Claude 来创建和改进跨学科的教育内容(占对话的 39.3%)。这通常包括设计练习题、编辑论文或总结学术材料。学生还经常使用 Claude 来为学术作业提供技术解释或解决方案(33.5%)——与 AI 合作来调试和修复编码作业中的错误、实现编程算法和数据结构,以及解释或解决数学问题。其中一些使用也可能涉及作弊,我们将在下面讨论。学生使用的一小部分但仍然相当大的比例是分析和可视化数据(11.0%),支持研究设计和工具开发(6.5%),创建技术图表(3.2%)以及在语言之间翻译或校对内容(2.4%)。
以下是各个学科常见请求的更详细分类。
基于 Clio 中每个科目中最常见的 15 个请求,得出前四个科目领域中的常见学生请求。
各学科的 AI 使用情况
接下来,我们研究了哪些学科表现出 不成比例的 Claude 使用情况。我们通过比较 Claude.ai 的使用模式与美国授予的学士学位数量来进行分析。计算机科学是 Claude 使用最不成比例的学科:尽管仅占美国学士学位的 5.4%,但计算机科学占 Claude.ai 对话的 38.6%(这可能反映了 Claude 在计算机编码方面的特殊优势)。与学生入学人数相比,自然科学和数学在 Claude.ai 中的代表性也更高(分别为 15.2% 和 9.2%)。
相反,与商业相关的教育对话仅占对话的 8.9%,而学士学位中的比例为 18.6%,显示 Claude 的使用率不成比例地低。健康专业(5.5% 对 13.1%)和人文科学(6.4% 对 12.5%)的代表性也低于这些学科的学生入学人数。
这些模式表明,理工科学生,尤其是计算机科学专业的学生,可能更早地将 Claude 用于教育目的,而商科、健康和人文科学专业的学生可能更慢地将这些工具整合到他们的学术工作流程中。这可能反映了计算机科学社区对 Claude 的更高认识,以及 AI 系统在理工科学生执行的任务方面的熟练程度高于其他学科的学生。
将与美国国家教育统计中心(NCES) 科目领域(灰色)相关的 Claude.ai 学生对话的百分比与具有相关专业的美国大学生(橙色)的百分比进行比较。请注意,由于某些对话被归类为 NCES 的“其他”类别,因此百分比总和不为 100%,我们已将它们从分析中排除。
学生如何与 AI 互动
与 AI 交互的方式有很多种,它们会以不同的方式影响学习过程。在我们对学生如何与 AI 交互的分析中,我们确定了四种不同的交互模式,我们根据两个不同的轴对其进行了分类,如下图所示。
第一个轴是“交互模式”。这可能包括:5 (1) 直接 对话,用户希望尽快解决他们的查询;(2) 协作 对话,用户积极寻求与模型进行对话以实现他们的目标。第二个轴是交互的“预期结果”。这可能包括:(1) 问题解决,用户寻求问题的解决方案或解释;(2) 输出创建,用户寻求生成更长的输出,如演示文稿或文章。将两个轴结合起来,我们得到了下面介绍的四种模式。
我们对学生-AI 对话的分类,以及基于 Clio 发现的对话主题的示例。
这四种交互方式以相似的比率呈现(每种方式占对话的 23% 到 29% 之间),显示了学生使用 AI 的范围。传统的网络搜索通常只支持直接答案,而 AI 系统能够实现更广泛的交互方式,并带来新的教育机会。一些选定的积极学习例子包括:
- 解释和阐明哲学概念和理论
- 创建全面的化学教育资源和学习材料
- 解释肌肉解剖学、生理学和学术作业的功能概念
与此同时,AI 系统也带来了新的挑战。一个常见的问题是:“学生在多大程度上使用 AI 作弊?” 这很难回答,特别是当我们不知道 Claude 的每个回复所使用的具体教育背景时。例如,直接问题解决对话可能是为了在家庭考试中作弊……或者为了学生检查他们在练习测试中的工作。直接输出创建对话可能是为了从头开始创建一篇文章……或者为了创建知识摘要以供额外研究。协作对话是否构成作弊也可能取决于具体的课程政策。
也就是说,近一半(约 47%)的学生-AI 对话是直接的——也就是说,寻求答案或内容,且参与度最低。虽然其中许多对话服务于合法的学习目的(例如,提出概念性问题或生成学习指南),但我们确实发现了一些令人担忧的直接对话示例,包括:
- 提供机器学习多项选择题的答案
- 提供英语语言测试题的直接答案
- 重写营销和商业文本以避免抄袭检测
这些问题引发了关于学术诚信、批判性思维技能发展以及如何最好地评估学生学习的重要问题。即使是协作对话也可能产生有问题的学习结果。例如,“解决概率和统计作业问题并提供解释”可能涉及 AI 和学生之间的多次对话,但仍然将重要的思考卸载给了 AI。我们将继续研究这些互动,并尝试更好地辨别哪些互动有助于学习并发展批判性思维。
特定学科的 AI 使用模式
不同学科的学生以不同的方式与 AI 互动:
- 自然科学与数学 对话倾向于问题解决,例如“使用逐步计算解决特定的概率问题”和“使用逐步解释解决学术作业或考试问题”。
- 计算机科学、工程学 和 自然科学与数学 倾向于协作对话,而 人文科学、商业和健康 在协作对话和直接对话之间的分配更加均衡。
- 教育 对输出创建表现出最强的偏好,覆盖了 74.4% 的对话。但是,这种用法可能源于我们过滤方法的不完善。许多这些对话都涉及“创建全面的教学材料和教育资源”以及“创建详细的课程计划”,这表明教师也在使用 Claude 进行教育支持。总的来说,教育占所有对话的 3.8%。
这表明,AI 整合的教育方法可能会受益于特定学科的方法。我们的数据是帮助识别不同学科的学生如何与 AI 互动的第一步。
每个 NCES 科目的对话在交互方式上的分布。
学生委派给 AI 的认知任务
我们还探讨了学生如何将认知责任委派给 AI 系统。我们使用了 Bloom's Taxonomy,这是一个教育中使用的分层框架,用于将认知过程从简单到复杂进行分类。虽然该框架最初是为学生思维设计的,但我们对其进行了改编,以分析 Claude 在与学生交谈时的反应。
我们看到了 AI 表现出的 Bloom's Taxonomy 领域的倒置模式:
- Claude 主要完成高阶认知功能,其中创建 (39.8%) 和分析 (30.2%) 是 Bloom's Taxonomy 中最常见的操作。
- 较低阶的认知任务较少:应用 (10.9%)、理解 (10.0%) 和记忆 (1.8%)。
这种分布也因交互方式而异。正如预期的那样,输出创建任务(例如生成学术文本摘要或对文章的反馈)涉及更多的创建功能。问题解决任务(例如解决微积分问题或解释编程基础知识)涉及更多的分析功能。
AI 系统表现出这些技能并不妨碍学生也参与这些技能本身——例如,共同创建一个项目或使用 AI 生成的代码在另一个环境中分析数据集——但这确实指出了学生将认知能力外包给 AI 的潜在担忧。人们有合理的担忧,即 AI 系统可能会为学生提供拐杖,从而阻碍支持高阶思维所需的基础技能的发展。毕竟,倒置的金字塔可能会倒塌。
基于 Bloom's Taxonomy,Claude 在与学生的对话中表现出的认知技能。佛罗里达大学教学技术与培训中心对技能的描述。
局限性
我们的研究基于真实世界的数据。这在我们的发现的有效性及其在教育环境中的应用方面具有许多优势。但是,它也存在可能影响我们发现范围的局限性:
- 我们的数据集可能只捕捉到了早期使用者,可能无法代表更广泛的学生群体;
- 目前尚不清楚 Claude 的使用在多大程度上代表了教育领域 AI 的总体使用情况——许多学生使用的 AI 工具不止 Claude.ai,这意味着我们只呈现了他们整体 AI 参与模式的部分视图;
- 对话的分类方式可能存在误报和漏报。我们依赖于与高等教育电子邮件地址关联的帐户中的对话:我们分类器认为与学生相关的对话实际上可能来自工作人员或教职员工。此外,其他学生对话可能在与非大学电子邮件地址关联的帐户中;
- 由于隐私方面的考虑,我们仅分析单个 18 天保留期内的 Claude.ai 使用情况。学生的用法可能会在一年中因其教育承诺的波动而异;
- 我们只研究学生将哪些任务委派给 AI,而不是他们最终如何在他们的学术工作中使用 AI 输出,或者这些对话是否有效地支持学习成果;
- 将学生-AI 对话分类为学科可能无法完全捕捉跨学科工作,在这些工作中 AI 使用模式可能存在显着差异;
- 将 Bloom's Taxonomy 应用于 AI 的认知过程(而不是学生)是不完美的。在 AI 系统的上下文中,像记忆这样的技能更难量化。
关于教育中 AI 使用的机构政策差异很大,并且可能会以我们无法在此数据集中衡量的方式显着影响我们观察到的模式。
结论与展望
我们的分析提供了学生在现实世界中使用 AI 的位置和方式的概览。我们认识到,我们才刚刚开始了解 AI 对教育的影响。
我们在与学生和教育工作者的讨论中看到,AI 可以以非凡的方式增强学习。例如,AI 已被用于支持 学生的核聚变反应堆项目,并促进 教室中学生和老师之间更好的沟通。
但我们并没有幻想这些初步发现完全解决了教育领域正在发生的深刻变化。AI 使教育工作者的生活在各个方面都变得更具挑战性,而这项研究并没有完全捕捉到这些挑战。随着学生将高阶认知任务委派给 AI 系统,出现了一些基本问题:我们如何确保学生仍然培养基础认知和元认知技能?我们如何在支持 AI 的世界中重新定义评估和作弊政策?如果 AI 系统几乎可以立即生成精美的文章,或者快速解决需要一个人花费数小时工作的复杂问题,那么有意义的学习会是什么样?随着模型能力的增长以及 AI 越来越融入我们的生活,从作业设计到评估方法的所有内容是否会发生根本性的变化?
这些发现有助于教育工作者、管理者和政策制定者之间正在进行的讨论,讨论我们如何确保 AI 加深而不是破坏学习。进一步的研究将帮助我们更好地了解学生和教师如何使用 AI,与学习成果的联系以及对未来教育的长期影响。
Anthropic 的教育方法
除了本教育报告外,我们还在 与大学合作 以更好地了解 AI 在教育中的作用。作为早期步骤,我们正在试验一种学习模式,该模式强调苏格拉底方法和概念理解而不是直接答案。我们期待与大学合作进行未来的研究,并更直接地研究 AI 对学习的影响。
Bibtex
如果您想引用这篇文章,可以使用以下 Bibtex 密钥:
@online{handa2025education,
author = {Kunal Handa and Drew Bent and Alex Tamkin and Miles McCain and Esin Durmus and Michael Stern and Mike Schiraldi and Saffron Huang and Stuart Ritchie and Steven Syverud and Kamya Jagadish and Margaret Vo and Matt Bell and Deep Ganguli},
title = {Anthropic Education Report: How University Students Use Claude},
date = {2025-04-08},
year = {2025},
url = {https://www.anthropic.com/news/anthropic-education-report-how-university-students-use-claude},
}
Copy
致谢
Kunal Handa* 和 Drew Bent* 设计并执行了实验,制作了图表并撰写了博客文章。Alex Tamkin 提出了初步实验并提供了详细的指导和反馈。Miles McCain 迭代了所有实验所需的技术基础设施。Esin Durmus、Michael Stern、Mike Schiraldi、Saffron Huang、Stuart Ritchie、Steven Syverud 和 Kamya Jagadish 提供了宝贵的反馈和讨论。Margaret Vo、Matt Bell 和 Deep Ganguli 提供了详细的指导、组织支持和贯穿始终的反馈。
此外,我们感谢 Rose E. Wang、Laurence Holt、Michael Trucano、Ben Kornell、Patrick Methvin、Alexis Ross 和 Joseph Feller 提供的有益讨论和评论。
脚注
1 这些对话跨越了 Claude.ai 上的 18 天期间,以继续根据我们的 隐私和保留政策 管理数据。有关 Clio 如何保护隐私的更多信息,请参阅我们的 研究博客。 2 特别是,我们将分析限制为具有与全球高等教育机构相关的电子邮件地址的帐户,例如具有 .edu 和 .ac.uk 域的电子邮件。我们认识到并非所有教育电子邮件地址都可能是学生的电子邮件地址。因此,我们随后会过滤相关的对话,以查找可能解决学生作业的对话。 3 Clio 使用 Claude 以自动方式过滤对话。对于这项研究,Clio 将对话过滤到那些“可能是一名学生正在寻求学术、学校作业、学习、学习新概念、学术研究等方面的帮助?”。我们 之前关于 Clio 的论文 详细说明并验证了这种过滤机制。 4 通过 国家教育统计中心 (NCES)。 5 在我们的实验中,我们使用了术语“事务性”和“对话性”来对对话进行分类,因为我们发现这些术语最能准确地捕捉 Clio 浮出水面的自下而上的交互模式。具体来说,我们使用 Clio 将对话分类为以下之一:事务性问题解决、事务性输出创建、对话性问题解决或对话性输出创建;Clio 获得了每个交互模式的相关描述。为了便于理解,我们在此报告中使用术语“直接”和“协作”代替“事务性”和“对话性”。 6 特别是,我们使用 Anderson 和 Krathwohl (2001) 对 Bloom's Taxonomy 的修订 及其认知过程分类。
产品
- Claude overview
- Claude team plan
- Claude enterprise plan
- Claude education Plan
- Download Claude apps
- Claude.ai pricing plans
- Claude.ai login
API Platform
- API overview
- Developer docs
- Claude in Amazon Bedrock
- Claude on Google Cloud's Vertex AI
- Pricing
- Console login
Research
Claude models
Commitments
Solutions
Learning resources
Company
Help and security
Terms and policies
Privacy choices