关于 OH 活动 课程大纲 讲座 助教辅导 & 训练营 作业 文档 & 工具 往期课程 S25 F24 S24 菜单 关于 OH 活动 课程大纲 讲座 助教辅导 & 训练营 作业 文档 & 工具 往期课程 F24 S24 F23

11-785 深度学习导论 2025 春季 课堂直播链接 线下上课地点:Giant Eagle Auditorium, Baker Hall (A51)

当前截止日期和公告

| 作业 | 截止日期 | 描述 | 链接 | | ------- | --------------------------------------------------------------------- | -------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------- | | HW3P1 | 提前提交:3月14日,美国东部时间晚上 11:59 最终提交:3月28日,美国东部时间晚上 11:59 | RNNs、GRUs 和搜索 | Piazza | | HW3P2 | 提前提交:3月14日,美国东部时间晚上 11:59 最终提交:3月28日,美国东部时间晚上 11:59 | 语音到音素的映射 | Piazza | | HW2P1 Bonus | 最终提交:4月25日,星期五,美国东部时间晚上 11:59 | Dropout2d、BatchNorm2d 和 ResNet | Autolab | | HW2P1 Autograd | 最终提交:4月25日,星期五,美国东部时间晚上 11:59 | 应用 Autograd 到卷积网络 | Autolab | | HW1P1 Bonus | 最终提交:4月25日,星期五,美国东部时间晚上 11:59 | Adam、AdamW 优化器和 Dropout | Autolab Piazza | | HW1P1 Autograd | 最终提交:4月25日,星期五,美国东部时间晚上 11:59 | 自动微分引擎 | Autolab Piazza |

最重要的 Piazza 帖子

项目画廊

课程简介

“深度学习”系统,以深度神经网络为代表,正日益接管所有 AI 任务,从语言理解、语音和图像识别,到机器翻译、规划,甚至游戏和自动驾驶。 因此,深度学习方面的专业知识正迅速从一种深奥的理想技能转变为许多高级学术环境中的强制性先决条件,以及工业就业市场中的巨大优势。

在本课程中,我们将学习深度神经网络的基础知识,以及它们在各种 AI 任务中的应用。 到课程结束时,预计学生将对该主题有相当的熟悉程度,并且能够将深度学习应用于各种任务。 他们还将能够理解当前关于该主题的大部分文献,并通过进一步学习来扩展他们的知识。

如果您只对讲座感兴趣,可以在 YouTube 频道 上观看。

从学生角度看课程描述

就概念而言,本课程非常全面。 它帮助我们理解深度学习的基础知识。 本课程从 MLPs 逐渐开始,并逐步发展到更复杂的概念,例如 attention 和 sequence-to-sequence 模型。 我们通过实践来学习 PyTorch,这对于实现深度学习模型非常重要。 作为一名学生,您将学习构建深度学习模型所需的工具。 家庭作业通常有两个组成部分:Autolab 和 Kaggle。 Kaggle 组件允许我们探索多种架构,并了解如何微调和不断改进模型。 所有家庭作业的任务都相似,并且有趣的是学习如何使用多种深度学习方法解决相同的任务。 总而言之,在本课程结束时,您将有足够的信心来构建和调整深度学习模型。

先修要求

  1. 本课程将使用 Numpy 和 PyTorch,因此您需要能够使用 python3 进行编程。
  2. 您需要熟悉基本微积分(微分、链式法则)、线性代数和基本概率。

学分

课程 11-785 和 11-685 是等效的 12 个学分的研究生课程,分别有期末项目和 HW5。 课程 11-485 是本科版本,价值 9 个学分,唯一的区别是没有期末项目或 HW5。

你的支持者

讲师:

助教:

致谢

名人墙

往期助教致谢

匹兹堡时间安排(美国东部时间)

讲座: 星期一和星期三,上午 8:00 - 上午 9:20 - 快乐时光 :) 助教辅导: 星期五,上午 8:00 - 上午 9:20 答疑时间: 请参考下面的 OH 日历 / Piazza 以获取最新信息。 家庭作业黑客马拉松: 在“家庭作业黑客马拉松”期间,课程工作人员将协助学生完成家庭作业。 建议以学习小组的形式参加。 每周六

活动日历: 下面的 Google 日历包含所有课程活动和截止日期,方便学生使用。 请随时通过单击下面日历右下角的加号 (+) 按钮将此日历添加到您的 Google 日历。 对时间表的任何临时更改都将首先反映在此日历中。 OH 日历: 下面的 Google 日历包含答疑时间的时间表。 请随时通过单击下面日历右下角的加号 (+) 按钮将此日历添加到您的 Google 日历。 对时间表的任何临时更改都将首先反映在此日历中。

课程大纲

政策


细分

分数分配 | 评分将基于每周小测验(24%)、作业(50%)和课程项目(25%)。 请注意,您成绩的 1% 分配给考勤。

小测验

小测验 | 将会有每周小测验。

作业

作业 | 总共有五个作业,以及学期最后一周的同行评审作业。 作业将包括 Autolab 组件,您可以在其中实现低级操作,以及 Kaggle 组件,您可以在其中与您的同事竞争相关的 DL 任务。

项目

项目 |

考勤

考勤 |

最终成绩 | 期末成绩是曲线。 您的总成绩将取决于您相对于同学的表现。

通过/不通过

通过/不通过 | 注册通过/不通过的学生必须完成所有测验、HW,如果他们参加的是研究生课程,则必须完成项目。 需要相当于 B- 的成绩才能通过本课程。

旁听

旁听 | 旁听生无需完成课程项目,但必须完成所有测验和作业。 我们鼓励无论如何都要做一个课程项目。

结束政策

学习小组

我们认为有效的协作可以大大提高学生的学习效果。 因此,本课程采用学习小组进行测验和作业磨练。 强烈建议您加入学习小组; 查看 piazza 以获取更多更新。

Piazza:讨论区

Piazza 是我们用于讨论的工具。 如果您在学期开始时注册,您应该会自动注册。 如果没有,请在此处注册 here。 此外,在使用 piazza 论坛时,请遵守 Piazza 礼仪。

AutoLab:软件工程

AutoLab 是我们用来测试您对低级概念的理解的工具,例如设计您自己的库、实现重要算法以及从头开始开发优化方法。

Kaggle:数据科学

Kaggle 是我们测试您对讲座中讨论的神经网络架构的理解和扩展能力的地方。 与 AutoLab 显示分数类似,Kaggle 也显示分数,所以不要感到害怕 - 我们随时为您提供帮助。 我们致力于热门 AI 主题,如语音识别、面部识别和神经机器翻译。

MediaServices/YouTube:讲座和助教辅导录音

未参加现场讲座的 CMU 学生应在 MediaServices 上观看上传的讲座,以获得考勤学分。 指向各个视频的链接将在上传后发布。

我们的 YouTube 频道 是非 CMU 人员可以观看所有讲座和助教辅导录音的地方。 标有“Old”的视频不是最新的,因此请注意视频标题。

书籍和其他资源

本课程不会遵循特定的书籍,而是会从多个来源中汲取知识。 我们在本页末尾列出了相关书籍。 我们还将发布每个课程的相关阅读材料的链接。 学生应在课前熟悉这些材料。 阅读材料有时会很神秘且难以理解; 如果是这样,请不要担心,我们将在课堂上提供更简单的解释。

您还可以在 here 找到文献中最新的模型目录。 我们希望到课程结束时,您能够解释(如果不能完全理解)wiki 和目录中的许多架构。

学术诚信

您应该遵守 大学关于学术诚信和剽窃的政策

您的课程讲师保留根据发生的违反学术不诚实行为来确定适当处罚的权利。 违反大学政策可能会导致严重的处罚,包括该课程不及格以及可能被卡内基梅隆大学开除。 如果您对此政策以及您在本课程中所做的任何工作有任何疑问,请随时联系您的讲师以寻求帮助。

课堂笔记

一本包含课堂笔记的书籍正在与本课程同步开发; check it out

讲座时间表

您可以在 MediaServices 上观看录制的讲座。

| 讲座 | 日期 | 主题 | 幻灯片、视频 | 附加材料 | 测验 | | ---- | --------------- | ------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ----- | | 0 | 1月3日,星期五 | * 课程安排 * 学习目标 * 评分 * 截止日期

| Youtube | 无测验 | | 1 | 1月13日,星期一 | * 介绍

| 幻灯片 (PDF) MediaServices Youtube | 新连接主义 (1988) 关于艾伦·图灵对连接主义的预测 [ McCullogh 和 Pitts 论文](https://deeplearning.cs.cmu.edu/S25/< https:/www.cs.cmu.edu/~./epxing/Class/10715/reading/McCulloch.and.Pitts.pdf>) Rosenblatt: 感知器 Bain: 身与心 Hebb: 行为的组织 | 测验 1 | | 2 | 1月15日,星期三 | * 神经网络作为通用逼近器

| 幻灯片 (PDF) MediaServices Youtube | Shannon (1949) 布尔电路 关于偏差-方差权衡 | | | 3 | 1月17日,星期五 | * 训练第一部分 * 学习问题 * 经验风险最小化

| 幻灯片 (PDF) MediaServices Youtube | Widrow 和 Lehr (1992) Adaline 和 Madaline | 测验 2 | | - | 1月20日,星期一 | * 不上课(MLK 日)

| | | | 4 | 1月22日,星期三 | * 训练第二部分 * 梯度下降 * 训练网络 * 反向传播

| 幻灯片 (PDF) MediaServices Youtube | Widrow 和 Lehr (1992) Adaline 和 Madaline 感知器算法的收敛性 阈值逻辑 TC(复杂性) AC(复杂性) | | | 5 | 1月27日,星期一 | * 训练第三部分 * 反向传播 * 反向传播的微积分

| 幻灯片 (PDF) MediaServices Youtube | Werbos (1990) Rumelhart、Hinton 和 Williams (1986) | 测验 3 | | 6 | 1月29日,星期三 | * 训练第四部分 * 收敛问题 * 损失面 * 动量

| 幻灯片 (PDF) MediaServices Youtube | 反向传播无法分离,而感知器却能成功分离,Brady 等人 (1989) 为什么动量真正起作用 | | | 7 | 2月3日,星期一 | * 训练第五部分 * 优化 * 批量大小、SGD、小批量、二阶方法

| 幻灯片 (PDF) MediaServices Youtube | 动量,Polyak (1964) Nestorov (1983) 导数和影响 | 测验 4 | | 8 | 2月5日,星期三 | * 训练第六部分 * 优化器和正则化器 * 选择散度(损失)函数 * 批量归一化 * Dropout

| 幻灯片 (PDF) MediaServices Youtube | [导数和影响图](https://deeplearning.cs.cmu.edu/S25/<./document/readings/derivatives and influences.pdf>) ADAGRAD, Duchi, Hazan 和 Singer (2011) Adam:一种随机优化方法,Kingma 和 Ba (2014) | | | 9 | 2月10日,星期一 | * 平移不变性 * 卷积神经网络 (CNNs)