前言

如今，数学的地位举足轻重，而深度学习也在日渐扮演重要角色。从无人驾驶汽车敢于给出的安全允诺，到比顶尖骨科医生还厉害的骨科诊断医疗系统，再到越发强大甚至引起担忧的语音助手，深度学习已经无处不在。

本书涵盖要理解深度学习所必须掌握的数学知识。当然，你确实可以利用现成的组件，在完成好相应设置并准备好Python代码以后，就对数据进行处理并完成模型训练任务，而无须理解自己在做什么，更不用理解背后的数学理论。而且，由于深度学习的强大，你往往能成功地训练一个模型。但是，你并不理解自己为什么能成功，也不该就此而满足。想搞明白原因，就需要学习数学。虽然用不着大量的数学知识，但一定的数学功底还是必需的。具体来说，你需要理解与概率论、统计学、线性代数和微分相关的一些理论知识，而这些知识刚好就是本书所要讨论的内容。

本书面向谁

本书不是一本深度学习的入门教材，它不会教你深度学习的基础知识，而是此类书籍的有效补充［你可以参考我的另一本书：Practical Deep Learning: A Python-Based Introduction（No Starch Press, 2021）］。虽然本书假设你对深度学习的核心概念已经比较熟悉，但我还是会在讲解的过程中做必要的解释说明。

此外，本书假设你具备一定的数学基础，包括高中数学知识，尤其是代数知识。本书还假设你对Python、R或其他类似编程语言较为熟悉。本书使用Python 3进行讲解，书中会用到它的一些主流组件，如NumPy、SciPy以及scikit-learn。

对于其他方面，本书就不作要求了，毕竟本书的目的就是给你提供成功使用深度学习所必备的知识。

关于本书

这虽然是一本关于数学的书，但其中不会有大量公式证明和练习题，我们主要通过代码来阐述各种概念。深度学习是一门应用学科，所以你需要在实践中理解其内涵。我们将用代码填补数学理论和应用实践之间的空白。

本书内容安排有序，首先介绍基础理论，然后引出更高级的数学内容，最后用实际的深度学习算法让你将之前掌握的内容融会贯通。建议你按照书中的内容顺序阅读，如果遇到已经非常熟悉的内容，你可以直接跳过。

第1章：搭建舞台

该章对工作环境以及深度学习中的常用组件进行配置。

第2章：概率论

概率论影响深度学习的方方面面，它是理解神经网络训练过程的关键。作为本书概率论的前半部分，该章介绍该领域的基础知识点。

第3章：概率论进阶

单靠一章难以覆盖重要的概率论的全部内容，该章继续探索概率论中与深度学习相关的知识点，包括概率分布和贝叶斯定理。

第4章：统计学

统计学对理解数据和评估模型非常重要，而且概率论也离不开统计学，要理解深度学习，就不得不理解统计学。

第5章：线性代数

线性代数是一门关于向量和矩阵的学科，而深度学习就以线性代数为核心。实现神经网络本身就是在运用向量和矩阵进行运算，所以理解相关概念和运算方法非常关键。

第6章：线性代数进阶

该章继续讨论线性代数知识，内容聚焦于矩阵的相关核心内容。

第7章：微分

或许训练神经网络的最核心理论基础就是梯度。要想理解和使用梯度，就必须掌握如何对函数求导。该章介绍求导和梯度的理论基础。

第8章：矩阵微分

在深度学习中，求导往往是针对向量和矩阵进行的。该章把导数的概念扩展到这些对象上。

第9章：神经网络中的数据流

要想理解神经网络如何对向量和矩阵进行运算，就必须理解数据在神经网络中是如何流转的。该章讨论这些内容。

第10章：反向传播

成功训练神经网络离不开两个关键算法：反向传播和梯度下降。该章通过介绍反向传播，帮助你对前面所学知识加以应用。

第11章：梯度下降

梯度下降使用反向传播过程中计算得出的梯度来训练神经网络。该章从简单的一维函数开始探讨梯度下降，一步步讲到全连接网络的情况。除此之外，该章还会介绍并对比梯度下降的各种变体。

附录：学无止境

本书虽然略过了概率论、统计学、线性代数和微分中的很多知识点，但附录部分会给你提供进一步学习相关领域的资源。

本书的配套代码可以从GitHub网站的rkneusel9/MathForDeepLearning库中下载。现在就让我们开始学习吧！