推荐序

在过去的十几年里,人工智能技术突飞猛进,在多个领域产生了深远的影响:语音识别技术已经达到大多数人觉得语音输入准确度足够高的地步;语音合成技术已经可以合成真假难辨的自然语音,并在人机对话、有声书制作、新闻播报等场景中获得广泛应用;图像识别技术在图像分类和图像识别任务上的性能超越了普通人;图像和视频合成技术则已经可以合成风格各异的虚拟数字人,成为元宇宙的重要组成部分。尤其让人印象深刻的是,人工智能软件AlphaGo在2016年战胜了围棋冠军,AlphaFold2在2022年解析了大量蛋白质的结构。这些任务之前一直被认为极其复杂,需要极高的智能和很多年的努力才能完成。而所有这些进展在很大程度上要归功于人工智能的一个重要分支——深度学习的发展。

今天,计算机和人工智能方向的从业者可能大多听说过深度学习,很多从业者或多或少使用过深度学习的技术或模型。不过,由于开源逐渐成为一种风气,越来越多的技术使用者广泛依赖于开源框架(比如TensorFlow和PyTorch)及各种开源算法。这一方面大大减少了“重复发明轮子”的情况,加速了技术的演进和应用推广,另一方面也使得大家更容易忽视底层技术。

本书就是为希望更了解深度学习底层数学基础的朋友们准备的。与其他数学书不同,本书围绕深度学习展开,阐述了深度学习背后的核心数学概念,包括统计学、线性代数、微分等,并且包含了很多人容易忽略的矩阵微分。另外,本书的示例是以Python代码而不是严格理论证明的形式展开的,这使得它们特别适合深度学习的从业者(特别是初学者)使用,尤其是那些希望通过学习底层数学知识来更好地了解深度学习原理,从而改进训练算法和模型的朋友。

本书的作者是机器学习方向的博士,有20年左右的工业界从业经验,曾经出版了多部与计算机和机器学习相关的图书。他的书大多从实用的角度出发,简单易懂。本书的译者也有丰富的人工智能从业经验,并曾翻译《贝叶斯方法:概率编程与贝叶斯推断》。他的译文忠实原文而又符合中文习惯,读起来非常顺畅。我相信本书一定可以帮到很多希望在深度学习领域深入学习而不是仅仅使用开源模型的朋友。

俞栋

2022年8月13日于西雅图