1.2 人工智能与深度学习

目前我们正处于以深度学习为核心的第四次人工智能技术发展热潮期,相比于传统算法,深度学习算法能够在语音识别、机器视觉与逻辑推理等众多领域赋予机器深度智能,使得机器比人“听”得更准,“看”得更细。那么,深度学习是人工智能的全部吗?是何种原因催生了深度神经网络?其终极目标又是什么?

1.2.1 人工智能与深度学习之间的关系

人工智能的终极目标是使得机器能够表现出和人一样的动作与行为,具备感知和认知能力,因此能够实现这个目标的所有理论、技术及算法都可以称为人工智能技术。在实现人工智能目标的过程中,两大学术流派针对同样的人工智能场景与任务所采用的研究方法和手段截然不同:符号派以因果关系为出发点,探寻事物的内在规律,并将之表达成逻辑算法,完成人工智能场景任务;统计派以映射关系为出发点,通过对能反映事物的内在规律的大量样本数据的抽象学习,以概率统计手段完成人工智能场景任务,而深度学习则是统计派中最具代表性的人工智能技术。

人工智能与深度学习之间的详细从属关系如图1.1所示,显然深度学习仅仅是人工智能技术中的一小部分,但目前看来是很重要的一部分。此外,还有机器学习与神经网络两个概念。机器学习是统计学派实现人工智能应用的最重要的技术之一,按照事先约定好的学习规则,自主对大量的样本数据进行有效学习,得出反映事物内在规律的网络结构表达,完成人工智能场景任务。典型的机器学习方法包括决策树、聚类算法、贝叶斯分类及支持向量机等。机器学习算法依托于计算机快速自主学习,能够有效构建反映事物内在规律的网络结构来完成分类及拟合等任务,然而机器学习更适用于线性任务,对于非线性分类及拟合任务效果不够理想。神经网络是通过模拟人类大脑的神经元网络来处理信息的一种网络结构,其网络参数也是通过对样本数据的充分学习而构建的,故其属于机器学习方法的一种。但是归功于神经网络结构的复杂性与灵活性,它能够很好地完成非线性分类及拟合等人工智能任务,后续章节会详细分析神经网络的相关内容,这里不再赘述。那么,深度学习和它们之间又是什么关系呢?其实很简单,随着应用场景越来越复杂,需要处理的任务越来越难,简单的神经网络已不足以应付这些场景任务,只有不断地增加网络层,改进网络结构才能更加有效地提升网络的分类或者拟合能力,完成复杂任务。这种非常大、非常深的神经网络就称为深度神经网络,因此深度学习可以认为是神经网络的一部分。

图1.1 人工智能与深度学习从属关系图

可以看出,深度学习技术是人工智能技术的一个重要组成部分,仅仅是因为它在语音识别、图像处理及逻辑推理等领域取得了很好的分类及拟合效果,所以才成为当今的研究热点,这并不意味着深度学习就是人工智能技术的全部,或者说可以解决人工智能应用场景中的所有问题,大家要正确对待。

1.2.2 图灵机与丘奇-图灵论题

图灵机是图灵在20世纪30年代提出的一种抽象的计算模型,是对人类的运算思维过程进行模拟的一个抽象的机器,其目标就是实现具备人类思维模式的自动计算机。简单而言,图灵机有一条无限长的纸带,纸带分成了一个一个的小方格,每个方格有不同的颜色,有一个机器头在纸带上移来移去。这个机器头有一组内部状态,还有一些固定的程序。在每个时刻,机器头都要从当前纸带上读入一个方格信息,然后结合自己的内部状态查找程序表,根据程序将信息输出到纸带方格上,并转换自己的内部状态,然后进行移动。图灵机的提出不仅奠定了图灵在人工智能领域的地位,而且对后来的冯·诺依曼计算机结构具有深远影响。如果图灵没有英年早逝,那么现代计算机体系结构也许就不是所谓的计算+存储模式了,而是直接以模拟人类思维的图灵机模型为基础的具有智能的机器。这也是图灵被尊称为“人工智能之父”,计算机领域的最高奖项设置为图灵奖的原因。

图灵机理论提出之初并没有完全被业界认可,但是图灵的导师丘奇(当时是全球范围内知名的逻辑学家)却发现了图灵机的重要性与深远意义。为了助推图灵机理论的发展,师生二人共同提出了著名的丘奇-图灵论题,即一切可计算的函数都等价于图灵机,或者也可以理解为一切可计算的函数都能够用图灵机进行计算。那么问题来了:什么是可计算的函数?或者,先应该搞清楚什么是函数。我们从初中就开始学习函数,一直学到大学,已经学习了各种类型的函数。归根结底,一个简单的函数可以表示为y=fx),或者,这个函数关系可以理解为自变量x通过函数f映射为因变量y。函数关系本质上是一种映射关系(什么是关系?有兴趣的读者可以查阅离散数学知识),这种映射关系如果可以用计算机算法语言精确描述,说白了就是能够采用加、减、乘、除运算精确表达内在联系,那么这种函数就称为可计算的函数。可计算的函数本质上反映的是描述事物内在规律的因果关系,科学家研究科学就是通过理论推导或者实验分析提取表征自然现象的内在规律的因果关系,也可以说可计算的函数就是指那些可以描述清楚前因后果的映射关系。这种可计算的函数等价于图灵机,也就是说一切表征自然界规律的因果关系都可以用图灵机实现。

很多场景现象确实存在映射(函数)关系,然而其映射关系很难解释,比如说双胞胎自然感应、神奇的大脑意识活动等,这些现象的因果关系还有待于挖掘,我们称之为不可计算的函数。那么,这些函数就无法采用图灵机去计算了吗?我们说任何一种理论都应该在特定时代背景下分析,当然也可以理解为这些函数的内在因果关系一定会随着科学家的不断探索与研究而最终被发现,那么又可以用图灵机实现了。然而人类的欲望是无止境的,在没有研究清楚这些规律的内在因果关系之前,我们还希望使用这些规律解决实际问题,怎么办?于是就出现了神经网络以及越来越重要的深度学习算法。这些方法通过对大量的样本数据自主学习,得出反映事物内在规律的网络结构,进而完成各种场景下的任务。深度神经网络就是一种函数映射关系,但是其内在因果关系很难解释(神经网络的可解释理论研究是一个很有前景的方向),可这并不影响其大规模使用。