1.3.3 第二次兴起:1980—1987

尽管人工智能的研究进入了低谷期,但仍有一些人工智能学者脚踏实地地进行着研究,提出了决策树、支持向量机、贝叶斯分类器等机器学习算法,这些算法可以用于解决一些识别类的问题,又让人们看到了人工智能的希望。这段时期,人工智能的发展突出了注重实用性、专注于小领域的特点,其中有以下代表性事件和研究成果。

1. 人工智能受到各国政府的大力支持

1981年,日本经济产业省拨款8亿5000万美元支持第五代计算机项目,其目标是造出能够与人对话、翻译语言、解释图像,并且像人一样推理的机器。英国开始了耗资3亿5000万英镑的阿尔维(Alvey)计划。美国企业协会组织了微电子与计算机技术集团,向人工智能和信息技术的大规模项目提供资助。美国国防高级研究计划局DARPA组织了战略计算促进会,1988年,其在人工智能领域的投资是1984年的3倍。

2. 专家系统的发明

专家系统是人工智能领域的一个重要发明。根据论文《专家系统发展综述》(Survey on Development of Expert System)中的定义,专家系统的作用是,使用人类专家推理方式的计算机模型处理现实世界中需要专家作出解释的复杂问题,得出与专家相同的结论。专家系统可被视作“知识库”和“推理机”的结合,其结构如图1-7所示。

图1-7 专家系统结构示意图

知识库系统的主要用途是收集人类的知识,并将知识系统地进行表达或模块化,使计算机可以利用知识库进行推理、解决问题。知识库主要包含两个部分:一是知识本身;二是人类专家特有的用于作出判断的经验法则和直觉。知识库与传统数据库的不同之处在于,知识库所包含的是可以用于决策的知识,而传统数据库包含的则是未经处理过的数据,不能直接用于决策,还需要经过检索、处理等操作。

推理机的作用则是根据使用者提出的问题来推理得出正确的答案。推理机解决问题的算法可以分为3个层次,推理机会根据问题的本身来确定合适的推论层次。

第一个层次是一般途径,运用任意检索寻找可能的答案,或运用启发式检索寻找最有可能的答案。

第二个层次是控制策略,包括前推式、回溯式及双向式3种。前推式是以已知的条件作为出发点逐步推导出答案;回溯式是设定一个目标,然后证明目标成立;双向式则是两者的结合。

第三个层次是额外的思考技巧,该方法主要使用模糊逻辑进行计算,用于处理知识库中概念之间的不确定性。

专家系统的发展过程大致可分为3个阶段,分别是初创期(1971年之前)、成熟期(1972—1977)和发展期(1978年至今)。

(1)初创期(1971年之前)

此阶段诞生了许多初级专家系统,最具代表性的是DENRAL专家系统,该系统是在1965年由斯坦福大学开发的,系统内包含了大量化学知识,可根据质谱数据帮助化学家推断分子结构,DENRAL专家系统的完成标志着专家系统的诞生。此外,还有由麻省理工学院开发的MACSYMA系统,该系统可以帮助人们解决数学问题,此后它经过不断地扩充和完善,目前能求解600多种数学问题。

(2)成熟期(1972—1977)

经过一段时间的发展,到20世纪70年代中期,科学家们先后设计出了一批卓有成效的专家系统,专家系统逐步发展成熟起来,并被人们广泛接受。这段时间,最具代表性的是爱德华·肖特立夫(Edward Shortliffe)和兰道尔·戴维斯(Randall Davis)等人设计的医药专家系统MYCIN,该系统主要用于医疗领域,可以诊断和治疗血液感染及感染性脑炎,并给出处方建议。另一个非常成功的专家系统是由理查德·杜达(Richard Duda)和约翰·盖施尼格(John Gaschnig)等人设计的探矿专家系统PROSPECTOR,它可以辅助地质学家探测矿藏,是第一个取得明显经济效益的专家系统。

(3)发展期(1978年至今)

1978年至今,专家系统进入新的发展期。这一时期的专家系统最主要的特点是被大量投入到商业化运营中,并为各个公司和行业带来了显著的经济效益。在这段时期,一个代表性的产品是1980年由DEC公司与卡内基梅隆大学合作开发的XCON-R1专家系统。该系统是一种用于计算机系统配置的专家系统,它运用计算机系统配置知识,依据用户需求,为用户提供最合适的系统配置推荐。XCON-R1是一个非常成功的专家系统,每年可为DEC公司节省数百万美元。

尽管专家系统已经广泛应用于各个领域,并给许多公司和行业带来了巨大的经济效益,但由于知识库储备不足、解决办法欠妥等原因,它们解决问题的范围常常受到限制,大部分专家系统只能解决某一特定领域的问题。解决上述问题的一个办法是发展分布式和协同式多专家系统。分布式专家系统的原理是把一个专家系统的功能分配到多个处理器上并行工作,提升系统的整体处理效率;协同式专家系统的原理是综合若干个属于不同领域的子专家系统,共同解决一个问题。分布式专家系统与协同式专家系统的相同点在于都涉及多个子系统,并且目的都是提高专家系统的效率;不同点在于前者强调对知识分布的处理,后者强调子系统间的协同和合作。未来,分布式专家系统和协同式专家系统将成为专家系统的主流发展趋势。

3. 人工神经网络进一步发展

人工智能的第一个发展期诞生了一些简单的人工神经网络模型,例如感知机。之后,人工神经网络进一步发展,诞生了许多经典的算法,这些算法也成为人工智能第二次兴起的重要推动力。人工神经网络简称为神经网络或连接模型,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型。按照网络结构,人工神经网络可以分为前馈型神经网络和反馈型神经网络。下面将分别介绍人工智能第二次兴起历程中,前馈型神经网络和反馈型神经网络的代表性成果。

(1)前馈型神经网络:BP神经网络

前馈型神经网络采用一种单向多层结构,基本结构如图1-8所示,各神经元分层排列,每一层包含若干个神经元,同一层的神经元之间没有互相连接,层间信息的传送沿同一个方向进行。其中第一层为输入层,最后一层为输出层,中间为隐含层,隐含层的个数可以是一层,也可以是多层。各神经元从输入层开始,接收输入信息,并输出到下一层,最终至输出层。

图1-8 前馈型神经网络结构示意图

大卫·鲁梅尔哈特(David Rumelhart)和杰·麦克兰德(Jay McClelland)等人于1986年提出误差逆向传播算法(Error Back Propagation Training,简称BP神经网络),是一种按照误差逆向传播算法训练的多层前馈神经网络。在人工神经网络的应用中,绝大多数采用的是BP神经网络及其变形形式,BP神经网络是目前应用最广泛的神经网络,也是之后很多更高级神经网络的基础。

误差逆向传播算法包括信号前向传播和误差反向传播两个过程。信号前向传播过程中,输入信号通过隐含层作用于输出节点,经过非线性变换后变成输出信号,如果实际的输出与期望的输出不相符,则转入误差反向传播过程。误差反向传播是指将输出误差通过隐含层向输入层逐层反传,将输出误差分摊至各层所有单元,以信号作为依据,调整各单元权值。不断调整输入层节点与隐含层节点的连接强度、隐含层节点与输出层节点的连接强度以及阈值的大小,使得误差沿梯度方向下降,经过反复学习、训练,确定最小误差对应的参数,并将其作为神经网络的参数。

(2)反馈型神经网络:Hopfield神经网络

反馈神经网络是一种反馈动力学系统。在这种网络中,首先会有一组网络权值的平衡点被存储,这组平衡点不是训练出来的,而是按照一定的规则计算出来的。然后有一组初始输入值传递给网络,训练过程中,每个神经元同时将自身的输出信号作为输入信号反馈给其他神经元,作为神经元调整参数的依据,最终经过不断学习和调整,网络会收敛到这个预先设计好的平衡点上,最终达到稳定状态。

1982年,加州理工学院的物理学家约翰·霍普菲尔德将物理学中的动力学引入神经网络的构造,提出了Hopfield神经网络,该神经网络可以解决一大类模式识别问题,还可以给出一类组合优化问题的近似解,对神经网络在20世纪80年代的复兴起到了巨大推动作用。