人工智能的起源

一个世纪以后,艾伦·图灵(Alan Turing)解开了这个谜团。1936年,图灵提出,每个合理计算在原则上都可以由现在被称为“通用图灵机”(Turing Machine)的数学系统来执行。图灵机是一个虚构系统,建立和修改用“0”和“1”表示的二进制符号组合。第二次世界大战期间,图灵在布莱切利园(Bletchley Park)破解德国密码系统后,到20世纪40年代末一直在思考如何让一台物理机最接近抽象定义的图灵机(他帮助设计的第一台现代计算机于1948年在曼彻斯特完成),以及如何让这台物理机智能地执行任务。

与埃达·洛夫莱斯不同,图灵接受了人工智能的两个目标(技术和心理)。他想让新机器做通常需要智能才能完成的有意义的事情(可能通过使用非自然技术),并模拟以生理为基础的心智所发生的过程。

1950年,他那篇以幽默方式提出图灵测试(见第6章)的论文成为了人工智能的宣言[第二次世界大战后不久,其论文得到进一步完善,但《官方保密法》(Official Secrets Act)阻止其出版]。它抓住了智能信息处理(游戏、知觉、语言和学习)的症结,并暗示了当时计算机领域已经取得的成就,让人跃跃欲试(只有“暗示”,因为布莱切利园的工作仍然属于最高机密)。它甚至给出了算法,如神经网络和进化计算,不过在其论文发表很久以后,这些算法才得到广泛认可。要解开奥秘,这些都只是冰山一角,只是泛泛而谈——纲领性的东西,而不是程序。

图灵坚信,人工智能一定能以某种方式实现。20世纪40年代初,他的这一信念得到了神经病学家/精神病学家沃伦·麦卡洛克(Warren McCulloch)和数学家瓦尔特·皮茨(Walter Pitts)的支持。他们的论文《神经活动中内在思想的逻辑演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity)结合了图灵的观点与另外两项令人兴奋的成果(可追溯到20世纪早期):伯特兰·罗素(Bertrand Russell)的命题逻辑和查尔斯·谢林顿(Charles Sherrington)的神经突触理论。

命题逻辑的关键点在于它是二进制的。每个句子(也称为命题)假定为真或假。没有中间答案,也不接受不确定性或概率。只允许两个“真值”,即真和假。

此外,利用逻辑运算符(诸如and、or和if-then)构建了复杂命题,完成演绎论证,而逻辑运算符的意义由子命题的真/假来定义的。例如,如果两个(或更多)命题由“ and”连接,则认为这两个(所有命题)都是真的。所以当且仅当“玛丽嫁给汤姆”和“弗洛西嫁给彼得”二者都是真命题,那么“玛丽嫁给汤姆和弗洛西嫁给彼得”才是真命题。事实上,如果弗洛西没有嫁给彼得,那么包含“and”的复杂命题就是假命题。

麦卡洛克和皮茨将罗素和谢林顿的观点结合,因为他们都描述了二进制系统。逻辑的真/假(true/false)值映射到图灵机中的脑细胞开/关(on/off)活动和个体状态0/1中。谢林顿认为,神经元不仅进行严格的开/关活动,而且具有固定阈值。因此,逻辑门(and、or和not)被定义为微小的神经网络,可以相互连接来表示高度复杂的命题。任何东西只要能用命题逻辑表述,那就能用某种神经网络和某种图灵机来计算。

简单来说,就是神经生理学、逻辑学和计算被放在一起研究。后来,心理学也被纳入进来一起讨论。麦卡洛克和皮茨相信(就像许多哲学家当时所说的),自然语言在本质上归结为逻辑。所以,从科学论证到精神分裂症错觉的所有推理和观点都可以放到他们的理论“磨坊”里加工。麦卡洛克和皮茨为整个心理学预言了一个时代,“(神经)网络的设计规格将对心理学领域取得的所有成果都有帮助”。

其核心含义在当时很清楚:同一个理论方法,即图灵计算,可用于人和机器智能,麦卡洛克和皮茨的文章甚至影响了计算机的设计。约翰·冯·诺依曼当时打算使用十进制代码,但他后来意识到了问题,改为二进制。

图灵当然赞同图灵计算,但他无法进一步推动人工智能的发展:当时技术太过原始。然而,到20世纪50年代中期,出现了功能更强大且更容易使用的机器。这里的“易于使用”并不是说更容易打开电脑的按钮,也不是说更容易将它在房间里推来推去,而是指定义新的虚拟机更加容易(例如,编程语言),从而有利于定义更高级的虚拟机(例如,用来做数学运算或规划的程序)。

大约本着图灵宣言的精神,符号人工智能的研究在大西洋两岸得以开始。20世纪50年代末期,有一个标志性事件上了新闻头条,即阿瑟·塞缪尔(Arthur Samuel)的跳棋(国际跳棋)程序打败了塞缪尔本人。这无疑暗示着电脑有一天可能会具有超人的智力,超过设计它们的程序员的能力。

20世纪50年代末期,还出现了第二个这样的暗示,即逻辑理论机(Logic Theory Machine)不仅证明了罗素的18个关键逻辑定理,还发现了一个更有效的证明,来证明其中某一个定理。这的确令人印象深刻。塞缪尔只是一个平庸的跳棋选手,但是罗素可是一位世界级的逻辑学家[罗素本人为这项成就感到十分高兴,但是《符号逻辑杂志》(Journal of Symbolic Logic)拒绝发表一篇计算机程序撰写并署名的论文,更为重要的是,它并没有证明一个新定理]。

逻辑理论机很快就被一般问题解决器(General Problem Solution,以下简称GPS)“超越”——“超越”并不是说GPS可以“超越”更多卓越的天才,而是说它的应用范围不再限制在一个领域。顾名思义,GPS可解决用目标、子目标、动作和运算符表示的任何问题(详见第2章)。程序员一旦确定与任何特定领域相关的目标、动作和运算符,剩下的推理工作就可以由GPS负责完成。例如,GPS解决了“牧师和野人”的问题(三个牧师和三个野人在一条河的一边,现在有一艘船,一次最多可以载两个人。问题来了,如何在野人数量不超过牧师数量的情况下确保每个人都能过河)。这个问题对人类来说都不简单,因为每次把两个人运过去之后,都必须让其中一个回来,这样游戏才能继续下去(大家可用便士试一试)。

逻辑理论机和GPS都是GOFAI的早期示例。现在说它们是“老式的”,当然毫无疑问;但它们也是“有效的”,率先运用了“启发法”和“规划”——二者在今天的人工智能领域都至关重要(见第2章)。

并不是只有GOFAI这种人工智能受到论文《神经活动中内在思想的逻辑演算》的启发,联结主义也备受鼓舞。20世纪50年代,计算机上特制或仿真的麦卡洛克和皮茨逻辑神经元网络被用来[如艾伯特·厄特利(Albert Uttley)]模拟联想学习和条件反射(这些神经元网络进行集中式而非分布式处理,与今天的神经元网络不同,详见第4章)。

早期网络模拟并不完全由神经—逻辑统治。雷蒙德·拜沃勒(Raymond Beurle)在20世纪50年代中期实现的系统(在模拟计算机中)大不一样。他的研究工作没有始于精心设计的逻辑门网络,而是始于随机连接的和不同阈值的单元的二维数组。他认为神经自组织的发生是因为动力波的激活——构建、传播、坚持、死亡和时不时的相互作用。

拜沃勒已经意识到,诡辩机可以模拟心理过程,但不等于大脑实际上就是这样的机器。麦卡洛克和皮茨已经指出了这一点,他们发表了一篇具有开创性意义的论文,短短四年后,又在其另外一篇论文中指出了热力学比逻辑更接近大脑的功能。逻辑学被统计学取代,单一单元被集合取代,确定性纯度被概率噪音取代。

换句话说,他们已经描述了我们现在所说的分布式容错算法(见第4章),并认为这种新算法是之前算法的“延伸”,彼此并不矛盾。它在生物学上更现实。