1.2.2 重大突破

深蓝击败国际象棋冠军。1997年注定是一个将被记录在人工智能史册的年份,因为在这一年,由IBM制造的超级计算机“深蓝”在标准的国际象棋比赛中击败了当时的国际象棋世界冠军加里·卡斯帕罗夫(Carry Kasparov)。“深蓝”最初起源于一个叫许峰雄的中国人在美国卡内基梅隆大学攻读博士学位的研究,许峰雄在美国卡内基梅隆大学求学期间疯狂地迷恋上了计算机博弈这个领域,并在此之后几乎把所有的精力都投入到了对这个领域的研究。1985年,许峰雄研制出第一个计算出棋路数的“ChipTest”,这个成果让他们在1987年的计算机博弈锦标赛中拔得头筹,也为他们积累了宝贵的经验以及日后持续投入研发的资金。皇天不负有心人,1988年许峰雄和他的合作者成功研制出了“深思”(Deep Thought),这是一个配置有2个处理器、200块芯片,每秒能够执行70万个棋位分析的计算机,在当时战斗力大抵相当于一个级别段位较低的国际象棋大师。也就是在同一年,美国IBM公司发现了许峰雄以及他研制的深思,1989年,许峰雄携他的深思加入IBM研究部门,继续着超级电脑的研究工作。在1992年,IBM委任谭崇仁为超级电脑研究计划主管,领导研究小组开发专门用以分析国际象棋的“深蓝”(Deep Blue)超级电脑,名字深蓝取自“深思”和IBM“蓝色巨人”的结合。4年后的1996年2月,深蓝第一次挑战俄罗斯国际象棋大师卡斯帕罗夫,这场比赛在费城举行,深蓝最终以2:4落败,尽管卡斯帕罗夫在这场比赛中取得了胜利,但是赢得并不轻松,其中一些神来之笔的棋路更是令卡斯帕罗夫头疼。虽然战败,但是对战国际顶尖棋手的战绩仍然使IBM的研究人员兴奋不已,在接下来的一年时间里,研究人员对深蓝进行了升级改造,甚至邀请了四位国际象棋大师作为深蓝的陪练。经过长达一年的准备,1997年5月11日,经过改良的深蓝再度挑战卡斯帕罗夫,并以3.5:2.5战胜卡斯帕罗夫,成为第一个在标准比赛时间内击败国际象棋世界冠军的计算机系统。国际象棋曾经一度被认作人工智能永远无法攻克的智力游戏,而彼时人工智能已可以战胜世界冠军,这给人们带来对人工智能技术的无限期待,以及从事人工智能研究的兴趣与信心。

深度学习模型在图像识别任务上超越人类。2012年,为了证明深度学习的潜力,杰弗里·辛顿带领研究团队参加了ImageNet大规模(百万级)图像识别挑战赛,并提出了对深度学习影响深远的AlexNet网络。AlexNet网络以超过第二名10%以上的Top-5准确率夺得了比赛的冠军,自此深度学习重新进入人们的视野并一发不可收拾,进入深度学习快速发展的黄金十年。如前面所述,这十年来,涌现了许许多多的神经网络结构并不断地刷新着各类纪录。在计算机视觉领域,2014年的VGGNet、Inception-Net以及2015年的ResNet网络(以及近期提出的ViT模型)最具代表性。而其中ResNet的影响最为深远,它在将神经网络的深度扩展至数百层的同时还能保持很好的收敛性,在ImageNet的1000类图像分类任务中达到了4.94%的Top-5错误率,第一次超越了人类。相关研究估计,人类在1000类的ImageNet图像分类任务中的Top-5错误率为5.1%左右。虽然从2018年开始ImageNet比赛已不再举办,后续的研究工作已经将ImageNet图像分类任务的Top-5准确率逐步提高到了99%(Top-1准确率也达到了91%),但在自然语言处理领域,深度学习仍以不可抗拒之势席卷各大顶级会议和期刊,从2013年的word2vec到后来的LSTM、GRU等经典模型,模型性能不断提升。2017年,谷歌公司发表论文“Attention Is All You Need”,基于自注意力机制(self-attention)构建了Transformer模型,登上了各大自然语言处理任务的榜首。到2022年年底,基于Transformer架构的各类大规模预训练模型刷新了众多自然语言处理任务的最优性能,并开始广泛应用在计算机视觉领域,呈现出模型结构大一统的趋势,再加上多模态学习的飞速发展,相信实现通用人工智能并不遥远。

AlphaGo战胜世界围棋冠军李世石。2016年1月27日,DeepMind公司开发的计算机围棋程序AlphaGo在一项赛事中以5:0的成绩战胜了欧洲围棋冠军樊麾,这是计算机围棋程序首次在比赛中击败人类围棋专业高手,而这只是一个开始。2016年3月,AlphaGo以4:1的比分挑战了世界围棋冠军李世石。一时间引发了全社会的广泛关注,因为这代表着继深蓝拿下国际象棋18年之后,代表人类高智力水平的围棋游戏也被人工智能攻克。在AlphaGo之后,DeepMind继续推出能力更加“变态”的AlphaGo Zero,其在经过三天的自我对战之后便战胜了之前战胜李世石的AlphaGo版本,更是在40天之后超过此前所有的AlphaGo版本。

自动驾驶汽车上路行驶。实现汽车的自动驾驶是人类由来已久的梦想。从最初70年代中期每移动1米都要花费20分钟的Stanford Cart(被普遍当作第一辆自动驾驶汽车)到1995年卡内基梅隆大学穿越美国的庞蒂克(美国通用公司旗下品牌)Trans Sport——NavLab5,再到美国国防高级研究计划局(DARPA)在莫哈韦(Mojave)沙漠组织的第一场挑战赛,自动驾驶已经历经了几十年的发展。很多传统汽车企业(如福特)在几十年之前就已经开始研究自动驾驶,但是直到2004年的DARPA挑战赛(DARPA Grand Challenge),自动驾驶才真正进入人们的视野。在2007年的城市挑战赛中,卡内基梅隆大学与通用汽车合作制造的“Boss”使用了一种全新的激光雷达扫描系统,这也是当今自动驾驶的一种主流解决方案。正是这些挑战赛的出现极大地促进了自动驾驶这个领域的蓬勃发展,2009年谷歌建立了一支由塞巴斯蒂安·特伦(Sebastian Thrun)领导的自动驾驶研发团队,三年后这支团队从谷歌分离出来成立了Waymo公司。2011年10月,谷歌在内华达州对自动驾驶的汽车进行测试,成为全球第一个进行无人驾驶汽车公路测试的公司。2012年5月,谷歌获得美国首个自动驾驶车辆许可证。不仅在美国,自动驾驶在大洋彼岸的中国也在如火如荼地进行中。2018年12月,百度的Apollo自动驾驶全场景车队在长沙高速上行驶。2019年6月,长沙人民政府颁发49张自动驾驶测试牌照,其中百度独得45张。2019年9月,百度自动驾驶出租车队Robotaxi在长沙试运营正式开启,这也是自动驾驶在中国商业化应用的一个里程碑事件。相信自动驾驶会在未来十年得到迅速的发展,有望给人们的生活与出行带来全新的体验。

AlphaFold 2解决了困扰科学家50年之久的蛋白质折叠问题。如果说以上关于棋类比赛、图像识别以及自动驾驶的例子都是人工智能在实际应用层面的成功探索,那另外一个不得不提的例子就是2020年11月底DeepMind提出的AlphaFold算法,其破解了困扰科学家50年之久的蛋白质折叠问题。这个例子展现了人工智能技术在基础科学领域的巨大进步。蛋白质是组成人体细胞、组织的重要成分,几乎所有的人类生命活动,如光亮感知、肌肉伸缩等,都离不开蛋白质的参与。因此,研究蛋白质折叠问题,即如何根据蛋白质的氨基酸序列来确定它的空间结构,对于生物学具有极其重要的意义。然而,这一研究问题困扰了生物科学家长达50年之久。AlphaFold在2020年的国际蛋白质结构预测(CASP)比赛中,击败了其他的参赛队伍,以明显的优势拿下了比赛冠军。此外,AlphaFold在准确度方面也可比肩人类实验结果,基本可以认为它在很大程度上解决了蛋白质的折叠预测问题。DeepMind的这一突破性成果受到了学术界前所未有的关注和赞誉,CASP组织者、科学家安德烈·克里斯塔福维奇(Andriy Kryshtafovych)在大会上感叹:我从没想过有生之年能看到这项技术的诞生。生物学家安德烈·鲁帕斯(Andrei Lupas)评价该技术:将改变医学,改变研究,改变生物工程,甚至改变一切。这一重大突破证明了深度学习技术在解决基础科学问题方面的强大能力,展现了人工智能在基础科学领域的惊人发展潜力。