1.1 聊天机器人的发展历史

聊天机器人,是一种通过自然语言模拟人类,进而与人进行对话的程序。它既可以在特定的软件平台(如 PC 平台或者移动终端设备)上运行,也可以在类人的硬件机械体上运行。聊天机器人已经有近70年的发展历史,让我们一同回顾半个多世纪以来,不同历史阶段典型的聊天机器人项目和产品。

1.聊天机器人溯源及发展(1950—1990年)

对聊天机器人的研究可以追溯到 1950 年图灵(Alan M.Turing)在 Mind期刊上发表的文章Computing Machinery and Intelligence,这篇文章开篇就提出了“机器能思考吗?(Can machines think?)”的设问,然后提出通过让机器参与模仿游戏(Imitation Game)来验证“机器”能否进行“思考”,进而提出了经典的图灵测试(Turing Test)。通过图灵测试被认为是人工智能研究的终极目标[1],图灵本人也因而被称为“人工智能之父”。

已知的发布最早的聊天机器人程序ELIZA[1]诞生于1966年,由麻省理工学院(MIT)的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发。魏泽鲍姆是自然语言处理方面的先驱,他开发的ELIZA被看作可以用于临床模拟罗杰斯心理治疗的BASIC脚本程序。值得注意的是,尽管ELIZA的实现技术仅为对用户输入计算机的话语做关键词匹配,并且其回复规则是由人工编写的(魏泽鲍姆的本意只是让ELIZA模仿人类的交谈),但用户与ELIZA交谈时却如同自己面对着心理治疗师,开始向ELIZA倾诉自己内心深处的想法。随后,魏泽鲍姆撰写了Computer Power and Human Reason一书,以表达他对人工智能技术的看法。不论怎样,ELIZA 对自然语言处理和人工智能的研究与发展产生了重大影响,全球各地的研究机构也由此开始了对聊天机器人的相关研究。

1972年,美国精神病学家肯尼思·科尔比(Kenneth Colby)在斯坦福大学(Stanford University)使用LISP编写了模拟偏执型精神分裂症表现的计算机程序PARRY。由于PARRY体现的会话策略比魏泽鲍姆的ELIZA 更严谨更先进,PARRY被描述为“有态度的ELIZA”。研究人员在20世纪70年代早期,使用图灵测试的变体对PARRY进行了测试,测试由一组经验丰富的精神科医生参与,这些参与测试的精神科医生通过电传打印机分别与患者和运行 PARRY的计算机进行对话,并将这些对话记录展示给另一组(33名)精神科医生。这两组精神科医生分别被要求确定哪些对话是人类患者产生的,哪些是计算机程序产生的。测试结果表明,参与测试的两组精神科医生中只有48%在规定时间内做出了正确的判断,正确率约等于随机投票产生的正确率。

1988年,英国程序员罗洛·卡彭特(Rollo Carpenter)创建了聊天机器人Jabberwacky。Jabberwacky 项目的目标是“以有趣、娱乐和幽默的方式模拟自然的人际聊天”,这个项目也是通过与人类互动创造人工智能聊天机器人的早期尝试,但Jabberwacky并未被用于执行任何其他功能。Jabberwacky项目于1997年正式上线,上线后它会存储所有用户与自己的对话,并且在与用户的对话过程中使用上下文模式匹配技术找到最合适的回复内容。Jabberwacky 并没有硬编码的规则,它完全依赖于反馈的原则,这一点与大多数基于规则约束的聊天机器人非常不同。

也是在1988年,加州大学伯克利分校(UC Berkeley)的罗伯特·威林斯基(Robert Wilensky)等人开发了名为UC(UNIX Consultant)的聊天机器人系统。顾名思义,UC聊天机器人的目的是帮助用户学习使用UNIX操作系统。UC 聊天机器人以英文回复用户,它具备分析用户输入、确定用户需求、给出解决用户需求的规划、决定与用户沟通的内容、根据用户对UNIX系统的熟悉程度进行建模等功能。如果说ELIZA开启了智能聊天机器人的研究,那么UC则真正提高了聊天机器人的智能化程度。

1990年,美国科学家兼慈善家休·勒布纳(Hugh G.Loebner)设立了人工智能年度比赛——勒布纳奖(Loebner Prize)。勒布纳奖旨在借助交谈测试机器的思考能力,它被看作对图灵测试的一种实践,其比赛的奖项分为金、银、铜三等。根据勒布纳奖的规定,如果参与比赛的程序不仅能通过以文本方式进行的交谈测试,还能在音频和视频测试中过关,则获金奖,赢得10万美元和一枚18K黄金制金牌,同时勒布纳奖的年度比赛将会中止;如果程序能在以文本方式进行的交谈测试中长时间迷惑住至少半数裁判,则获银奖;如果程序未达到以上标准,则在测试中迷惑住最多裁判的程序赢得2000美元和一枚铜奖。从1991年首届比赛开办,至本书撰写时,尚无参赛程序达到金奖或者银奖标准。

2.聊天机器人研究兴起(1990—2010年)

在勒布纳奖的推动下,聊天机器人迎来了研究的高潮,其中较有代表性的聊天机器人系统是1995年12月23日诞生的 ALICE[2](Artificial Linguistic Internet Computer Entity)。受到相关聊天机器人研究的启发,人工智能科学家理查德·华勒斯(Richard S.Wallace)博士在1995年开发了ALICE系统,ALICE可以通过和网民的聊天不断学习,同时基于大量的预置问答模板回答用户的问题。虽然ALICE曾在2000年、2001年和2004年三次获得勒布纳奖,但其和 ELIZA 并无本质区别(ALICE 仍然完全基于模板匹配技术,不具备逻辑推理能力)。理查德·华勒斯博士将 ALICE 安装到网络服务器,并于1998年开源了该项目,目前全世界已有超过500个开发者为ALICE项目贡献代码。尽管ALICE采用的是启发式模板匹配的对话策略,但是它仍然被认为是同类型聊天机器人中性能最好的系统之一。图1-1所示为笔者与ALICE聊天的截图。值得一提的是,随 ALICE 一同发布的 AIML(Artificial Intelligence Markup Language)目前在移动端虚拟助手的开发中得到了广泛的应用。

图1-1 笔者与ALICE的聊天记录

2001年,SmarterChild在短信和即时聊天工具中的广泛流行,使得聊天机器人第一次被应用在了即时通信领域。2006年,IBM开始研发能够用自然语言回答问题的最强大脑Watson,作为一台基于IBM“深度问答”技术的超级计算机,Watson能够采用上百种算法在3秒内找出特定问题的答案。

3.聊天机器人研究方兴未艾(2010年至今)

2010年,苹果公司推出了人工智能助手 Siri,Siri 的技术来源于美国国防部高级研究规划局公布的 CALO 计划:一个简化军方繁复事务,且具备学习、组织及认知能力的虚拟助理。CALO计划衍生出来的民用版软件就是Siri虚拟个人助理。

此后,微软小冰、微软 Cortana(小娜)、阿里小蜜、京东 JIMI、网易七鱼等各类聊天机器人层出不穷,并且这些聊天机器人逐渐渗透进人们生活的各个领域。

2016年,全球各大公司开始推出可用于聊天机器人系统搭建的开放平台或开源架构。

2010年至今,标志性的聊天机器人产品如图1-2所示。

图1-2 标志性的聊天机器人产品

聊天机器人的发展历史说明,人类从未放弃将聊天机器人作为人机交互工具的研究。特别是近几年,随着人工智能相关技术“东风”渐起,自然语言处理研究硕果颇丰,聊天机器人相关技术迅速发展。同时,聊天机器人作为一种新颖的人机交互方式,正在成为移动搜索和服务的入口之一,毕竟搜索引擎的最终形态很可能就是聊天机器人。众多人工智能领域的探索者和开发者都想紧紧抓住并抢占聊天机器人这一新的交互入口。