1.2 聊天机器人的分类与应用场景

近年来,基于聊天机器人系统的应用层出不穷,下面我们从几个维度对其进行分类。

1.基于应用场景的聊天机器人分类

从应用场景的角度看,可以将聊天机器人分为在线客服、娱乐、教育、个人助理和智能问答5类。

在线客服聊天机器人系统的主要功能是自动回复用户提出的与产品或服务相关的问题,以降低企业客服运营成本、提升用户体验。其服务通常是以网站和手机终端为载体而实现的。代表性的商用在线客服聊天机器人系统有小 i机器人、京东JIMI客服机器人、阿里小蜜等。以京东JIMI客服机器人为例,用户可以通过与JIMI聊天了解商品的具体信息、了解平台的活动信息、反馈购物中存在的问题等。另外,JIMI具备一定的拒识能力,因此可以知道用户的哪些问题是自己无法回答的,且可以及时将用户转向人工客服。阿里巴巴集团在2015年7月24日发布了一款人工智能购物助理虚拟机器人,取名“阿里小蜜”,阿里小蜜基于客户需求所在的垂直领域(服务、导购、助手等),通过“智能+人工”的方式提供良好的客户体验。

娱乐场景下的聊天机器人系统的主要功能是同用户进行不限定主题的对话(闲聊),从而起到陪伴、慰藉等作用。其应用场景集中在社交媒体、儿童陪伴及娱乐、游戏陪练等领域。有代表性的系统如微软的“小冰”、微信的“小微”、北京龙泉寺的“贤二机器僧”等。其中微软的“小冰”和微信的“小微”除了能够与用户进行开放主题的聊天,还能提供特定主题的服务,如支持用户询问天气、回答用户关于生活常识的疑问等。

应用于教育场景下的聊天机器人系统可以根据教育内容的不同进一步划分。例如,通过构建交互式的语言使用环境,帮助用户学习某种语言的聊天机器人;在用户学习某项专业技能时,指导用户逐步深入地学习并掌握该技能的聊天机器人(如前述介绍的UC聊天机器人);在用户的特定年龄阶段,帮助用户进行某种知识的辅助学习的聊天机器人(如目前流行的儿童教育机器人)等。这类聊天机器人的应用场景为具备人机交互功能的学习、培训类产品,以及儿童智能玩具等。

个人助理类应用可以通过语音或文字与用户进行交互,实现用户个人事务的查询及代办,如天气查询、短信收发、定位及路线推荐、闹钟及日程提醒、订餐等,从而让用户可以更便捷地处理日常事务。个人助理的典型应用场景为便携式移动终端设备,如智能手机、智能耳机、笔记本电脑等。

智能问答类聊天机器人系统可以回答用户以自然语言形式提出的事实型问题及其他需要计算和逻辑推理的复杂问题,以满足用户的信息需求并起到辅助用户决策的目的。智能问答聊天机器人的应用场景相对单一,通常作为问答服务整合到聊天机器人系统中。聊天机器人系统不仅要考虑如 What、Who、Which、Where、When等事实型问答,也要考虑如How、Why等非事实型问答,因此智能问答的聊天机器人通常作为聊天机器人的一个服务模块。典型的智能问答系统包括 IBM 研发的 Watson、沃尔夫勒姆研究公司开发的搜索引擎WolframAlpha[3]、Peak Labs开发的搜索引擎Magi[4]等,且后两者都属于基于结构化知识库构建的问答系统。

2.基于实现方式的聊天机器人分类

从实现的角度看,聊天机器人可以分为检索式生成式。检索式聊天机器人的回答是提前定义的,在聊天时机器人使用规则引擎、模式匹配或者机器学习训练好的分类器从知识库中挑选一个最佳的回复展示给用户。也就是说,需要事先准备一个知识库,聊天机器人系统接收到用户输入的句子后,在知识库中以检索的方式进行应答内容提取。这种实现方式对知识库的要求相对较高,需要预定义的知识库足够大,尽量多地匹配用户问句,否则检索式聊天机器人系统会经常出现找不到合适回复的情况。这种实现方式的优点是回答的质量高,表达比较自然。生成式聊天机器人则采取不同的技术思路,不依赖于提前定义的回答,但是在训练机器人的过程中,需要大量的语料,语料包含上下文聊天信息和回复。使用这种模型的机器人在接收到用户输入的自然语言后,将采用一定技术手段自动生成一句话作为对用户输入的应答,生成式聊天机器人的优点是可能覆盖任意话题、任意句式的用户输入,缺点是生成的应答句子的质量很可能存在问题,比如出现语句不通顺、句法错误等比较低级的错误。

尽管目前在具体的生产环境中,提供聊天服务的一般都是基于检索的聊天机器人系统,但是基于深度学习的seq2seq(sequence to sequence)模型的出现可能使基于生成的聊天机器人系统成为主流。

3.基于功能的聊天机器人分类

基于功能的聊天机器人大致可以分为问答系统、面向任务的对话系统、闲聊系统和主动推荐系统4种,对这4种聊天机器人系统的总结如表1-1所示。

表1-1 基于功能的聊天机器人分类

目前,对问答系统和主动推荐系统的评价指标较为客观,评价方式也相对成熟。而面向任务的对话系统和闲聊系统,在给定相同输入的情况下,系统回复形式可以多种多样,对于用户的同一输入,通常有多种合理且数目不固定的回复,这使得很难通过一种客观的机制对其进行评价,所以在评价时需要加入人的主观判断作为评价的依据之一。

本书将按照功能分类依次介绍问答系统、面向任务的对话系统、闲聊系统的实现和测评。