5.6 特征工程

什么是好的特征是困扰了AI的很多分支几十年的一个主要问题。以视觉分类为例。假设我们希望自动对一系列不同种类的花卉进行分类。我们想建立一个分类程序,通过查看每一种花卉的典型例子的图像来了解不同种类的花。通常的做法是首先选择一组明显的特征,这些特征可能是图像的任何视觉属性,可能有助于识别花卉,如颜色、形状、纹理和特定的图案。其次,我们通过展示一组图像来训练系统,包含要学习的每个类别的许多示例。学习程序为所看到的每个例子调整参数,并最终根据特定的特征组合确定每个类别的描述。因此A类可以定义为特征1的x值(叶子形状),特征2的y值(主要花色),特征3的z值(头部形状)。B、C类等具有由x、y、z的不同值集合表示的特征分布。最后,当程序看到足够多的示例时,它可以通过将新图像的特征内容与最接近混合特征的类别进行匹配来识别新的、以前未见到过的花。

这里的关键过程(对于视觉识别)——特征分类——与游戏中的评估函数完全相同,也与许多其他计算机学习领域相似。因此特征起源的关键问题在许多问题和方法中是很常见的。我们可以设计能够学习各种模式的系统,但是实际使用的特征,实际上是关于应用程序知识的原始片段,也是非常重要的,其本质上都是由设计师手工制作的有根据的猜测。虽然学习和识别系统在过去的几年里取得了良好的效果,总体上改进了方法,并且是建立在应用经验的基础之上,但其结果取决于诸如特征识别这样的工程方面,以适应应用。缺乏科学的方法来发现好的特征,一直是AI在理论和实践上的一个弱点!