第7章 因子分解机

上一章中讲解了矩阵分解推荐算法,我们知道了矩阵分解是一种高效的嵌入算法,通过将用户和标的物嵌入低维向量空间,再利用用户和标的物嵌入向量的内积来预测用户对标的物的偏好得分。本章会讲解一类新的算法:因子分解机(Factorization Machine,简称FM,后面为了书写简单,中文简称为分解机),该算法的核心思路来源于矩阵分解算法,矩阵分解算法可以看成是分解机的特例(7.3.1节会详细说明)。分解机自从2010年被提出后,由于易于整合交叉特征、可以处理高度稀疏数据,并且效果不错,在推荐系统及广告点击率(Click-Through Rate,CTR)预估等领域得到了大规模使用,国内很多公司(如美团、头条等)都用它来做推荐及CTR预估。

本章会先针对分解机进行简单介绍,然后从分解机的参数估计与模型价值、分解机与其他模型的关系、分解机的工程实现与拓展、近实时分解机,以及分解机在推荐上的应用、分解机的优势等7个方面来进行讲解。期望本章的梳理可以让读者更好地了解分解机的原理和应用价值,并且尝试将分解机算法应用到真实业务场景中。