- 构建企业级推荐系统:算法、工程实现与案例分析
- 刘强
- 724字
- 2021-08-06 15:00:08
8.2 解决冷启动面临的挑战
冷启动问题是推荐系统必须要面对的问题,也是一个很棘手的问题,要想很好地解决冷启动,需要发挥推荐算法工程师的聪明才智。本节讲解冷启动到底会面临哪些挑战,只有知道冷启动的难点,才能更好地思考解决冷启动的办法。具体来说,解决冷启动问题会面临如下挑战。
首先,我们一般对新用户知之甚少,所以基本上不知道用户的真实兴趣,从而很难为用户推荐他喜欢的标的物。我们对新用户知之甚少的主要原因有:
1)很多APP不强求用户注册时填写包含个人身份属性及兴趣偏好的信息,其实也不应该让新用户填写太多的信息,否则用户就会嫌麻烦而不用你的产品了。由于没有这些信息,我们无法获得用户的画像。
2)新用户由于是新注册的,在产品上没有或者很少有操作行为,不足以用复杂的算法来训练推荐模型。
其次,对于新的标的物,我们也不知道什么用户会喜欢它,只能根据用户历史行为来了解用户的真实喜好。如果新的标的物与库中存在的标的物可以建立相似性联系,我们可以基于这个相似性将标的物推荐给喜欢其相似标的物的用户。但是,很多时候标的物的信息不完善、包含的信息不好处理、数据杂乱;或者新标的物产生的速度太快(如新闻类,一般通过爬虫可以短时间爬取大量的新闻),短时间内来不及处理或者处理成本太高;或者是完全新的品类或者领域,无法很好地建立与库中已有标的物的联系。所有这些情况都会增加将标的物分发给喜欢该标的物的用户的难度。
最后,对于新开发的产品,由于是从零开始发展用户,冷启动问题就会更加凸显,这时每个用户都是冷启动用户,面临的挑战更大。
既然冷启动问题这么难解决,那么我们是不是可以不用管这些新用户和新标的物,只将精力放在老用户身上呢?答案肯定是不可以。那么,冷启动的重要性体现在哪些方面呢?