- 构建企业级推荐系统:算法、工程实现与案例分析
- 刘强
- 111字
- 2021-08-06 14:59:47
3.5.4 数据清洗
基于内容的推荐算法依赖于标的物相关的描述信息,这些信息更多的是以文本的形式存在,这就涉及自然语言处理了,文本中可能会存在很多歧义、符号、脏数据,我们需要事先对数据进行很好的处理,才能让后续的推荐算法产生好的效果。
基于内容的推荐算法依赖于标的物相关的描述信息,这些信息更多的是以文本的形式存在,这就涉及自然语言处理了,文本中可能会存在很多歧义、符号、脏数据,我们需要事先对数据进行很好的处理,才能让后续的推荐算法产生好的效果。