第23讲 搜索引擎的工作原理

了解搜索引擎的工作原理是利用搜索引擎做好自然流量的必经之路,当买家打开阿里国际站首页,在搜索框输入了一个关键词,单击“搜索”按钮后,搜索引擎是如何工作的呢?我们根据阿里国际站官方的示意图来梳理一下,如图23-1所示。

图23-1 阿里国际站搜索引擎工作原理图

搜索引擎的工作流程如下。

第一步:系统执行过滤程序。

当买家在搜索框输入一个词,单击“搜索”按钮之后,系统第一步执行的是过滤程序。过滤的内容主要包括重复铺货、类目错放、侵权违规等平台认定的违规或作弊行为。也就是说,把不符合要求的产品全部剔除掉,剩下的产品将作为初步合格品进入后续的考察模型。

第二步:系统匹配类目相关性。

经过过滤程序之后,系统会依据买家的搜索词判断买家的购物意图,以此来匹配对应的产品。首先匹配的就是类目,也就是买家的搜索词与哪些类目下的产品相对应,将这些产品圈出来进行下一轮的筛选。这里商家需要注意的是,同一个搜索词可以同时对应多个类目,所以不需要过分纠结放在哪一个类目下,只要是正确的类目都可以放。如果实在不知道怎么选择类目,可以参阅第20讲“产品上架标准”来了解如何选择类目。这是非常简单的一步,商家不应该在这一步出错。

第三步:系统匹配文本相关性。

匹配了类目相关性之后,接下来系统开始匹配文本相关性。搜索引擎要保证呈现出的产品是买家想要寻找的产品。文本相关性的匹配方式实际上比较复杂。但是简化一点理解就是查找,找到了就相关,找不到就不相关。

阿里国际站搜索引擎对于文本匹配的规则是“遵从词根的无序匹配”。也就是说,只要你的标题中出现了买家搜索的词,就会被匹配到。系统并不考虑关键词是否有分割和倒叙。

举个例子来说明这个问题。买家搜索“black paper bag”。

标题1:China cheap price black paper bag。

标题2:2020 black good paper bag made in china。

标题3:Wholesale paper high quality black gift bag。

对于上面几种标题,在文本相关性上,系统都认为是相关的,都是可以匹配到的。所以在产品发布上,商家拼写标题的灵活度也有所提升,不一定非要按照每一个关键词的固定顺序来发布产品,极大地提升了标题关键词的覆盖度,不必发布更多重复的产品,也可以覆盖更多的关键词。

还有一种情况需要额外声明,搜索引擎匹配文本时,对于有些词来说,如单复数、极少数别名等情况,系统会对其进行归一处理,也就是系统会将这些词视为同一个词。买家在搜索框输入单数关键词文本时,包含单数和复数关键词的标题文本都是可以被匹配到的。

除了标题可以参与文本相关性的匹配,3个关键词框及属性和详情页的一些关键词也会被搜索引擎抓取参与文本匹配。所以,如果我们遇到一些搜索量较高的错别字关键词,或者一些不适合写在标题里面的小语种词,可以尝试着放进3个关键词框里。由于搜索这些词的竞争结果数量相对较少,搜索引擎会尽可能多地抓取产品展现给买家,我们的产品就有很大的概率被抓取和展示出来。当然,侵权词和违规词绝对不能使用,并且重要的关键词一定要写在标题中。

第四步:系统计算买家喜好分值,根据买家行为数据进行权重的计算和赛马。

经过搜索过滤、类目相关性和文本相关性的筛选之后,所有符合条件的产品都适合呈现给买家。在众多产品中,哪些产品应该展示在前面,哪些产品应该排列到后面,需要依据一个科学合理的评判标准。系统计算产品综合表现时,主要考核产品的历史数据表现是否受买家欢迎。也就是说,某款产品的历史表现好、受买家欢迎、综合权重高,就排到前面,反之,则排到后面。不得不说此规则对于买家体验和商家公平性都是非常友好的。

第五步:综合考量产品及店铺的信息质量。

最后,系统考核的是产品和店铺的信息质量。笔者的理解是当买家搜索一款产品时,如果这款产品的主图很差,产品描述中很多参数残缺不全,那么将无法带给买家很好的购物体验。店铺的信息也是一样的,为提升买家的购物体验,平台会对店铺公司信息、自我维护及产品信息填写的质量、完整度进行考核,对描述不准确、信息不全、主图质量不佳的产品进行相应的减分操作,综合排名相对后移。

所以,商家在填写店铺信息和发布产品时要严格遵守填写规范。这些都是轻而易举就能完成的事情,不应该成为拖累产品排名的因素。