搜索系统 基础教程

搜索 query 分析

搜索系统 索引教程

搜索系统 高级教程

搜索系统 排序层

搜索系统 笔记

搜索系统 排序的人工干预


在搜索系统的排序层的最后一环往往是业务干预逻辑,主要是根据业务需求针对排序结果进行人工调整,其中主要分为提权类、降权类、固定类以及其他。

干预类别

笔者将人工干预类型分为如图表格所示:

大类别 具体
提权类
置顶 顾名思义,强行放在头部
系数提权 针对符合条件的 item,对最终分数乘以一个大于 1.0 的系数
降权类
置底 直接将符合条件的内容放在排名的底部
系数降权 针对符合条件的 item,对最终分数乘以一个小于 1.0 的系数
固定类
固定位置 强行插入到指定位置
分段阶梯 对符合各类条件的 item 集合进行分集合优先级,也可以理解成分段阶梯
其他类
打散 一般指针对同一个作者的内容,根据允许的步长(gap)进行打散,防止霸屏

其他类

这里主要是打散干预,针对内容生产者进行指定步长的阈值分开,防止同一个作者生产的内容霸屏,影响用户体验。

打散

打散的实现主要是结合一个已经散开验证的数组对象待验证的链表对象,具体参考 java 实现搜索系统人工干预排序的防霸屏打散