Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?

发布于 2022-4-22 15:16
浏览
0收藏

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区
 •  wx私信问题:Elasticsearch 如何实现类似百度广告置顶显示给定商品数据的效果?


置顶显示某特定数据就是:搜索某关键词,出现关联广告置顶显示的效果。

 

举例:百度搜索“电动汽车”,结果如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

上面实现的本质:返回结果的第一页头1条或多条数据是服务端(如电商网站、主流搜索引擎)指定的数据,而非按照相关度评分计算得出的结果数据。

这时候,不禁要问 Elasticsearch 能实现类似功能不 ?

 

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区


本质是深度分页,肯定越往后翻页响应越慢。


要实现根据固定关键词添加特定数据置顶显示的效果,探讨方案如下:

 

2.1 方案一:不重新分页,牺牲首页部分数据


不再做重新分页,强制将 page 1 部分数据,换成:类【广告位】置顶显示数据。

 

显然,会有数据丢失,导致搜索精准率下降,用户一般不会接受。

 

2.2 方案二:重新内存分页


将类【广告位】置顶显示数据 + 已有返回的前10页(举例:100 条数据)重新组合后,再分页。

 

需要内存维护一堆数据,有较大内存开销。用户期望翻页越深(比如:100页+),维护数据越大,处理越慢、延时会越明显。

 

2.3 方案三:其他方案


类主流搜索引擎实现的方法或者读者新的实现机制。

 

但,此时要想,有没有更简洁的实现呢?

 

Elastic 官方就没有考虑这个用户需求吗?

 

有的,Elasticsearch 7.4.0 新增的 pinned query 就能实现这种功能。

 

且听慢慢道来......

 

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区
pinned query 是 Elasticsearch 7.4.0 版本实现的增强检索功能。

 

pinned:中文翻译为“固定”。

 

pinned query 则可以解释为——固定某些结果首页置顶显示的检索方式。

 

下图更能形象的说明:绿色的 Pinned results 就是要首页置顶显示的结果。

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区基础数据 Demo 如下,直接拿文章开头的截图示例模拟一下,假设 id为 1、2、3 的3条数据是需要特意置顶显示的数据。

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区
如果要召回既包含:“电动汽车” 完全匹配,又包含“电动”或“汽车” 分词匹配的全量数据。大致的检索语句如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

如上检索部分:完全匹配加了 boost  提升权重。

 

返回结果如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

返回结果按照评分由高到低顺序排列,_id 序列为:5、7、3、6、4 ......

 

置顶显示_id 为1、2、3的数据,pinned query 实现如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区
本质是在原来检索语句的基础上,添加了如下部分代码:

 

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

 

第一:置顶显示的 id ,写法如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

第二:除了置顶数据之外的其余正常检索语句块内容。只是加了“organic” 包裹一层。其中的检索语句还是原来的写法 ,拷贝过来即可。

 

返回结果如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

返回结果已 pinned(类似做了“广告位”定制),_id 序列为:1、2、3、5 ....... 实现了类百度置顶显示广告的效果。

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区

也就是说:MAX_ORGANIC_SCORE 大小为:2 的 127 次幂,是 Elasticsearch float 最大值。

 

5.2 最大评分作用


正常查询的评分得分不会超过 MAX_ORGANIC_SCORE, 将固定查询(pinned query)的评分设定为:MAX_ORGANIC_SCORE。

 

5.3  pinned query 保证置顶显示解密

 

原理:将置顶显示的数据通过 bool 组合查询 + boost 提升权重的方式给设置了 float 最大值评分,这样就能保证置顶显示了。

 

核心源码实现如下:

Elasticsearch 如何实现类主流搜索引擎广告置顶显示效果?-开源基础软件社区
读者可能会问:这并没有实现基于特定关键词返回特定数据的需求?其实有了pinned query 再将特定关键词与待置顶显示文章 _id 建立个一对多的映射关系就可以实现。映射关系可以自己内存维护或者借助 redis 实现都可以。

 

你、我发现的新需求,很可能别人早就发现,且已经提交 Git了。更可怕的是:官方新版本已经实现了!

 

要注重基础夯实的同时,多关注一下技术动态。两手抓、两手都要硬!

收藏
回复
举报
回复
添加资源
添加资源将有机会获得更多曝光,你也可以直接关联已上传资源 去关联
    相关推荐