布尔表达式检索是广告受众定向的检索问题,本文从基础概念和 *** 出发,结合实际案例,深入浅出地阐述了布尔表达式检索的作用以及用法。
广告主投放广告的本质是流量的采买,所以广告主在投放时会选择自身角度的潜在用户群,也就是当代广告的受众定向售卖方式。现在的广告系统对于大数据量处理及实时性都有着极高的要求,当用户发起广告请求时,广告引擎如何快速筛选出符合定向条件的广告,让索引设计变得极为关键。
基础概念一般的广告主定向条件都类似于:20岁+女性,25岁+北京
这里的定向条件用布尔表达式进行表示:
a1={age∈(20)∩gender∈(female)}∪{age∈(25)∩geo∈(一线)}
这里的形式即为析取范式(Disjunctive Normal Form,DNF)
每个DNF都可以分解成一个或者多个交集(conjunction),即age∈(25)∩geo∈(一线)
每个交集进一步分解成一个或者多个赋值集(assignment),即age∈(25),geo∈(一线)
双层索引结构设计算法会维护一个两层的倒排索引,即conjunction-ad,attribute-conjunction。
实际检索过程中:
通过assignment筛选出满足条件的 conjunction,再根据conjunction找出满足条件的广告 *** 。
下面就是一步一步的举例过程!
假设线上有7个广告,定向条件如下:
Ad1:age∈(20)
Ad2:age∈(20)∩ gender∈(female)
Ad3:age∈(20)∩ geo∈(一线)
Ad4:age∈(20)∩ gender∈(female)∩geo∈(一线)
Ad5:age∈(20)∩ gender∈(female)∩geo∈(一线)
Ad6:age∈(20)∩ geo∈(一线)∩ mobile∉(apple)
Ad7:age∈(20)∩ gender∈(female)∩mobile∈(apple)
对应有6种定向条件,将定向条件编辑如下(其中size表示其中含有几个assignment):
Conjunction1:age∈(20),size1
Conjunction2:age∈(20)∩ gender∈(female),size2
Conjunction3:age∈(20)∩geo∈(一线),size2
Conjunction4:age∈(20)∩gender∈(female)∩ geo∈(一线),size3
Conjunction5:age∈(20)∩geo∈(一线)∩ mobile∉(apple),size3
Conjunction6:age∈(20)∩gender∈(female)∩mobile∈(apple),size3
则可以建立从conjunction到ad的之一层倒排索引:
Conjunction1:Ad1
Conjunction2:Ad2
Conjunction3:Ad3
Conjunction4:Ad4,Ad5
Conjunction5:Ad6
Conjunction6:Ad7
根据conjunction 的size大小及包含情况建立从attribute到conjunction的第二层倒排索引(标注conjunction是否含有/不含有该assignment):
Size1:age∈(20),(1,∈)
Size2:
age∈(20),(2,∈)(3,∈)
gender∈(female),(2,∈)
geo∈(一线),(3,∈)
Size3:
age∈(20),(4,∈)(5,∈)(6,∈)
gender∈(female),(4,∈)(6,∈)
geo∈(一线),(4,∈)(5,∈)
mobile∈(apple),(5,∉)(6,∈)
线上请求检索过程当某次广告请求的定向条件满足某个conjunction,一定满足包含该conjunction的所有广告。如果用size of(query)表示请求中的定向标签个数,如果size of(query)<size of(conjunction),该conjunction一定不满足要求。可以先利用这个判断减少计算。
当线上有一个用户发起了广告请求,该用户的标签为:
age∈(20)∩geo∈(一线)
因为size of(query)=2,则从size为1和2的conjunction中进行查询
Size=2的查询
age∈(20) (2,∈)(3,∈)
geo∈(一线) (3,∈)
只有Conjunction3满足条件,对应Ad3
Size=1的查询
age∈(20) (1,∈)
只有Conjunction1满足条件,对应Ad1
维度爆炸问题这里的维度组合并不取决于标签的乘积,即2个性别,100个年龄,34个地理……(2*100*34……),而是取决于广告的规模,假设有100w的广告,每个广告的定向标签都不一样,也只是百万级的检索,并且大量的广告受众定向是重复的,远远小于广告数量。
营销界有一句知名的话:我知道广告费有一半浪费了,但问题是我不知道是哪一半。那么我们到底怎么做才能避免亏得多赚的少的营销行为?或许我们要学会砍价,从浪费的那一半中抠出利润。 在中国的企业和投资圈里,盛...
自从19年苹果发布会推出了深色模式后,越来越多的APP开始更新了深色模式。那么,对于用户而言,深色模式和浅色模式到底哪个更好呢? 概述: 在具有正常视力(或矫正视力)的人群中,浅色模式下的视觉表...
互联网、移动互联网最大的特质是实现“人与物、人与信息、人与人”之间的“连接”。在连接中思考战略的变化,在连接中进化营销的功能,在连接中拥抱新的科技工具与数据思维,是摆在每个CEO和营销高管大脑中的问题...
近年来K12在线教育行业风起云涌,不但有学而思网校、新东方在线这样的传统教育巨头进场,也有网易有道精品课这样由一线互联网公司推出的产品下场角逐,而猿辅导却异军突起,成为了行业内的一颗新星,经过7轮融...
编辑导语:陌生人社交软件主要涉及三方:平台、陌生人1、陌生人2,前者促进后两者社交关系从无到弱再到强的形成;本文笔者针对这一过程进行探讨,并分析平台在此过程中可以优化的点。 一、社交关系的强弱 社交...
对话机器人作为近年来愈发普遍的产品,以各种各样的形态出现我们的生活中:电话客服、文本客服、超市里的导购机器人等;那这些机器人如何实现和我们人类的智能对话的呢?本文将用显浅易懂的文字讲述机器人的对话原理...