复合标签是指通过基础标签、行为条件进行表单化配置或通过SQL创建加工而来的标签,可通过“新建标签”入口和批量导入两种方式创建。

下图以新建标签表单为例:

复合标签 - 图1

字段说明:

标签子类型 若数据源为ElasticSearch,标签子类型仅支持自定义标签值;若数据源为Hive,标签子类型包括自定义标签值、首末次特征、指标计算、事件偏好属性、SQL创建、时间间隔和维度筛选。对于复合标签,标签子类型可以理解为创建方式。
标签值类型 除了SQL创建方式需要自定义配置标签值类型外,其他方式对应的标签值类型均为自动生成。
更新方式 数据源为ElasticSearch时,更新方式只能为实时;数据源为Hive时,除了维度筛选对应更新方式为实时外,其他子类型对应更新方式均可设置为手动或周期。
更新周期 若更新方式为周期,更新周期可设置为小时、天、周和月。
首次更新时间 首次计算的时间,不同更新周期的计算时间为基于此时间按周期粒度递增,比如设置的首次更新时间为2020-12-01 03:00:00,并且更新周期为天,则第二次计算时间为2022-12-02 03:00:00,以此类推。
标签规则 选择不同的标签子类型后,会自动适配不同的标签规则模板。

以下分别介绍各标签子类型的标签规则。

(1)自定义标签值

适用场景:标签各个枚举值的组成逻辑差异较大,比如时间范围不同,标签、属性或行为组合不同,交并差逻辑不同等。

举个例子:用户活跃类型标签

活跃:近30天有过购买行为;

沉默:近31-60天购买次数>=1,近30天未购买;

流失:近61-90天购买次数>=1,近60天未购买;

配置方式

复合标签 - 图2

(2)首末次特征

适用场景:明确是第一次发生或最近一次发生;需要行为发生的具体时间点或者距离当前天数;需要知道行为发生时的各类属性特征,比如维度类特征支付方式、地点……,度量类特征金额,次数等。

举个例子:最近一次购买化妆品的消费金额

配置方式

复合标签 - 图3

(3)指标计算

适用场景:单指标可以解决的,比如选择一个度量就可以的;单指标不能解决的,只能通过添加多个指标后建立运算表达式,以计算结果作为标签值;需要对计算结果按照业务规则分层的。

举个例子:最近6个月平均折扣率

一般做法是基于原始数据或者数仓明细数据重新计算处理得到,从需求提出到交付往往需要好多天。

然而,近6个月的平均折扣率应当等于近6个月实付价格/应付价格,我们可以通过界面“指标计算”这种方式快速创建获得。

配置方式

复合标签 - 图4

如上图,分别构建实付金额 A和应付金额 B两个指标,并使用基础模式,直接将A/B的结果按数值区间划分作为二次打标的依据,在分层设置中分别定义各个分层,即各个标签值。若用户需要的是折扣率的数值作为标签,那将A/B的结果按离散值划分即可。

若有更复杂的场景,还可以使用高级模式功能。

(4)事件偏好属性

适用场景:标签名中带有“最常”、“偏好”等字样的场景。

举个例子:最常用支付方式

配置方式

复合标签 - 图5

(5)时间间隔

适用场景:最近一次行为时间间隔(所选时间范围内最后一次行为时间与倒数第二次行为时间的间隔天数)或首次时间间隔(所选时间范围内第二次行为时间与第一次行为时间的间隔天数)。

举个例子:近半年内最近一次下单购买间隔天数

配置方式

复合标签 - 图6

(6)维度筛选

适用场景:有创建多个规则类似的标签需求,但不想每次修改都要同时修改每个标签,这时可以创建维度筛选标签。

举个例子:不同时间段不同商品分类的销售金额

配置方式

复合标签 - 图7

如上图,包含时间维度和商品分类维度,但此种方式创建的标签为逻辑存储,即只在使用时临时查询,不存储标签结果。另外,非时间维度仅可选择枚举型的行为标签。

(7)SQL创建

适用场景:用户具有SQL能力或者以上方式之外的场景,均可使用SQL创建方式。

举个例子:年龄段

配置规则

复合标签 - 图8