标签类型

目前标签类型包括基础标签、复合标签、人工标签、行为标签。 基础标签是指通过表的字段映射生成的标签;复合标签是指通过基础标签、行为条件进行表单化配置或通过SQL创建的标签;人工标签是指通过文件上传映射打标生成的标签。行为标签不是真实意义上的标签,仅用来构建行为。

基础标签

基础标签是指通过表字段映射生成的标签,可通过“新建标签”入口、对象标签设置和批量导入三种方式创建。 下图以新建标签表单为例:

标签类型 - 图1

字段说明:

字段 说明
标签子类型 包括主标识、标识和非标识。一个对象有且仅有一个主标识,可设置多个标识,一般意义上的都是非标识。
标签值类型 支持数值型、文本型、日期型和枚举型,若为枚举型需设置值域(可为标签单独配置码表或选择公共码表)
数据映射库表 对象已发布模型中的主表和辅表
数据映射字段 所选数据映射库表中的一个字段,已被其他标签关联的字段不可再选

复合标签

复合标签是指通过基础标签、行为条件进行表单化配置或通过SQL创建加工而来的标签,可通过“新建标签”入口和批量导入两种方式创建。 下图以新建标签表单为例:

标签类型 - 图2

字段说明:

字段 说明
标签子类型 若数据源为ElasticSearch,标签子类型仅支持自定义标签值;若数据源为Hive,标签子类型包括自定义标签值、首末次特征、指标计算、事件偏好属性、SQL创建、时间间隔和维度筛选。对于复合标签,标签子类型可以理解为创建方式。
标签值类型 除了SQL创建方式需要自定义配置标签值类型外,其他方式对应的标签值类型均为自动生成。
更新方式 数据源为ElasticSearch时,更新方式只能为实时;数据源为Hive时,除了维度筛选对应更新方式为实时外,其他子类型对应更新方式均可设置为手动或周期
更新周期 若更新方式为周期,更新周期可设置为小时、天、周和月
首次更新时间 首次计算的时间,不同更新周期的计算时间为基于此时间按周期粒度递增,比如设置的首次更新时间为2020-12-01 03:00:00,并且更新周期为天,则第二次计算时间为2022-12-02 03:00:00,以此类推
标签规则 选择不同的标签子类型后,会自动适配不同的标签规则模板

以下分别介绍各标签子类型的标签规则。

(1)自定义标签值

适用场景:标签各个枚举值的组成逻辑差异较大,比如时间范围不同,标签、属性或行为组合不同,交并差逻辑不同等。

举个例子:用户活跃类型标签 活跃:近30天有过购买行为; 沉默:近31-60天购买次数>=1,近30天未购买; 流失:近61-90天购买次数>=1,近60天未购买;

配置方式

标签类型 - 图3

(2)首末次特征

适用场景:明确是第一次发生或最近一次发生;需要行为发生的具体时间点或者距离当前天数;需要知道行为发生时的各类属性特征,比如维度类特征支付方式、地点……,度量类特征金额,次数等。

举个例子:最近一次购买化妆品的消费金额

配置方式

标签类型 - 图4

(3)指标计算

适用场景:单指标可以解决的,比如选择一个度量就可以的;单指标不能解决的,只能通过添加多个指标后建立运算表达式,以计算结果作为标签值;需要对计算结果按照业务规则分层的。

举个例子:最近6个月平均折扣率 一般做法是基于原始数据或者数仓明细数据重新计算处理得到,从需求提出到交付往往需要好多天。 然而,近6个月的平均折扣率应当等于近6个月实付价格/应付价格,我们可以通过界面“指标计算”这种方式快速创建获得。

配置方式

标签类型 - 图5

如上图,分别构建实付金额 A和应付金额 B两个指标,并使用基础模式,直接将A/B的结果按数值区间划分作为二次打标的依据,在分层设置中分别定义各个分层,即各个标签值。若用户需要的是折扣率的数值作为标签,那将A/B的结果按离散值划分即可。 若有更复杂的场景,还可以使用高级模式功能。

(4)事件偏好属性

适用场景:标签名中带有“最常”、“偏好”等字样的场景。

举个例子:最常用支付方式

配置方式

标签类型 - 图6

(5)时间间隔

适用场景:最近一次行为时间间隔(所选时间范围内最后一次行为时间与倒数第二次行为时间的间隔天数)或首次时间间隔(所选时间范围内第二次行为时间与第一次行为时间的间隔天数)。

举个例子:近半年内最近一次下单购买间隔天数

配置方式

标签类型 - 图7

(6)维度筛选

适用场景:有创建多个规则类似的标签需求,但不想每次修改都要同时修改每个标签,这时可以创建维度筛选标签。

举个例子:不同时间段不同商品分类的销售金额

配置方式

标签类型 - 图8

如上图,包含时间维度和商品分类维度,但此种方式创建的标签为逻辑存储,即只在使用时临时查询,不存储标签结果。另外,非时间维度仅可选择枚举型的行为标签。

(7)SQL创建

适用场景:用户具有SQL能力或者以上方式之外的场景,均可使用SQL创建方式。

举个例子:年龄段

配置规则

标签类型 - 图9

人工标签

人工标签是指通过文件上传映射打标生成的标签,可通过“新建标签”入口和批量导入两种方式创建。 下图以新建标签表单为例:

标签类型 - 图10

字段说明:

字段 说明
标签子类型 包括主键静态打标和逻辑动态打标两种,区别在于前者只能通过关联一个标识进行打标,后者可以关联多个非标识基础标签进行打标。(若数据源为ElasticSearch,不支持创建人工标签)
标签值类型 支持数值型、文本型、日期型和枚举型,若为枚举型需设置值域(可为标签单独配置码表或选择公共码表)。
更新方式 包括手动和更新
更新周期 若更新方式为周期,更新周期可设置为小时、天、周和月
首次更新时间 首次计算的时间,不同更新周期的计算时间为基于此时间按周期粒度递增,比如设置的首次更新时间为2020-12-01 03:00:00,并且更新周期为天,则第二次计算时间为2022-12-02 03:00:00,以此类推
标签规则 通过当前标签和关联标签生成模板,按模板上传文件生成规则

若人工标签已被定义但未被打标,则可先选中人工标签再点击标签管理页左上方的“人工打标”按钮进行打标,也就是标签规则的定义,如下图:

标签类型 - 图11

行为标签

行为标签不是真实意义上的标签,而是构成行为的要素,比如时间、度量等属性,不能用于圈选群组,仅用于构建行为,从而用来创建复合标签。可通过“新建标签”入口和批量导入两种方式创建。 下图以新建标签表单为例:

标签类型 - 图12

字段说明:

字段 说明
标签子类型 包括行为主体属性、行为属性、行为对象属性、行为度量和行为类型。前三者分别对应行为“主谓宾”的属性;行为度量则是对行为的衡量,比如次数、购买金额等;行为类型则通常用于多事件表场景,比如埋点事件表中通常记录所有埋点事件信息,表中会有类似event_type的字段用来区分不同行为事件,则可以定义该字段为行为类型,在构建具体行为时指向该字段
标签值类型 支持数值型、文本型、日期型和枚举型,若为枚举型需设置值域(可为标签单独配置码表或选择公共码表)
数据映射库表 包括手动和更新
数据映射字段 所选数据映射库表中的一个字段,已被其他标签关联的字段不可再选