公共码表管理

码表管理即标签值的字典管理,比如“省份”这个标签,物理表有一行记录的存储值为P1001,实际含义表示浙江省,此处可建立映射关系。 码表配置方式包括两种:人工录入、表同步。

人工录入

既可以通过单行录入,也可以按照格式复制粘贴后批量识别添加。

公共码表管理 - 图1

公共码表管理 - 图2

表同步

支持从Hive表中按照所选周期同步码表。

公共码表管理 - 图3

配置字段 说明
资源所属项目和集群 选择数据所属的项目和集群
数据源类型 目前只有Hive
数据源名称 每个Hive数据源均有自己的名称,选择即可
库名称 选择需要同步表所在库
表名称 选择需要同步表
编码 标签物理存储的值,通常是编码,比如省份,存储的是1,表示浙江省,1就是编码
标签值 用户可以理解的标签值,一般是中文,比如省份,标签值就是浙江省
描述 对标签值进一步说明,可以为空。
限制条件码 所选同步表可能是混合维度表,需要加限制条件,比如type=”province”
同步周期 可选小时、天、周、月
首次同步时间 设置首次同步的时间
查询引擎 支持选择hive或者Impala的查询引擎执行码表同步任务