数仓建设概览主要用于展示当前通过模型设计进行数仓建设后的数据展示,包括表分层统计数仓建设水平评估两个模块。

表分层统计


已设置主题域表数量

统计已经设置了主题域的表的数量。

未设置主题域数量

针对主题域 - 未分组页面中各分层的表数量进行统计,已设置忽略的表不会计入。

未分组:用于展示各层被抓取规则命中,但是还未归属到具体主题域和表分层的表。

一级下游表数量

表示已设置主题域的表的一级直接下游表数量。

昨日下游使用任务数

表示使用已设置主题域的表的任务数量。

说明:表分层的相关统计指标均为非实时更新。

数仓建设水平评估


数仓建设水平评估页面从dwd/dim层覆盖情况dwd、dim和dws各层复用情况两个方面进行展示,支持各指标的趋势图查看。

dwd/dim层覆盖情况

dwd/dim层覆盖情况共包含4个指标,分别是:

  • 跨ods层依赖的下游表数量:指ODS层的一级下游表中,除明细层(dwd)和维表(dim)之外,其它的表的数量。
  • 被跨层依赖的ods表数量: 指ODS层的表,如果一级下游表中含有除明细层(dwd)和维表(dim)之外的其它表,则该ODS层表被认为是跨层依赖,会计入到该指标当中。
  • 有下游ods表被跨层依赖率: 被跨层依赖的ODS表数量/有下游表ODS层表数量。
  • 总ods表被跨层依赖率: 被跨层依赖的ODS表数量/ODS层表数量。
说明:一般来说,ODS层下游应当是DWD层,其它层应尽可能少地直接使用ODS层。

各层复用情况

各层复用情况共包含3个指标,分别是:

  • dwd一级下游表数量平均值: dwd层一级下游表数量/dwd层已设置主题域表数量。
  • dim一级下游表数量平均值: dim层一级下游表数量/dim层已设置主题域表数量。
  • dws一级下游表数量平均值: dws层一级下游表数量/dws层已设置主题域表数量。
说明:一般来说,上述指标的值越高越好,越高说明被下游复用的次数越多,产生的价值也可以认为越大。