产品使用建议

1 建议使用对象

模型设计中心是专门为数仓开发(数据工程师、ETL工程师等等)人员设计的产品,因此建议该种人员或类似职能的人员使用。

2 产品组织形式

EasyDesign以猛犸大数据平台的“项目组-集群”为活动单元,这里的项目组是用户在页面上看到的“项目”的更上一级的组合。比如项目可以是“mammut_project1”,“mammut_project2”,他们都属于“big_data_group”这样一个项目组。如果一个项目在多个集群上都有开通,那么就可以产生多个活动单元。

使用者需要获得猛犸大数据平台某一个“项目”中的“数仓开发”这一角色,获得后即可登录对应的“项目-集群”进行业务活动。比如用户A获得了“mammut_project1”项目的“数仓开发”角色,用户B获得了“mammut_project2”项目的“数仓开发”角色,则用户A登录“mammut_project1-集群x”,则用户B登录“mammut_project2-集群x”,他们会看到相同的东西,他们属于同一个活动单元。

3 使用场景说明

3.1 用户说明

模型设计中心的用户,可大概分为3类不同职能的人员,第一种是数据团队管理者,第二种是相对比较资深的数仓架构师或小组长等,第三种是普通的数仓开发。

对于第一类人员,负责整体上设计整个数仓体系,需要在“项目中心”添加“数据团队管理者”角色,并将该类人员添加进去。该角色下的人,可访问“数仓配置”页面,可进行“主题域配置”、“分层配置”、“字段级配置”和“表设计规则管理”操作,也可以在“基础字段”页面维护字典集内的字典名称。

对于第二类人员,主要负责主题域下创建和修改表工单的审批工作,需要“数据团队管理者”在构建主题域时,指定其为某些域的审批人。此外,主题域负责人,也可指定其子主题的审批人。

对于第三类人员,主要负责主题域的建设,主要负责设计主题域下的子主题,以及设计相关的模型,提交给审批人审批。也可以维护主题下的维度和度量等。

3.2 典型场景

场景1:数仓团队接入了一块新业务的数据,并进行数据建设 做法:

a)“数据团队管理者”小A评估后,在“主题域配置”页面创建了主题域“theme” ,并设置“域负责人”为数仓开发小B,“域审批人”为架构师小C和小D

b)“域负责人”小B评估这块业务后,规划了“二级主题”(也叫业务过程),在“主题域”页面的“theme”主题域下新建了二级主题“sec_theme”,并维护了主题域或子主题的介绍

c) “域负责人”小B,之后在“表设计工单管理”页面,设计dwd-明细表,基于表结构的内容,在“维度”和“度量”页面,分别维护了相关维度和度量

d) “域负责人”小B将设计好的工单提交,架构师小C和小D,接收到审批邮件通知,其中小C前往“表设计工单管理”处理工单,结果为通过

e)基于运营提出的指标,小B设计了dws-汇总表和ads-应用层表,在设计中维护了表字段和维度、指标的关系,也通过工单审批通过

f)小B将ads-应用层表做成了有数报表

说明: 上述场景中,涉及了主题域的管理,维度、度量、指标的管理,表设计工单的创建、审核等。通常主题域在一开始创建后,不太会轻易去动,但是子主题可能随着业务的发展,域负责人会做一些小的调整。维度和度量,一般可直接由数仓开发来设置,指标则在指标系统维护,一般有数据产品经理或分析师等来维护,也可由数仓开发维护。表设计工单中,数仓开发会选择域和分层。其中对于表的分层的功能,数仓团队的负责人需要和内部做好宣讲,明确怎么样的表可以放到什么分层。