数据标准概览页面用来展示当前项目组下标准相关信息,包括标准资产统计、标准化统计、标准流程统计。

总览

标准资产统计

标准资产统计主要对数据元、原始字典、标准字典、词根、数据项分类方案以及资源目录数量的统计,同时还展示数据元和数据字典发布状态情况。
数据标准概览 - 图1

标准化统计

标准化统计主要展示当前版本的数据元、标准字典以及资源目录的生效情况,同时还展示了表、字段标准化情况以及数据元、资源目录引用情况。

数据标准概览 - 图2

表、字段标准化情况,通过标准化率来衡量,具体如下:
1. 表标准化率:如果某表已关联数据元的字段数超过了总字段数的60%,则会被纳入标准化表统计;
2. 字段标准化率:如果某字段关联了数据元,则会被纳入标准化字段统计。

标准流程统计

标准流程统计主要是对标准审批以及标准发布趋势进行统计,通过标准审批的统计可以了解到标准状态流转以及标准发布申请的审批情况,包括未办结、通过、驳回。标准发布趋势可以了解到标准发布的频率以及数据元和数据字典的总次数。

数据标准概览 - 图3

标准执行详情

标准执行详情分为:未引用数据元、标准核标不一致、字段命名不规范。系统默认每天00:00开始执行检测,检测范围为通过模型设计中心创建的表,并在此处更新执行详情。

未引用数据元:系统会检测未引用数据元的字段,且如检测出字段的中/英文名称和数据元的中/英文名称一致时,会推荐该字段关联数据元。

数据标准概览 - 图4

标准核标不一致:系统会针对已引用数据元的字段,检测其中文名称、英文名称、字段类型/长度、码值等是否遵循标准规范,若不遵循则作为核标异常统计到该报告中。字段类型检测暂仅支持以下数据源类型:Hive、MySQL、Oracle、Greenplum、Vertica

数据标准概览 - 图5

字段命名不规范:系统会对模型表进行检测,检测其字段名称是否符合标准的词根翻译命名,对于不符合词根翻译的字段会进行统计。

数据标准概览 - 图6

相似性检测

会展示检测出的相似的数据元和词根。系统默认每天00:00开始执行检测,并在此处更新执行详情。相似的判定标准:如果中文或名称的相似度超过50%,则认为是相似。

数据标准概览 - 图7

数据标准概览 - 图8