背景

大数据时代,随着Hive和Spark等大数据计算引擎的普及,数据处理效率得到了极大提升,但与此同时,数据流转过程也愈加错综复杂。无论是从运维还是业务角度来说,理顺数据间的依赖关系对于问题排查、溯源追踪,乃至构建组织用户关系等都极为重要。因此,数据治理这一课题在业界中逐渐得到重视,而作为数据治理的核心,数据血缘的构建则更是成为了重中之重。平台为了方便用户更加直观地了解到数据血缘的覆盖情况,故新增了血缘覆盖率统计的功能。

名词解释

元数据分析 - 图1

血缘覆盖率统计规则说明

元数据分析 - 图2

注意事项

  • 默认平台负责人可以查看平台整体血缘覆盖率、各项目组血缘覆盖率;
  • 默认项目组负责人或者项目组管理员可以查看其所在项目组的血缘覆盖率。

产品页面

元数据分析 - 图3