Easydata大数据生产力平台,是网易大数据开发与数据治理实践经验的积累,是一站式大数据应用开发和数据管理平台。在沉淀网易大数据建设方法论的基础之上,Easydata大数据生产力平台支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。

平台从数据研发、数据治理、数据服务、数据应用等多个和大数据开发人员息息相关的环节入手,提供了丰富的产品矩阵,能让开发人员高效地完成各种开发需求。

此外,结合大数据底座的分析能力、数据管理能力、项目管理能力(包含资源管理、事件跟踪等),Easydata能更好地满足用户平台管理的需求。

产品矩阵

产品简介 - 图1

数据开发及管理平台包含组件如下:

  • 数据服务:

    提供快速将数据表生成API以及对已有的API进行注册管理的能力。数据服务通过应用授权,供外部应用系统调用API获取数据,支持API的策略配置,对API进行统一管理和发布。

  • 数据标准:

    是指保障数据定义和使用的一致性、准确性和完整性的规范性约束,本产品以数据元及数据字典为载体,定义了数据的类型、格式、值域、表示等描述项,并建立了完善的标准流程管理机制。具体包含数据元管理、数据字典管理、标准审核、标准发布、我的申请模块。

  • 数据资产地图:

    在元数据基础上提供的统一数据查询服务,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据管理等功能,帮助用户更好地查找、理解和使用数据。

  • 指标系统:

    依托离线开发中心,是指标的统一入口。通过定义原子、派生和复合指标,明确指标业务口径和技术口径,解决指标定义不一致、口径不一致和数据来源不一致的问题,实现规范定义,助力数据模型规范设计。

  • 数据质量中心:

    通过事前定义监控规则、事中监控数据的生成过程以及事后评估和问题追溯,围绕完整性、一致性、准确性、有效性和及时性五个方面衡量数据质量,依托离线开发中心的数据质量配置,提升企业数据价值。

  • 数据治理360:

    数仓界的360,可以定量评估数据资产的成本、价值、质量,帮助企业优化存储成本、节约计算资源。精细化的数据生命周期管理,帮助企业更好的管理数据从生产到销毁的整个过程。

  • 模型设计中心:

    提供组织数据、刻画数据、规范约束、效果衡量等能力,用于实现数仓的规范化建模,同时指引数仓建设的方向。支持主题域、表分层、字典集、设计规则、维度、度量等模块的管理,支持数仓建设数据大屏展示。

  • 安全中心:

    统一的功能权限管理,控制中台子产品的使用权限。对于Hive表提供库、表、列级别的权限控制。提供动态脱敏能力,对返回的结果进行脱敏处理。

  • 数据传输:

    主要用于多种异构数据源之间的数据交换,可实现各部门业务数据在应用层面的互联互通和信息共享。数据传输采用分布式的架构,可以从容应对大数据量的数据传输需求。针对实时计算场景,还提供基于FlinkCDC的实时采集和传输的能力,保证数据实时同步。

  • 离线开发:

    是有数数据生产力平台的基础产品,提供大规模数据存储与计算能力。可选择搭载其它有数产品,完成数据集成、数据研发、数据治理、数据服务等功能,灵活满足客户的各类场景。

  • 自助分析:

    是数据开发人员进行数据自助探查数据的场所,可方便快捷的执行自定义的SQL语句操作,如Hive、Doris、MySQL、Oracle、ClickHouse等数据源的表,也能够实现语句分享、代码共享等。

  • 实时计算

    实时计算是基于 Apache Flink 构建的高性能、一站式实时大数据处理平台,具备全链路覆盖、低时延的特点,广泛适用于流式数据处理场景,通过标准 SQL 服务和更高级的代码定制服务,提供低门槛,专业化的实时开发 IDE。

  • 发布中心

    发布中心是本数据平台的自助式统一资源发布平台,通过资源打包、发布、导入、应用等过程,实现在线和离线场景下的跨环境资源发布。针对有多套数据开发环境需求的客户,可以使用发布中心产品。

  • UDF Studio

    UDF Studio作为数据开发及治理平台的UDF管理服务平台,提供统一、完善、便捷的UDF管理服务,以项目组为管理单位,实现同项目组下公共函数的共建共享;通过函数的发布和申请流程,让函数的注册和使用更加规范和可控,提高函数开发效率,减少维护成本。

  • 任务运维中心:

    辅助任务运维人员进行离线任务管理和实例运维的工作,提高运维效率,及时发现问题并提供诊断建议,为运维团队提供任务评估。

产品协同

大数据开发的环节众多,而平台的十余个子产品,则分别用于完成大数据开发的各个环节的工作。有数大数据平台,总结出了典型的6大使用阶段:需求输入、数据准备、模型设计、模型开发、质量控制、需求交付,如图所示。

产品使用阶段

产品简介 - 图2