本文为您介绍数据开发及管理平台2022年产品更新动态,帮助您及时了解平台的新增功能及功能优化等,快速掌握产品情况。

640Update 0.2

编号 产品模块 特性 功能描述 时间 产品文档
1 数据传输(v2.3.1) 新增 数据传输接入安全中心功能权限,实现数据传输的离线同步任务和实时同步任务的功能权限管控。 2022.02 功能权限
新增 数据传输接入控制台源系统账号鉴权。 数据源管理
新增 数据传输支持静态脱敏。 新建单个离线同步任务
新增 数据来源为:FTP时,支持校验数据传输读取行数和校验文件记录的数据行数是否一致。 -
优化 无权限访问项目时,增加报错提示。 -
优化 在使用数据过滤条件时,提供参数splitWithoutCondition指定在切分过程中是对整表切分,还是对本次的查询区间切分。 -
新增 离线同步任务支持读写浪潮云海MPP,当前支持浪潮云海Insight MPP V4版本。 -
优化 数据传输读写GreenPlum时,库表选择请选择数据库改为请选择schema -
优化 数据来源端为GreenPlum时,分区字段改为选填项。若数据源版本为PostgreSQL v9.4时,分区字段为必填项;若数据源版本为浪潮云海Insight MPP V4时,分区字段可选填。 -
优化 数据去向为GreenPlum时,新增写入规则:Overwrite-truncate(清空表数据后插入数据)。当数据去向为GreenPlum时,目前支持的写入规则:Append、Overwrite-delete、Overwrite-truncate。 -
2 离线开发(v6.4.2) 新增 批量导出和导入增加调度信息。 2022.03 任务批量导出和导入
新增 离线开发任务编辑调度,支持设置调度失效时间 编辑调度
新增 离线开发任务开发模式运行,支持配置执行参照时间 运行测试
新增 离线开发开发模式运行,支持配置完成通知 运行测试
新增 离线开发编辑调度,智能推荐依赖支持推荐数据同步节点。 -
新增 离线开发的依赖授权支持项目组内全公开功能。 依赖授权
新增 公共资源的资源组,增加存储路径显示。 公共资源
新增 公共资源的参数组,增加数据传输产品的引用信息。 -
优化 项目中心的项目配置,相关文件夹圈选优化。 项目配置
优化 任务发布增加资源组和参数组等引用信息。 -
优化 任务复制、导出、导入时增加附带信息,原来只包含任务和资源,目前任务会有引用参数组、引用资源组、任务描述、任务配置等内容。 -
优化 离线开发的VerticaSQL节点(需要开启该节点)运行和自助分析中连接Vertica数据源运行,在日志中增加显示执行sql、运行时长、影响行数、运行结果。 -
3 元数据中心(v4.1.8) 新增 新增浪潮MPP数据源支持(Greenplum的一个定制版本),包括数据源登记、测试连接、库表列获取等功能。在数据源登记时,可选择登记GreenPlum数据源,可选择版本号:浪潮云海Insight MPP V4。 2022.02 -
新增 支持GreenPlum数据类型的血缘以及表DDL实时推送流程,表DDL实时推送包括在模型设计中心、离线开发、自助分析中建表后,能够将DDL实时推送给元数据中心存储下来,以便在数据地图能够即时搜索查询到新建的表。 -
新增 支持模型设计中心GreenPlum类型的建表,存储及查询GreenPlum信息。 -
新增 支持查看数据源引用任务详情,对接数据服务的引用任务信息。 -
新增 支持登记CDH Hive,支持的版本号为:0.14-CDH5.3、1.1.0-CDH5.16、2.1-CDH6.3.4。(仅限实时计算使用) -
优化 数据源名称修改为项目组下唯一,之前是限制同类型下唯一。 -
优化 数据源重复登记的报错文案优化。 -
4 控制台(v1.2.0) 新增 支持浪潮云海MPP登记,用于数据传输模型设计中心离线开发数据质量中心数据地图等子产品使用。 2022.02 -
新增 支持登记CDH Hive,用于实时计算。(支持版本号为:0.14-CDH5.3、1.1.0-CDH5.16、2.1-CDH6.3.4) -
新增 Kafka增加用户名密码认证模式及源系统账号鉴权功能,用于实时计算 -
新增 提供openAPI接口:
1. 数据源列表及详情查询;
2. 实时累计用户数(不分项目);
3. 指定项目用户数;
4. 项目列表及详情查询;
5. 项目用户及对应角色查询。
-
5 数据质量中心(v1.3.0) 新增 质量大屏支持下钻到次级主题域。针对Hive表,涉及表质量平均分、监控配置情况、调度监控执行情况,增加主题域筛选条件,按主题域展开展示结果,可下钻到次级主题域。 2022.02 数据质量评估
新增 MySQL支持自定义分区:对于MySQL此种不自带分区的数据源类型,提供自定义分区设置。 创建稽核监控任务
优化 规则模板分类:
1. 支持规则模板按规则类型(字段级/表级)、校验类型(完整性校验、有效性校验、数值型校验、波动型校验、唯一性校验、准确性校验、一致性校验、通用保障、其它)分类展示 ;
2. 增加筛选条件:规则类型、适用数据表类型、校验类型。
-
新增 丰富规则模板:
1. 系统内置新增7个字段级规则模板;
2. 新建规则模板支持新增通用、固定值、重复性、波动性规则模板。
3. 新建规则选择字段时展示字段类型,支持选择新增的字段级内置模板进行规则灵活配置。
4. 新增模板规则支持执行实例、执行趋势展示。
-
优化 执行趋势字段级规则检查的筛选条件优化为按规则名称筛选。 -
优化 表行数波动率规则运行结果和执行趋势中,会展示此次的表行数和上一周期表行数。 -
优化 点击执行实例ID跳转任务运维中心(新)实例详情页。 -
优化 报警配置统一收拢到报警中心。 -
新增 质量中心支持Greenplum数据源:
1. 支持对Greenplum数据源进行数据质量监控配置;
2. 支持适用 postgresql数据表(适用Greenplum数据源)规则模板;
3.支持展示监控对象为Greenplum数据源的相关质量结果。
2022.03 -
优化 试跑的执行队列,增加CPU和内存的显示。 -
6 模型设计中心(v1.2.7) 新增 模型设计中心支持Greenplum数据源类型。 2022.03 外部数据源建表演示
7 数据地图(v1.5.0) 优化 优化hive表负责人的查询和存储。表负责人信息由原来查询平台的接口改成查询元数据中心接口,修改负责人会同时更新到hms和metahub。 2022.03 -
8 任务运维中心(v1.1.0) 新增 新增调度失效功能。 2022.02 任务列表
优化 智能诊断优化,对底层报错日志获取方式重构,同时增加用户诊断结果反馈打标。 智能诊断
优化 告警模板文案优化,优化标题和新增跳转链接。 -
优化 优化基线运维中已完成的基线的文案。 -
新增 告警历史增加响应信息,包括响应人、响应时间。 报警历史
9 安全中心(v3.3.2) 新增 安全中心新增脱敏管理模块进行数据敏感类型配置、脱敏规则配置、脱敏算法查看。 2022.02 脱敏管理
优化 权限申请功能优化:
1. 取消申请对象项目组和项目信息选择,只能为本项目下的账号申请权限。
2. 将账号类型划分为当前账号、他人账号、项目账号三种。
3. 交互视觉优化:优化布局和交互,将待添加和待申请以穿梭框的形式选择。
权限申请
优化 支持视图权限授予和申请,创建、删除视图时,自动为创建人授予和回收hive权限。 -
优化 我的权限和权限到期通知展示资源的项目。 -
新增 支持查看脱敏规则引用的传输任务数和引用详情并支持跳转到相应传输任务,已被引用的规则不可删除。 脱敏配置
新增 静态脱敏的补充功能:支持查看线上调度的传输任务脱敏情况,父表展示一个传输任务扫描一次产生的结果(执行实例),子表展示脱敏详情。 脱敏结果

640Update 0.1

编号 产品模块 特性 功能描述 时间 产品文档
1 元数据中心(v4.1.7) 新增 实时血缘扩增数据源类型,在数据地图流表/Topic血缘中可查看写入Kudu、HBase的血缘。 2022.02 Kafka流表
新增 支持同一任务内的临时表删除后,保持上下游表的血缘关系。 Hive
新增 Vertica、Oracle、MySQL数据源,支持离线开发、自助分析、数据传输任务数据产出订阅。 -
新增 获取表列表中增加是否视图表的标识信息。 -
新增 支持自助分析推送任务血缘给元数据中心,目前支持Vertica、Oracle、MySQL。 -
新增 元数据中心返回DECIMAL数据的精度。 -
新增 新旧附加列接口兼容改造,支持批量删除、修改,适配模型设计中心。 -
优化 离线开发任务上线时影响标签tag检测数量过多而卡顿问题优化,通过新增接口限制返回500个标签以及标签总数。 -
优化 线上环境,es定时任务同步默认时长从8h修改为20h。 -
2 模型设计中心(v1.2.6) 新增 模型设计中心支持MySQL、Vertica,相关界面都进行展示调整。 2022.02 外部数据源建表演示
新增 主题域界面,支持流批一体表标识展示。 主题域
新增 表设计工单管理-与我相关中,新建/修改表工单、工单列表/工单详情展示均支持MySQL、Vertica。 -
新增 新建/修改表时支持填写/修改表及字段的扩展属性。 扩展信息配置
新增 维度可关联多层主题域,不限于二级主题以内。 -
优化 在维度、度量等模块选择表时,支持展示数据源类型标识。 维度
优化 新建表时放开维度表只允许选择一个主键的限制。 -
优化 数仓建设概览支持对数据源类型进行合并统计(之前只统计Hive)。 -
优化 去除原表设计规则管理中字段附加列的配置,升级为扩展属性管理页面。 扩展信息配置
优化 支持子主题域采用相同命名,放开不同层级主题域不可重名的限制。 -
优化 修改表工单页面排版优化。 -
3 数据地图(v1.5.0) 新增 流表血缘链路中增加区分是读写流表还是Topic的标识。 2022.02 Kafka流表
优化 Hive表详情操作按钮UI入口优化。 Hive
新增 Hive表详情增加产出任务信息、产出SQL脚本信息。 Hive
新增 表详情增加快捷搜索入口,方便用户直接搜表,不需要返回搜索首页。 Hive
新增 MySQL、Vertica表详情页增加表扩展业务属性信息、字段附加列信息、字段关联的维度或指标、字段编辑等。 MySQL
新增 数仓表导引增加不同类型数据源的支持,包括Hive、MySQL、Vertica,并提供筛选功能。 数仓表导引
优化 数据地图记录用户上次登录时的项目集群信息。 -