版本:v1.8.8

新增功能

1.新增任务诊断功能

  • 功能介绍:
    • 新增任务诊断的单独模块,支持调度依赖诊断(原血缘诊断)与Spark性能诊断。支持将任务加入诊断白名单,加入诊断白名单后的任务将不会出现在异常任务列表中;在任务详情页面可以查看诊断详细信息。
  • 注意事项:
    • Spark性能诊断,需要用户部署easyeagle 2.x版本才可使用。

功能优化

1.补数据支持发送报警给报警组

  • 功能介绍:
    • 用户创建补数据任务时,可以在通知设置中选择接收人为报警组。

2.基线支持配置触发条件

  • 功能介绍:
    • 基线编辑页面支持配置触发条件,触发条件包括预警、预计破线、已破线、关联实例运行失败、关联实例运行变慢、基线完成。

版本:v1.8.7

新增功能

1.新增节点诊断功能

  • 功能介绍:
    • 实例开始运行后,各节点按照依赖关系依次执行,但由于某些原因,节点未能正常执行,包括依赖未满足、设置了重试延迟等情况,用户排查问题往往链路长、定位难。针对这种情况,任务运维中心将原先的实例诊断进行升级,支持节点粒度的诊断,针对节点未执行、执行使用的资源情况以及执行失败,从三个维度来对节点进行诊断,即执行诊断、成本诊断和结果诊断,帮助用户快速定位问题,迅速解决问题。
  • 注意事项:
    • 节点的成本诊断,需要用户部署easyeagle 2.x版本才可使用。

2.支持实例诊断

  • 功能介绍:
    • 基线的优先级从高中低调整为L1到L4,基线的优先级支持传递给任务,从而实现任务的统一管控,仅需将高优先级的任务挂在相应基线上,就可以实现重要任务的统一管理。
  • 注意事项:
    • 原先优先级为高的基线此次升级后显示为L3,原先优先级为中的基线此次升级后显示为L2,原先优先级为低的基线此次升级后显示为L1。

3.新增基线智能免打扰功能

  • 功能介绍:
    • 当出现任务运行变慢等异常情况后,基线会及时发送预警等报警信息,但有时运维人员将问题处理以后,由于基线计算出仍然处于预警或预计破线状态时,告警会继续发送,对运维人员造成困扰。因此任务运维中心提供智能免打扰功能,在开启智能免打扰功能后,同一实例引发的告警信息将不再发送,若基线检测到告警原因变化,则会继续正常发送告警。
  • 注意事项:
    • 仅基线当天的值班人员有权限开启智能免打扰功能

4.实例支持批量置成功

  • 功能介绍:
    • 实例支持批量置成功,在实例列表中选中需要置成功的实例后,可一键置成功。

5.支持单个任务和批量任务修改首次执行时间

  • 功能介绍:
    • 当任务因为某些原因出现实例堆积的问题时(例如十分钟调度的任务,当前时间还在执行1个小时前的任务,但实际已经不需要这一批过期实例),此时可以使用修改首次执行时间的功能,将首次执行时间调整为当前最近的一次调度计划执行时间,则计划执行时间在最新首次执行时间之前的未就绪实例会被取消,任务将从最新首次执行时间开始调度。
  • 注意事项:
    • 若任务编辑调度需要走审批,或正在审批流程中,则不支持修改首次执行时间,需前往离线开发编辑调度并走流程审批。

功能优化

1.任务列表与实例的批量操作按钮优化

  • 功能介绍:
    • 任务列表与实例列表的批量操作按钮从页面上方同一调整到页面下方。

2.重试记录详情中增加展示重试间隔

  • 功能介绍:
    • 重试记录详情中增加展示重试间隔,同时增加文案说明:开始时间会包含重试间隔。节点真正开始的时间为显示的开始时间加上重试间隔的时间。

3.加速器增加显示操作记录

  • 功能介绍:
    • 管理员可以操作加速器,在资源紧张的情况下优先保障重要任务的产出,此次版本升级后,加速器支持查看操作记录,方便管理加速器的使用。

4.实例血缘图中支持右键重跑

  • 功能介绍:
    • 实例血缘图中支持右键重跑,不需要跳转到对应实例详情页面再进行重跑操作。

版本:v1.8.6

新增功能

1.补数据支持补上游数据

  • 功能介绍:
    • 在业务场景中经常会碰到下游的任务出现问题,需要上游重新调度起来,但是由下游去反推到上游只能由人工去定位上游的任务,然后再从上游开始补数据,操作复杂。此次更新任务运维中心将支持在创建补数据任务时,自定义补数范围,包括仅下游任务、仅上游任务和上下游任务。

2.支持实例诊断

  • 功能介绍:
    • 实例诊断通过将实例的生命周期分为三个阶段,实例准备、实例提交和实例运行,有针对性地对不同阶段实例进行各项检查,从而帮助用户快速定位到实例的问题原因,例如实例到了就绪时间却未生成,实例被系统终止以及任务运行失败等异常情况。

功能优化

1.重跑时支持上游依赖判断

  • 功能介绍:
    • 当由于某些原因出现任务大批量失败,导致任务依赖的下游都被终止时,用户想要重跑上下游实例,往往需要按照依赖关系去重跑上下游,但原先任务运维中心批量重跑操作会一次性拉起所有实例进行重跑,不再校验其上游依赖,导致任务会出现重跑时上游并非成功而导致下游产出数据异常的问题。此次升级后,在批量和单个重跑任务的时候,会保留任务的依赖关系,如果系统检测到被重跑任务所依赖的上游不满足依赖条件,下游会处于就绪等待上游的状态,直到上游成功后,下游才会开始正常运行。如果用户不需要判断依赖,则可以选择强制重跑。

2.支持快捷筛选已到计划执行时间但未就绪的实例

  • 功能介绍:
    • 实例未就绪时,可能是因为未到达计划执行时间,也可能是因为上游依赖未完成,或是任务已被加入冻结池等原因,支持用户快捷筛选已到计划执行时间但未就绪的实例,从而及时发现被阻塞的异常实例。