任务运维支持基线运维方式,在使用基线运维之前,首先需要在值班组管理模块完成值班组的配置,然后再在基线管理模块进行基线配置。
下图为基线管理页面:
基线管理 - 图1

权限控制

基线管理入口在任务运维中心左下角运维配置中,除了项目负责人、管理员之外具有设置基线权限的人员也可访问。基线权限的设置入口位于项目中心 - 权限管理 - 功能权限,如下图所示:
基线管理 - 图2

功能概述

该页面主要用于基线设置,并归属到具体值班组。在任务列表页面将任务挂载到基线上之后,每天线上调度的任务实例的执行就会被纳入基线的监控之中,符合报警条件时,就会发送报警给值班人员。

报警功能说明

每天基线都会生成一个基线实例,并计算出基线上挂载的所有任务,系统会每隔几分钟推算所有任务实例的预计开始时间和结束时间。

对于基线上的实例,如果预计结束时间超过破线时间,则会触发基线报警,根据基线配置的报警方式通知基线所属值班组的当日值班人员。如果预计结束时间超过预警时间,但是未超过破线时间,则也会触发基线报警,此时,若配置了电话、短信、邮件的报警通知方式,只会通过短信和邮件依然会发送。此外,如果基线上任务的实例或上游任务的实例失败时,也会立即出发基线关联实例失败报警,通知所有受影响的基线的值班人员。

基线创建

单击新建基线按钮,在新建基线弹框中完成配置。
Snipaste_2023-07-10_15-53-13.png

配置项 描述
基线优先级 使用L1~L4表示基线优先级,L1为最低优先级;基线优先级支持传递给任务优先级,任务的优先级由其本身的优先级、下游的优先级和基线优先级三者取最高决定。若实例设置了临时优先级,则在有效时间内,实例的临时优先级会覆盖基线传递给任务的优先级;需注意优先级传递非实时。
预警时间 如果系统计算出基线上最晚产出实例的完成时间超过预警时间时,会触发基线报警。
破线时间 指基线任务中所有实例都必须在该时刻前运行成功,是挂载在该基线上的任务的实例产出时间的承诺时间。
报警间隔 指触发基线报警时,异常未处理后重复报名的时间间隔。
免打扰时间 免打扰时间内,告警触发后不会发送通知给接收人,但是在报警历史模块中会记录报警信息。
归属值班组 配置已设置好的值班组。
触发条件 触发条件包括预警、预计破线、已破线、关联实例失败、关联实例变慢。
通知方式 当前支持邮件、电话、短信、popo、stone、企业微信、钉钉等。

编辑基线

对已创建好的基线进行编辑时,除了上述的配置项外,此处还可进行“电话告警智能取消”的配置。默认勾选,表示当基线的预计完成时间超过预警时间但未超过破线时间,系统自动取消电话报警的产生。
Snipaste_2023-07-10_15-55-26.png