任务运维支持基线运维方式,在使用基线运维之前,首先需要在值班组管理模块完成值班组的配置,然后再在基线管理模块进行基线配置。
下图为基线管理页面:
基线管理 - 图1

权限控制


基线管理入口在任务运维中心左下角运维配置中,仅项目负责人、管理员和具体值班组的负责人可访问。项目负责人、管理员可新增、编辑、关闭、删除所有基线,值班组负责人能查看所有基线。

功能概述


该页面主要用于基线设置,并归属到具体值班组。在任务列表页面将任务挂载到基线上之后,每天线上调度的任务实例的执行就会被纳入基线的监控之中,符合报警条件时,就会发送报警给值班人员。

报警功能说明


每天基线都会生成一个基线实例,并计算出基线上挂载的所有任务,系统会每隔几分钟推算所有任务实例的预计开始时间和结束时间。

对于基线上的实例,如果预计结束时间超过破线时间,则会触发基线报警,根据基线配置的报警方式通知基线所属值班组的当日值班人员。如果预计结束时间超过预警时间,但是未超过破线时间,则也会触发基线报警,此时,若配置了电话、短信、邮件的报警通知方式,只会通过短信和邮件依然会发送。此外,如果基线上任务的实例或上游任务的实例失败时,也会立即出发基线关联实例失败报警,通知所有受影响的基线的值班人员。

基线创建


单击新建基线按钮,在新建基线弹框中完成配置。
基线管理 - 图2

参数信息 说明
基线优先级 表示基线的优先级,在基线设置时配置。目前仅用于提醒值班人员该条基线的重要程度。
预警时间 如果系统计算出基线上最晚产出实例的完成时间超过预警时间时,会触发基线报警。
破线时间 指基线任务中所有实例都必须在该时刻前运行成功,是挂载在该基线上的任务的实例产出时间的承诺时间。
报警间隔 指触发基线报警时,异常未处理后重复报名的时间间隔。
免打扰时间 免打扰时间内,告警触发后不会发送通知给接收人,但是在报警历史模块中会记录报警信息。
归属值班组 配置已设置好的值班组。
通知方式 当前支持邮件、电话、短信、popo、stone、企业微信、钉钉等。