报警历史
更新时间: 2022-01-12 17:21:10
阅读 666
报警历史页面承载了基线的相关的报警数据,包括任务失败/超时、节点失败/超时、数据质量监控异常/检测失败、基线报警-预警、基线报警-预计破线、基线报警-已破线和基线关联实例失败报警。
下图为报警历史页面:
基线报警-预警、基线报警-预计破线和基线报警-已破线是基线报警的细分,具体定义如下:
参数信息 | 说明 |
---|---|
基线报警-预警 | 预计基线上任务实例的完成时间超过基线设置的预警时间,但是不超过破线时间,此时触发基线报警状态为预警。 |
基线报警-预计破线 | 预计基线上任务实例的完成时间超过基线设置的破线时间,此时触发基线报警状态为预计破线。 |
基线报警-已破线 | 基线上任务实例的实际完成时间已超过破线时间,此时触发基线报警状态为已破线。 |
基线报警-已破线 | 基线上的任务或上游未挂载在基线上的任务,如果实例运行失败或终止,此时会触发基线关联实例失败。 |
基线报警
对于基线报警,如果在基线报警最小间隔时间之外,系统发现基线的预计完成时间仍然会超过基线的预警时间或破线时间,则系统会触发新的一条基线报警,直到基线完成或到达第三天。因此同一条基线的“基线报警”可能会反复发送。如果用户认为当前延迟不可避免,又想减少报警,可在基线运维中对基线配置免扰设置。
基线关联实例失败
对于基线关联实例失败报警,一旦实例失败就会报警,只要没有产生成功的实例或值班人员执行响应操作,则系统会基于老的报警再次做提醒。因此其提醒次数可能会逐渐增加。
报警响应
在操作上,当日值班人员可对电话报警进行响应,并得到响应时间。响应的数据会在周期实例大盘的值班运维概况中提醒。进行响应后,系统会有快捷跳转功能,前往周期实例运维列表也筛选出具体的实例,或者前往基线诊断页面,让值班人员更快进行问题排查。
下图为报警响应之后显示的响应数据:
文档反馈
以上内容对您是否有帮助?