报警历史页面承载了基线的相关的报警数据,包括任务失败/超时节点失败/超时数据质量监控异常/检测失败基线报警-预警基线报警-预计破线基线报警-已破线基线关联实例失败报警。

下图为报警历史页面:
报警历史 - 图1

基线报警-预警、基线报警-预计破线和基线报警-已破线是基线报警的细分,具体定义如下:

参数信息 说明
基线报警-预警 预计基线上任务实例的完成时间超过基线设置的预警时间,但是不超过破线时间,此时触发基线报警状态为预警。
基线报警-预计破线 预计基线上任务实例的完成时间超过基线设置的破线时间,此时触发基线报警状态为预计破线。
基线报警-已破线 基线上任务实例的实际完成时间已超过破线时间,此时触发基线报警状态为已破线。
基线报警-已破线 基线上的任务或上游未挂载在基线上的任务,如果实例运行失败或终止,此时会触发基线关联实例失败。

基线报警


对于基线报警,如果在基线报警最小间隔时间之外,系统发现基线的预计完成时间仍然会超过基线的预警时间或破线时间,则系统会触发新的一条基线报警,直到基线完成或到达第三天。因此同一条基线的“基线报警”可能会反复发送。如果用户认为当前延迟不可避免,又想减少报警,可在基线运维中对基线配置免扰设置

基线关联实例失败


对于基线关联实例失败报警,一旦实例失败就会报警,只要没有产生成功的实例或值班人员执行响应操作,则系统会基于老的报警再次做提醒。因此其提醒次数可能会逐渐增加。

报警响应


在操作上,当日值班人员可对报警进行响应,响应信息会反馈到报警响应信息中,显示响应速度以及响应时间。响应的数据会在周期实例大盘值班运维概况中提醒。进行响应后,系统会有快捷跳转功能,前往周期实例运维列表也筛选出具体的实例,或者前往基线诊断页面,让值班人员更快进行问题排查。

下图为报警响应之后显示的响应数据:
报警历史 - 图2

如果报警响应状态处于未响应,点击详情可查看报警详情。
报警历史 - 图3

报警详情中展示报警发送明细,如果状态为发送失败可通过图标报警历史 - 图4查看原因。通常发送失败的原因包括:手机号有误、邮箱有误、人员离职等。
报警历史 - 图5