azkaban应急预案

    azkaban负载过大

    现象/事件

    Azkaban执行节点机器资源容量不足,比如部分节点宕机,任务数据压力变大等

    影响范围

    对应集群的调度任务

    操作步骤

    1.备用机器升级到最新。

    2.数据库中备用机器设置为active

    3.调用接口reload az web配置,生效新加的备机

    Exec宕机