azkaban应急预案

azkaban负载过大

现象/事件

Azkaban执行节点机器资源容量不足,比如部分节点宕机,任务数据压力变大等

影响范围

对应集群的调度任务

操作步骤

1.备用机器升级到最新。

2.数据库中备用机器设置为active

3.调用接口reload az web配置,生效新加的备机

Exec宕机