操作步骤

1.登录 EasyStream实时计算平台

2.快捷导航栏 选择 实时运维 ,若 快捷导航栏 中无相关选项可参考 快速导航栏 进行操作。

3.左侧边栏单击 运维大盘和全局报警 - 图1 ,进入 运维大盘 页面。

运维大盘和全局报警 - 图2

视图类型 说明
项目-集群视图 对应当前所在工作空间视图,展示工作空间内任务、资源、队列等详情情况。
平台视图 对应实时计算产品概念,统计内容为所有注册实时计算产品的工作空间的总和。

4.通过滚动页面,可查看 任务运行情况、资源使用情况、流量概况 等内容。

内容模块 说明
任务运行情况 展示对应视图下任务总数与不同类型的任务运行状态。
资源使用情况 通过柱状图与折线图,分别展示总计队列资源分配情况与分时队列资源使用情况。支持通过右上角选框切换不同集群与队列进行查看。
流量概况 通过QPS、流量两个角度来展示输入、输出的数据量情况。
关键指标 从消费延迟、反压、CheckPoint耗时、CheckPoint大小、输入QPS、输出QPS、近1小时Failover、资源使用量八个角度进行关键指标监控,在详情列表中可通过单击任务名称进行快捷任务跳转。
告警情况 根据不同告警类型进行统计,单击任务数量可在弹窗中查看对应任务详情,在任务详情中单击任务名可跳转至任务运维的相应详情页面。

5.全局告警

  • 功能介绍:
    • 运维大盘新增项目-集群级或平台级全局告警,可监控对应级别的全部任务,达到配置的告警条件时将向指定用户发出全局报警。同时支持查看历史发出的报警记录。
  • 功能使用注意事项:
    • 在项目-集群视图仅可配置当前项目-集群的全局报警规则,在平台视图仅可配置平台级的全局报警规则。
  • 功能详细使用步骤:
    • 入口:运维大盘右上角-全局报警。
      运维大盘和全局报警 - 图3
      • 报警规则配置:当前支持配置任务运行失败次数、单任务输入/输出QPS、消费延迟、反压、任务告警次数、Failover次数报警。
        运维大盘和全局报警 - 图4
    • 查看报警记录:选择全局报警记录可查看当前页面所在的视图下的全局报警发送记录。
      运维大盘和全局报警 - 图5