整体说明

资源运维,是项目粒度的产品模块。tab栏选择集群后,支持展示该项目-集群的Yarn队列列表,会展示Yarn队列的资源使用情况。
权限说明:仅项目负责人/项目管理员支持设置报警,仅有实例的终止权限的用户支持终止实例,其余查看类型的操作项目内任意成员均可操作。

功能入口:

资源运维 - 图1

队列列表页

资源运维 - 图2

tab栏选择集群后,支持展示该项目-集群的Yarn队列列表,查看各队列的内存/CPU配额和使用率。

资源运维 - 图3

此外,支持对队列的内存使用率、CPU使用率、排队中作业数设置报警。

队列详情页

队列列表页,点击队列名称,跳转至队列详情页。

队列详情页,支持查看该队列的基本信息和当前资源使用情况。

资源运维 - 图4

支持查看指定时间范围内的运行实例列表及其资源使用情况,针对运行中的实例支持终止实例。点击实例ID左侧的展开符,支持查看实例下MR、Spark、SQL(执行引擎为Spark或Hive)节点的资源使用情况,并支持对节点进行资源诊断。

资源运维 - 图5

支持查看该队列的资源监控图。

资源运维 - 图6

队列详情页

资源诊断页,支持查看节点下各application的资源使用情况和诊断结果,针对Spark类节点支持提供内存参数调优建议。