DEOM-公共环境资源监控
适用模块
在内部环境的对接中,经常存在用户因队列资源问题导致任务卡住、停滞、或延迟。而目前的yarn界面仅能查看当时候的max resource和used resource,对夜间凌晨或已过去时间的资源情况的监控无法感知也无法复盘。本篇文章基于目前的EasyEagle监控平台和猛犸平台,介绍如何获取指定队列的资源使用情况以及队列详细信息,以及如何导入hive数仓中进行后续分析。
使用示例
1.常规获取资源使用情况的方法(直接查看yarn界面) 如图,直接展开一个队列查看最大资源和已使用资源的情况。但该方法有局限性,仅使用刚刚提交了一个任务但跑不动,查看当时候也就是此时此刻的资源使用情况。无法查看过去时间段的情况。
2.查看监控平台的情况(联系猛犸值班或线上运维) 可以联系猛犸值班或者运维查看专用的监控平台,这种方法比较麻烦,没法自助,且数据都是图形化的。自己获取不了。
3.通过EasyEagle监控平台的接口自助获取数据 【EasyEagle堆外接口文档】: https://docs.popo.netease.com/lingxi/35c362db69f341ba8f3ed7412399223b#1pMf-1660097179333 注:域名为http://hadoop3593.jd.163.org:6009/
可以使用postman调用查看数据(该种方法需要链接hyvpn,如没有权限请自行申请或查看接下来猛犸的使用方法)
a.确认连接了hyvpn
b.接下来以用postman查看建德十二ad项目凌晨队列使用情况为例
如图所示这样就查询到了ad队列的使用情况【接口信息和参数请查看上面的接口文档链接】
接下来介绍如何用猛犸获取数据并导入数仓
首先还是要get接口文档和域名信息 【EasyEagle堆外接口文档】: https://docs.popo.netease.com/lingxi/35c362db69f341ba8f3ed7412399223b#1pMf-1660097179333 注:域名为http://hadoop3593.jd.163.org:6009/ 使用猛犸的好处是直接是机房网调用,不需要hyvpn且可以直接导入hive表中供用户进行分析
a.在控制台登记api数据源,登记这个域名
b.建hive表,由于api返回字段只有一个response,故只需要塞进hive的一个字段就行。注意类型设置为string,即任意建一张表。有一个string字段即可。
c.建立数据传输任务【猛犸数据传输使用方式请自助学习猛犸用户手册】 注意,字段映射关系要手动把来源修改为response
执行传输任务。成功后自助分析查hive表验证数据。
后续如果要进行数据分析,或者提取拆分字段。直接操作这张hive表即可。至此数据获取成功。
作者:刘思伟 日期:2022-08-11
版本:v1
更新:暂无
以上内容对您是否有帮助?