FAQ-实时传输任务状态异常,一直在启动中,如何手动修复状态

问题描述/异常栈
实时传输任务的任务状态异常,一直在启动中 FAQ-实时传输任务状态异常,一直在启动中 - 图1
发现版本
lts9.0
解决方案
解决方案:手动修复
强制终止实时传输任务.
1. rts_submitter 库, 确认任务的状态和 application_id 是否存在. yarn 强制kill application_id
select id, job_id , job_status, application_id from submitter_job_history where job_id = 'ndi_xxxxx' order by id desc limit 10
2. rts_submitter 库, 根据id修改任务的job_status 为 'STTOPED' . 注意同一个任务不要有"RUNNING" 状态.
update rts_submitter.submitter_job_history set job_status='STOPPED' where id=41995;
3. 查询传输数据库, 实时传输任务的状态. 如果不为终态, 修改为 "4" 停止
SELECT id, task_id , status FROM stream_task_v2 where task_id = '1667292618628005504';
update stream_task_v2 set status = 4 where id = xxxx
如果yarn任务kill不掉,可以尝试滚动重启rm,或者具体排查下yarn。
问题原因
任务提交到yarn异常导致。

作者:何焕鑫