Alluxio 对接步骤
Alluxio 对接步骤
按以下顺序操作
确认对接了alluxio的基础组件全部安装完成,列表如下
| 服务 | 必选 |
|---|---|
| yarn | 是 |
| spark2 | 是 |
| hive | 是 |
| hdfs | 是 |
| httpfs | 是 |
| kuyybi | 可选 |
| impala | 可选 |
查看部署azkaban exec服务的机器(建议azkaban四个组件fc,web,exec,lib部署在同一个机器上)
在azkaban exec部署的机器上,扩容以下组件:
| 服务 | 组件 | 是否必选扩容 | 其他 |
|---|---|---|---|
| easy_test | client | 如果安装了easy_test实例,必选 | |
| easy_dqc | client | 如果安装了easy_dqc实例,必选 | |
| easy_transfer | client | 如果安装了easy_transfer实例,必选 | |
| yarn | client | 必选 | 对接了alluxio的yarn |
| spark2 | client | 必选 | 对接了alluxio的spark2 |
| hive | client | 必选 | 对接了alluxio的hive |
| alluxio | worker | 必选 |
修改对接alluxio的基础组件高级选项
| 服务 | 字段名 | 类型 | 值 |
|---|---|---|---|
| yarn | fs.defaultFS | string | alluxio://node2.local:19998(样例),取值来自alluxio实例的master配置组的配置项alluxio.master.rpc.addresses,注意添加alluxio://前缀;如果是多个用逗号分隔的地址,只取一个地址即可 |
| yarn | nameservice | string | alluxio_hdfs |
| spark2 | nameservice | string | alluxio_hdfs |
| hive | nameservice | string | alluxio_hdfs |
| hdfs | fs.defaultFS | string | alluxio://node2.local:19998(样例),取值来自alluxio实例的master配置组的配置项alluxio.master.rpc.addresses,注意添加alluxio://前缀;如果是多个用逗号分隔的地址,只取一个地址即可 |
| hdfs | fs | string | alluxio |
| httpfs | nameservice | string | alluxio_hdfs |
| kuyybi | nameservice | string | alluxio_hdfs |
| impala | nameservice | string | alluxio_hdfs |
安装对接alluxio的azkaban实例
修改安装默认依赖
| 服务 | 操作 |
|---|---|
| hdfs | 去掉默认选择的hdfs依赖 |
| yarn | 去掉默认选择的yarn依赖,只选择对接了alluxio的yarn |
| spark2 | 去掉默认选择的spark2依赖,只选择对接了alluxio的spark2 |
| hive | 去掉默认选择的hive依赖,只选择对接了alluxio的hive |
| alluxio | 选择依赖 |
| zookeeper | 不要和原有集群部署的az使用同一个zk服务 |
| mysql | 由约定的部署架构决定,如果选择和对接其他集群的az共用一个mysql的话,不修改依赖 |
修改高级选项
| 字段名 | 类型 | 值 |
|---|---|---|
| nameservice | string | alluxio_hdfs |
修改默认配置
| 配置项组 | 配置 | 默认值 | 修改后建议值 | 备注 |
|---|---|---|---|---|
| mysql | db_name | azkaban | azkaban_alluxio | 由约定的部署架构决定,如果选择和对接其他集群的az共用一个mysql的话,按建议值修改;不依赖同一个mysql,不要此修改 |
| mysql | db_user | azkaban | azkaban_alluxio | 由约定的部署架构决定,如果选择和对接其他集群的az共用一个mysql的话,按建议值修改;不依赖同一个mysql,不要此修改 |
| mysql | db_password | azkaban@163 | azkaban_alluxio | 由约定的部署架构决定,如果选择和对接其他集群的az共用一个mysql的话,按建议值修改;不依赖同一个mysql,不要此修改 |
| global | cluster.name | alluxio_hdfs |
另存配置组,且应用配置到所有组件
安装azkaban
mammut
新增对接alluxio的组件依赖
| 服务 | 操作 | 必选 |
|---|---|---|
| hdfs | 新增对接了alluxio的hdfs | 是 |
| yarn | 新增对接了alluxio的yarn | 是 |
| spark2 | 新增对接了alluxio的spark2 | 是 |
| hive | 新增对接了alluxio的hive | 是 |
| azkaban | 新增对接了alluxio的azkaban | 是 |
| httpfs | 新增 | 是 |
| kuyybi | 新增对接了alluxio的kuyybi | 如果安装,必选 |
| impala | 新增对接了alluxio的impala | 如果安装,必选 |
重启并勾选同步配置
metahub
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| hive | 新增对接了alluxio的hive |
升级到4.0.7.2版本以上
hadoop-meta
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| yarn | 新增对接了alluxio的yarn |
| hdfs | 新增对接了alluxio的hdfs |
| alluxio | 新增 |
确认alluxio的worker是否已部署在hadoop meta kdc组件所在的机器上
查询对接alluxio的yarn实例的resourcemanager组件所在的机器,在该组机器上部署scheduler组件
查询service组件所在的机器,确认对接alluxio的yarn的client组件已部署在这台机器上
重启并勾选同步配置
选择一个mammut项目申请alluxio集群,并审批新集群成功
easy_dqc
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| azkaban | 新增对接了alluxio的azkaban |
| yarn | 新增对接了alluxio的yarn |
高级选项
部署在对接alluxio的azkaban exec所在机器上的client需要添加高级选项
| 字段名 | 类型 | 值 |
|---|---|---|
| nameservice | string | alluxio_hdfs |
重启并勾选同步配置
easy_transfer
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| azkaban | 新增对接了alluxio的azkaban |
backend服务重启并勾选同步配置
easy_test
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| azkaban | 新增对接了alluxio的azkaban |
backend重启并勾选同步配置
easy_taskops
新增对接alluxio的组件依赖
| 服务 | 操作 |
|---|---|
| azkaban | 新增对接了alluxio的azkaban |
| yarn | 新增对接了alluxio的yarn |
| spark2 | 新增对接了alluxio的spark2 |
backend重启并勾选同步配置
新集群hive血缘插件配置
修改配置
| 配置项组 | 配置 | 类型 | 值 |
|---|---|---|---|
| lineage.xml | lineage.hive.catalog | string | alluxio_hdfs_hive_catalog |
同步配置,重启hiveserver, metastore
新集群spark血缘插件配置
修改配置
| 配置项组 | 配置 | 类型 | 值 |
|---|---|---|---|
| lineage_xml | lineage.hive.catalog | string | alluxio_hdfs_hive_catalog |
| spark-defaults.conf | spark.lineage.hive.catalog | strint | alluxio_hdfs_hive_catalog |
同步配置
以上内容对您是否有帮助?