背景

使用chatbi的客户,随着bi版本的升级,chatbi需要适配bi版本则也需要升级

升级步骤以及注意事项

1.将chatbi的升级包传到chatbi服务器上

lftp -e "mirror -c /chatbi_faq/v1.14.0 /data/chatbi/v1.14.0; exit" -u cloud,Netease@12315803 ftp://59.111.229.42

59.111.229.42是ftp服务器,上面有chatbi服务每个版本的目录,/chatbi_faq下有每个版本的包,选择一个版本将其下载好传到chatbi服务器上即可。传好后需要对比下MD5值,确保包是没问题的。

2.解压升级包,下载镜像

3.关闭原先的chatbi服务

docker stop gensql_tgi
docker stop nezha
docker stop faqtfserver  # v1.18.0之后的版本没有这个服务了

docker stack rm chatfaq

4.将原先版本的license.txt复制到新版本目录下

5.配置文件和脚本修改

在部署GPU容器群的机器上,执行以下修改

修改stack/run_gensql_tgi.sh脚本

根据部署规划步骤中确定的使用哪个GPU,修改CUDA_VISIBLE_DEVICES环境变量,如使用前两块,则设为0,1 根据当前机器端口占用情况,更改PORT环境变量,防止服务使用的端口被占用

修改stack/run_nezha.sh脚本

根据部署规划步骤中确定的使用哪个GPU,修改CUDA_VISIBLE_DEVICES环境变量,如使用第一块,则设为0 根据当前机器端口占用情况,更改PORT环境变量,防止服务使用的端口被占用

修改stack/run_faqtfserver.sh脚本 #v1.18.0之后没有这个服务就不需要了

根据部署规划步骤中确定的使用哪个GPU,修改CUDA_VISIBLE_DEVICES环境变量,如使用第一块,则设为1 根据当前机器端口占用情况,更改PORT环境变量,防止服务使用的端口被占用

在部署CPU容器群的机器上

修改stack/full_stack_cpu.yaml

robot-algorithm-compose服务,修改PHOST为GPU容器群部署的机器地址(不能使用127.0.0.1和localhost,使用局域网ip),PPORT更改为stack/run_faqtfserver.sh中设置的PORT

gensql_app服务,修改BASE_URL_OF_COMPRESS中的IP为GPU容器群部署的机器地址(不能使用127.0.0.1和localhost,使用局域网ip),端口为stack/run_nezha.sh中设置的PORT;修改NL2SQL_URL中的IP为GPU服务群部署的机器地址(不能使用127.0.0.1和localhost,使用局域网ip),端口为stack/run_gensql_tgi.sh中设置的PORT

6.启动服务

更改完配置文件后,就可以按顺序启动服务了,可以参考https://study.sf.163.com/documents/read/privatization/ywcz111 这篇文章来启动服务。

注意事项

执行run_gensql_tgi.sh脚本启动gensql_tgi服务,日志报错有license expierd字段即是license过期,需要借鉴 https://study.sf.163.com/documents/read/privatization/ywcz110 这个文档来更换license,再启动服务。

以上就是chatbi升级的步骤。