NoSQL - Redis - 《数据开发与治理平台Easydata用户手册-V8.0 Update11》

Redis

更新时间: 2024-12-04 15:34:24 | 阅读 29

扫码

复制

导出

使用前提
Redis作为数据去向

离线同步任务支持Redis数据源，支持该数据源的导入（Writer），当前支持的版本为：5.0。

说明：当前支持写入redis数据源的spark版本为2.3.2。

使用前提

在使用之前需要在项目中心（新）完成Redis数据源的登记并测试通过。
数据源登记过程中，需要填写如下信息：

数据源名称：Redis数据源的名称
数据源标识：仅允许包含英文小写、数字、下划线，只允许英文小写开头，最大长度为64个字符。平台内唯一，保存数据源后数据标识不可修改
归属项目：由于元数据中心是项目组级别，因此此处支持选择项目组下的项目，默认为当前项目名称
负责人：默认为当前创建人员
协助管理员：同负责人，有该数据源的管理权限，包括编辑、设置“源系统账号映射”。可在安全中心为自己或其他人设置该数据源的使用权限
集群部署模式：cluster模式、single模式和sentinel模式，其中single模式和sentinel模式用于实时计算
host：输入host，格式为ip:port，多个host通过","分割
密码：填写密码
版本：5.0
自定义属性：支持添加数据源的其它配置

唯一性校验规则：基于数据源连接进行校验。

数据源配置完成后，需点击测试连接按钮进行测试，测试通过后才可使用。

除了数据源需要准备之外，进行离线同步任务创建和数据源的使用都需要在安全中心-功能权限中添加相应的权限（可参考数据传输权限、元数据中心权限)。

Redis作为数据去向

Redis作为数据去向需要配置如下内容：

数据源：选择Redis和已经登记的数据源
Key索引：Key索引由自定义输入项和指定作为Key的去向端字段构成
- 自定义输入项可选填，默认填充"{source_table}:"，支持输入常量、参数、分隔符。"{source_table}:"为源表表名，当源端为多表时，取首张表的表名；当源端为FTP、HDFS时，取数据目录；当源端表由正则匹配或通配符匹配指定时，取匹配表达式。":"为{source_table}和作为Key的首个去向端字段之间的分隔符
- 字段名称支持输入多个字段，字段间以";"分隔，字段名称与字段映射填写的去向表字段名称需保持一致
Key分隔符：写入Redis的Key分隔符，默认为"_"，如果有多个来源表字段需要拼接时，建议填写该配置项，示例：Key=${source_table}:key1_key2。如果只有一个字段，则忽略该配置项。不可见字符请使用Unicode编码表示
批量条数：一次性批量提交的记录数大小，默认为1000。该值可以极大减少数据同步系统与Redis的网络交互次数，并提升整体吞吐量，但是如果该值设置过大，会导致数据同步运行进程OOM异常，因此请根据环境合理设置
缓存失效时间：Redis Key值缓存失效时间，单位为秒。如果不填该配置项，则该配置项取值默认为0，表示永久有效
写入数据类型：支持string、hash两种类型
写入数据格式：支持json方式写入、分隔符分隔写入两种方式。当写入数据格式为分隔符分隔写入时，需要配置写入分隔符
- 写入分隔符：写入Redis的Value之间的分隔符。如果源数据有多列作为Value，该值为必填项，例如value1_value2。如果源数据只有1列作为Value，则忽略该配置项。不可见字符请使用Unicode编码表示。
写入规则：支持upsert，当key索引冲突时，如果与原记录写入数据的类型相同就更新记录，如果不同就保持原记录

以上内容对您是否有帮助？

鼠标选中文档，精准反馈问题

选中存在疑惑的内容，即可快速反馈问题，我们会跟进处理

不再提示我知道了

文档反馈