关系型数据库 - MySQL - 《有数数据开发及管理平台用户手册 V6.5.0 Update》

MySQL

更新时间: 2022-08-09 11:18:33 | 阅读 353

复制

离线同步任务支持MySQL，支持该数据源的抽取（Reader）和导入（Writer），当前支持的版本为：5.7、8.0.23。

在使用之前需要在项目中心（新）完成MySQL数据源的登记并测试通过。
数据源登记过程中，需要填写如下信息：

源系统账号鉴权：源系统账号鉴权开关，仅在首次登记数据源时可配置生效，保存后不可修改。对于开启的数据源，保存后会自动进入该数据源的详情页。在数据源的详情页可以编辑该数据源，添加本平台账号和源系统账号的映射关系（可参考源系统账号映射）
数据源名称：MySQL数据源的名称
数据源标识：仅允许包含英文小写、数字、下划线，只允许英文小写开头，最大长度为64个字符。平台内唯一，保存数据源后数据标识不可修改
归属项目：由于元数据中心是项目组级别，因此此处支持选择项目组下的项目，默认为当前项目名称
负责人：默认为当前创建人员
协助管理员：同负责人，有该数据源的管理权限，包括编辑、设置“源系统账号映射”。可在安全中心为自己或其他人设置该数据源的使用权限
版本：支持选择5、8
数据源连接：根据jdbc:mysql://ServerIP:Port/Database格式进行填写
用户名：填写访问数据源的用户名
密码：填写用户名所对应的密码
自定义属性：支持添加数据源的其它配置

数据源配置完成后，需点击测试连接按钮进行测试，测试通过后才可使用。

除了数据源需要准备之外，进行离线同步任务创建和数据源的使用都需要在安全中心-功能权限中添加相应的权限（可参考数据传输权限、元数据中心权限)。

以MySQL to Hive为例，在数据来源端选择MySQL数据源类型及数据源名称，选择需要进行读取的schema和表。
MySQL数据源支持库表选择和正则匹配。

MySQL数据源支持全量初始化:

数据过滤支持条件、流水型及自定义。

条件型：按列设置过滤规则，可添加一或多组条件，条件默认为AND关系。
流水型：从选择字段的起始值开始读取数据，读取到最新记录位置，下次从上次的最新记录读取至当前的最新记录。流水型数据过滤方式生效满足以下条件：1. 选取的字段是单调递增的；2. 离线开发任务提交到线上调度执行。
自定义：填写where过滤语句（不含where关键字），通常用作增量同步，支持系统参数和参数组参数。

特殊字符替换、并发读取、流量控制根据实际情况进行填写。