关系型数据库 - PostgreSQL - 《数据开发与治理平台Easydata用户手册-V8.0 Update11》

PostgreSQL

更新时间: 2024-12-04 15:39:23 | 阅读 40

复制

离线同步任务支持PostgreSQL，支持该数据源的抽取（Reader）和导入（Writer），当前支持的版本为：8.2、8.4、12.4、13.1、13.2。

在使用之前需要在项目中心（新）完成MySQL数据源的登记并测试通过。
数据源登记过程中，需要填写如下信息：

数据源名称：PostgreSQL数据源的名称
数据源标识：仅允许包含英文小写、数字、下划线，只允许英文小写开头，最大长度为64个字符。平台内唯一，保存数据源后数据标识不可修改
归属项目：由于元数据中心是项目组级别，因此此处支持选择项目组下的项目，默认为当前项目名称
负责人：默认为当前创建人员
协助管理员：同负责人，有该数据源的管理权限，包括编辑、设置“源系统账号映射”。可在安全中心为自己或其他人设置该数据源的使用权限
数据源连接：根据jdbc:postgresql://ServerIP:Port/Database格式进行填写
用户名：填写访问数据源的用户名
密码：填写用户名所对应的密码
schema：如果填写schema，可使用登记数据库中该schema下所有用户账号有权限的表；如果未填写schema，可使用登记数据库中所有schema下用户账号有权限的表
自定义属性：支持添加数据源的其它配置

唯一性校验规则：基于数据源连接+用户名+schema进行校验。

数据源配置完成后，需点击测试连接按钮进行测试，测试通过后才可使用。

除了数据源需要准备之外，进行离线同步任务创建和数据源的使用都需要在安全中心-功能权限中添加相应的权限（可参考数据传输权限、元数据中心权限)。

以PostgreSQL to Hive为例，在数据来源端选择PostgreSQL数据源类型及数据源名称，选择需要进行读取的schema和表。

数据过滤支持条件、流水型及自定义。

条件型：按列设置过滤规则，可添加一或多组条件，条件默认为AND关系。
流水型：从选择字段的起始值开始读取数据，读取到最新记录位置，下次从上次的最新记录读取至当前的最新记录。流水型数据过滤方式生效满足以下条件：1. 选取的字段是单调递增的；2. 离线开发任务提交到线上调度执行。
自定义：填写where过滤语句（不含where关键字），通常用作增量同步，支持系统参数和参数组参数。

特殊字符替换、并发读取、流量控制根据实际情况进行填写。

以Hive to PostgreSQL为例，当PostgreSQL作为数据去向时，除了需要填写数据源类型、数据源等基础信息之外，还可以填写PreSql和PostSql。

PostgreSQL当前只支持INSERT INTO写入规则。流量控制可根据实际情况进行填写。

鼠标选中文档，精准反馈问题

选中存在疑惑的内容，即可快速反馈问题，我们会跟进处理

不再提示我知道了

文档反馈