配置数据来源与去向

完成基本信息填写后,首先需要在数据来源配置离线同步任务节点的读取端数据源,以及需要同步的表等信息。

  • API类型 API - 图1

  • 数据来源

基本信息 说明
数据源 必填项,选择数据源类型为API的选项
请求类型:目前支持POST、GET两种类型,后面需要输入API的路径信息
新建数据源:当API选择不到,需要新增API,点击“新建数据源”按钮添加API信息
API - 图2
查找方式 必填项,选项为库表选择正则匹配,默认为库表选择:
库表选择:支持搜索或直接选择数据库表
正则匹配:通过正则表达式来匹配数据表
Headers 填写API的 Header信息,填写属性和值信息,点击添加可新增行列,点击删除按钮删除行列API - 图3
Params 填写API的Params信息,点击添加可新增行列,删除去掉行列API - 图4
body 填写Api的Body信息,复制源API的json数组信息
前置处理 可以开启或者关闭,用于对API传输前的前置处理,如通过UDF函数对数据进行简单的处理,可以点击查看函数使用说明,也可以点击前往UDF市场进行查看和创建UDF函数API - 图5
数据主体 从返回结果中查询单个JSON对象或者JSON数组的路径,请填写JSONPath表达式,例如:{ "id":1,"name":"xx1”}。
返回数据结构 必填,单选,单条数据和数组数据,如数据主体为对象,请选择“单条数据”,会将对象中的单行数据抽取为一条同步记录;如数据主体为数组,请选择“数组数据”,会将数组中的多行数据抽取为多条同步记录
启动分页 选填,打开开关后,分页方式:需要选择分页方式pageSize&pageNumber、offset&limit两个选项;总量字段:返回结果中表示API请求获取到的返回记录总数的字段的JSON路径,请填写JSONPath表达式。
空字段处理 必填,当一条数据解析时,Json路径中找不到字段时的处理方式,默认选项为任务报错、也可以选择设置为null数据填充,任务继续执行
超时时间 数据获取超时的最大允许时间。如果API接口返回数据耗时超过数据获取超时时间,则数据获取失败并任务报错。单位为秒,必填,可以填写数字。
特殊字符替换 可以选填,用户可以对数据主题中的一些特殊字符进行转换
1.不可见字符请使用Unicode编码表示。 2.使用下列字符:|、^、$、.、*、\、?、+、{ 、}、[、 ]、( 、)时,请在字符前添加"\"来表示。示例:“|”字符表示为“|”。 3.需要替换多个特殊字符时,字符间请使用“,”分隔。不支持替换“,”字符。默认不填写替换值则会被替换为空置,使用添加、删除按钮新增行数
数据预览 全部配置完成之后,可以点击数据预览,预览数据传输API的数据结构。
特殊说明:
API作为来源数据源需要提前调试好,并且在数据源内注册完成后再来创建对应的数据传输任务