本文将为您介绍 EasyStream 中如何创建 StarRocks 类型流表。

操作步骤

  1. 在流表管理页面,单击目标逻辑库,表单页面左上角显示对应库名表示切换成功。
  2. 单击 创建表 按键,进行表创建。
  3. 选择 数据源类型StarRocks
  4. 完成剩余表单内容,创建 starrocks 流表。

字段映射类型

StarRocks Flink 数据类型
STRING STRING
INT INT
DATE DATE
TIMESTAMP TIMESTAMP
TINYINT TINYINT
SMALLINT SMALLINT
BIGINT BIGINT

流表配置

配置名称 是否必填 配置生效类型 参数值字段类型 参数默认值 参数说明
sink.buffer-flush.enqueue-timeout-ms 可选 目标表 Long 600000L 提交到 flushQueue 的超时时间,单位为毫秒。
sink.buffer-flush.interval-ms 可选 目标表 Long 300000L 自动触发批量数据写入的时间间隔,单位为毫秒。
sink.buffer-flush.max-bytes 可选 目标表 String 90m 单次写入数据的最大字节数。
sink.buffer-flush.max-rows 可选 目标表 Long 500000L 单次写入数据的最大行数
sink.connect.timeout-ms 可选 目标表 Integer 1000 连接到 load-url 的超时时间,单位为毫秒。
sink.ignore.update-before 可选 目标表 Boolean true 是否忽略 update_before 记录。通常情况下,update_beforeupdate_after 会有相同的主键,并成对出现,因此我们只需要将 update_after 记录写入 StarRocks/Doris,并忽略 update_before。但这并非总是如此,例如,如果用户在 OLTP 中更新了一行数据并更改了主键,Flink CDC 会生成一条 before 和一条 after 记录,但它们具有不同的主键。在这种情况下,连接器应该删除 update_before 行,并将 update_after 行插入 StarRocks,因此在这种情况下应该将此选项设置为 false。请注意,如何设置此选项取决于用户的具体情况。
sink.label-prefix 可选 目标表 String 流加载标签的前缀。可用值范围为 [-_A-Za-z0-9]。
sink.max-retries 可选 目标表 Integer 3 写入记录到数据库失败后的最大重试次数。
sink.parallelism 可选 目标表 Integer 定义 sink 算子的并行度。
sink.semantic 可选 目标表 String at-least-once 容错保证:至少一次(at-least-once)或精确一次(exactly-once)。