数据开发

创建任务

在任务页面新建一个 SQL 任务,具体方法请参考 新建任务 章节。

新建任务

编写业务逻辑

  1. --SQL
  2. --********************************************************************--
  3. --Author: admin
  4. --CreateTime: 2021-06-28 15:23:47
  5. --Comment: Mysql维表Join
  6. -- 源表:一张商品上架表,包含有商品ID、商品类型、商品上架时间、商品价格数据。
  7. -- 维表:商品信息表, 包含商品ID, 商品名称
  8. -- 输出表:输出源表所有的内容,并加上源表和维表通过商品ID进行关联后得到的商品名称
  9. --********************************************************************--
  10. set
  11. 'goods.connections.group.id' = 'mysql_join_example';
  12. --设置Kafka消费者组id
  13. set
  14. 'goods.connector.startup-mode' = 'latest-offset';
  15. --设置读取消息队列的位置
  16. set
  17. 'goods_join_mysql_sink.connector.write.flush.max-rows' = '1';
  18. --设置写入数据缓存量为1行,此行为非必设参数
  19. create view v1 as
  20. select
  21. PROCTIME() as proctime,
  22. itemID,
  23. itemType,
  24. onSellTime,
  25. price
  26. from
  27. poc.goods;
  28. insert into
  29. `poc_mysql`.`poc`.`goods_join_mysql_sink`
  30. select
  31. v1.itemID,
  32. v1.itemType,
  33. v1.onSellTime,
  34. v1.price,
  35. goods_info.itemName as itemName
  36. from
  37. v1 left join `poc_mysql`.`poc`.`goods_info` FOR SYSTEM_TIME AS of v1.proctime on v1.itemID = goods_info.itemID;

设置运行配置

在任务页面右侧可进行运行配置,如果不设置,系统会按照默认值运行。

运行配置

配置好参数之后,就可以点击启动按钮将任务提交到 YARN 集群上运行了。