入门指南
更新时间: 2022-04-24 14:36:18
阅读 329
产品整体示意
承接数据连接,在数据准备中,用户导入数据源后通过在画布上拖拽节点和连接线实现清洗、聚合、关联等字段级数据处理流程,完成后将流程进行发布,可以在线上模式设置执行计划,进行数据模型的建立。
名词解释
画布:节点、数据流所处的操作空间,用户可以通过连接在这个空间进行编辑操作。
连接:两个节点之间的线段,代表输入关系,连线左侧节点是右侧节点的输入。
节点:节点是用来标注数据的某一个处理过程 ,用户通过节点编排数据流实现数据处理。
视图:计算机数据库中的视图,是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。
发布:意味着将流程从开发模式提交到线上模式,对数据可以进行后续建模处理。
工作区
数据准备中工作区分为三段。左侧为数据连接,用户可以在此添加数据连接;右上为画布,用户可以通过连接和节点在这个空间进行编辑操作;右下为节点视图,点击具体的节点即可展示,用户可以在此进行节点内操作或通过视图查看数据。
1. 画布操作
从左侧拖入表生成输入节点
从节点新建节点
拖拽生成关联节点
拖拽建立连接
2. 视图
在数据准备中,一共提供了三种节点内视图,分别为字段视图、统计视图和数据视图。
- 字段视图仅展示字段,不展示数据。除输入、输出节点外,支持新增计算字段,支持右击字段唤起清洗:重命名、转换数据类型、值替换、数据筛选、复制字段与隐藏。
- 统计视图通过柱状图详细地展示了每个字段的统计信息:数值、行数与 占比。用户可以通过排序更直观地观察数据的形状。 在输入和输出节点,用户只能查看各个字段的统计信息。 除输入和输出节点,用户可以新建计算字段,单击单个值进行值替换,在更多中进行值筛选和值替换。
- 数据视图以二维方式展示详细的数据信息。
文档反馈
以上内容对您是否有帮助?