数据保护 - 数据识别 - 《有数数据开发及管理平台用户手册 V6.5.0 Update》

数据识别

更新时间: 2022-08-09 11:18:00 | 阅读 1230

复制

数据识别功能用于识别敏感字段，可通过库表的设置筛选识别范围。项目负责人、管理员具有使用该功能的权限。

在数据识别页面中，点击新增识别任务可进行识别任务的配置。

任务名称：任务名称由用户自定义，可由汉字、字母、数字组成。
识别范围：识别范围支持当前项目内库的筛选；表的筛选支持全部、枚举及自定义。
- 选择枚举时，可添加表并设置分区字段和分区值（当前分区值不支持azkaban参数，只支持具体的日期格式）。
- 选择自定义时，可通过正则表达式匹配表的内容。
敏感类型：此处选项根据敏感类型功能中的创建的类型而定，默认为银行卡号、手机号、身份证号以及邮箱，支持复选。如果对于选择的敏感类型需要进行脱敏，可勾选配置脱敏按钮，勾选后需要配置相应的脱敏规则。
扫描方式：支持抽样扫描和全表扫描两种扫描方式。选择抽样扫描后可设置识别行数，无数量上限。
生效阈值：生效阈值=命中行数/识别行数，结合识别行数，判断此次识别结果。
完成通知：支持运行成功和运行失败两种结果通知。
通知方式：当前支持邮件、短信、电话等。
任务说明：对识别任务进行补充说明，帮助其他用户了解任务。