为解决用户制标门槛高的问题,本产品提供数据元拾取和词根拾取功能,可基于数据库/数据仓库中的元数据信息对字段进行相似性识别,将满足重复阈值或相似度阈值的字段进行提取,圈定数据元/词根划分范围,最后由用户选择是否进行相关数据标准的制定。

数据元拾取

使用步骤及功能页面

创建任务:
a. 进入标准拾取模块,点击新建任务
标准拾取 - 图1
b. 选择拾取内容为数据元,输入任务名称(可点击生成按钮自动生成),配置重复阈值(当拾取结果的频次统计达到重复阈值要求时则被认为有效)
标准拾取 - 图2
c. 配置扫描范围,选择想要拾取数据元的库
标准拾取 - 图3
d. 配置完成后即可保存并运行
标准拾取 - 图4
查看执行结果:
a. 进入任务详情页-最新结果tab,可查看任务执行的结果(注意:仅保留最新结果,每次任务执行都会覆盖之前的结果)
标准拾取 - 图5
b. 查看拾取来源,展开拾取来源,点击任意数据元即可看到当前数据元从那些字段里被提取出的,在后续制定数据元时具备一定的参考意义
标准拾取 - 图6
数据元制定:
a. 点击制定按钮,填写数据元信息,用户可参考来源字段完成数据元制定;若发现有极度相似的数据元也可以选择忽略不继续制定
标准拾取 - 图7
数据元提交:
a. 对于制定完成的数据元,可以进行提交。提交完成后,将在数据元模块创建一条记录,当前我们也支持批量提交
标准拾取 - 图8
标准拾取 - 图9

词根拾取

使用步骤及功能页面

创建任务:
a. 进入标准拾取模块,点击新建任务
标准拾取 - 图10
b. 选择拾取内容为词根,输入任务名称(可点击生成按钮自动生成),配置重复阈值(当拾取结果的频次统计达到重复阈值要求时则被认为有效)
标准拾取 - 图11
c. 配置扫描范围,选择想要拾取词根的库
标准拾取 - 图12
d. 配置完成后即可保存并运行
标准拾取 - 图13
查看执行结果:
a. 进入任务详情页-最新结果tab,可查看任务执行的结果(注意:仅保留最新结果,每次任务执行都会覆盖之前的结果)
标准拾取 - 图14
b. 查看拾取来源,展开拾取来源,点击任意词根即可看到当前词根从那些字段里被拆解出,在后续制定词根时具备一定的参考意义
标准拾取 - 图15
词根制定:
a. 辅助制定,对于词根,我们内置场景的英文词典,可以对拾取结果进行批量补全英文名称即简称,但不保证其准确性,需要用户根据实际的业务进行确认
标准拾取 - 图16
标准拾取 - 图17
b. 人工制定,点击制定按钮,填写简称与全称,用户可参考来源字段完成词根制定
标准拾取 - 图18
词根提交:
a. 对于制定完成的词根,可以进行提交。提交完成后,将在词根模块创建一条记录,当前我们也支持批量提交
标准拾取 - 图19
标准拾取 - 图20