概述

数据标准产品,是实践EasyData数据开发一体化的起点,通过制定数据元、字典、词根、数据元分类等,为后续数据开发提供一致性、准确性和完整性的规范性约束。

其中,词根的生成,非常依赖客户环境已有的元数据,且从海量元数据中进行词根拾取也是非常耗时的工程。目前,内置算法的分词功能,已经在很大程度上解决了配置效率的问题。

而EasyCopilot的词根拾取能力,则进一步提升了失去的效率和准确性。据内部测算,在2500+个字段的测试中,分词准确性可达到94.0%,通过额外定义专有词根(比如社会统一信用代码、节假日、苹果手机等),可达到95.8%。

功能入口

AI数据标准词根拾取功能的入口,目前有两个位置可以触发:

1)第一个是在“标准拾取”的新建任务,保存并运行时,可以在弹窗中支持选择“分词及补全方案”,这里可以选择"AI"选项。

功能与使用 - 图1

2)第二个在“标准拾取”列表的操作列,“更多“下有”运行“,点击后,同样会出现“分词及补全方案”的选项。

功能与使用 - 图2

功能与使用 - 图3