数据标准子产品,是实践EasyData数据开发一体化的起点,通过制定数据元、字典、词根、数据元分类等,为后续数据开发提供一致性、准确性和完整性的规范性约束。尤其是词根,可在后续维度建模子产品设计表时,基于中文名称推荐对应的英文标识,助力数据建设的规范化。

    在数据标准子产品中有一项“标准拾取”的功能,可支持基于客户已有的表元数据或本地数据,完成词根和数据元的制定。

    在原本的功能里,平台内置了算法分词功能,可在一定程度上实现自动分词和生成英文标识的功能。此次,EasyCopilot朝着提升分词和翻译准确性的目标出发,在标准拾取中新增了AI处理的能力。据内部测算,在2500+个字段的测试中,分词准确性可达到94.0%,通过额外定义专有词根(比如社会统一信用代码、节假日、苹果手机等),可达到95.8%。