标准拾取-AI智能拾取词根
为解决用户标准制定门槛高的问题,数据标准-标准拾取模块提供了词根拾取功能,可基于表的字段描述进行分词,将满足重复阈值的分词提取为词根中文,并支持批量补全词根的英文全称和简称,最后由用户选择是否进行相关词根的制定。
词根拾取对接AI后,借助AI大模型的中英文语言能力,进行中文分词和英文全称和简称的补全,进一步提升了词根拾取的效率。
使用流程
第一步:创建任务
a. 进入标准拾取模块,点击新建任务

b. 选择拾取内容为词根,输入任务名称(可点击生成按钮自动生成),配置重复阈值(当拾取结果的频次统计达到重复阈值要求时则被认为有效)

c. 配置元数据获取相关配置。目前支持扫描数据库、上传文件、手动填写三种元数据获取方式。

第二步:运行任务
任务配置完成后,即可点击“保存并运行”来运行任务。也可以在任务列表页操作列或任务详情页点击“运行”来运行任务。

分词及补全方案,请选择“AI"。

点击“确定”后,会出现“确认分词结果”页面。

在”分词结果“列,支持查看AI分词结果,如不符合预期也支持点击编辑按钮手动调整分词结果。如分词结果中的词根已存在且已发布,则会展示在“英文全称”和“英文简称”列。在结果页,仅会展示尚未存在且出现次数达到重复阈值的词根。在此页面,也支持点击“下载分词结果”按钮,将分词结果下载为Excel文件。
点击“确认分词结果”按钮,进入下一步。
如分词耗时较长,也可关闭分词结果页面,后续可通过点击列表页-操作列-“分词结果”按钮 或 任务详情页“点击查看”按钮进入分词结果页面。任务始终会保留最近一次分词结果,直至重新运行任务时才会清空分词结果。


第三步:制定词根
确认分词结果后,进入任务详情页-最新结果tab,可以查看AI补全英文全称和英文简称的结果。如存在词根不符合预期,也支持点击“重新制定”按钮,手动修改英文全称与英文简称。

点击“查看拾取来源”,展开拾取来源,点击任意词根即可看到当前词根从那些字段里被拆解出,在后续制定词根时具备一定的参考意义

词根制定并人工确认完成后,可以提交词根,当前产品上支持耽搁提交与批量提交两类提交方式。提交完成后,将在词根模块创建对应的词根记录。就此,我们完成了一次词根拾取的全流程。

以上内容对您是否有帮助?