进入数据查询页面后,默认搜索类型为搜表,支持通过表名、表描述搜索当前项目组下的hive表,通过表名搜索当前项目组下登记的数据源下的HBase、Kudu、Kafka流表、RocketMQ流表、MySQL、Oracle、Vertica、DM、Doris、TiDB以及Greenplum。在输入内容时,支持自动推荐表。

    如下图,为搜索表的页面:
    搜表 - 图1

    对检索结果支持二次筛选,可按照源类型(Hive、MySQL、DM、Vertica、Oracle、GaussDB、Greenplum、OceanBase、Doris、HBase、Kudu、Kafka流表、RocketMQ流表)、项目、库、主题域、表分层、核心表标签的过滤,支持按照引用热度和读取热度排序。

    如下图,为搜索结果页:
    搜表 - 图2

    点击搜索结果页的表名,即可跳转至对应的表详情页。

    在搜索框输入关键字后,系统会提供推荐列表,推荐列表中会展示库表名、表描述、所属项目信息,如下图所示:
    搜表 - 图3

    开启/关闭精准匹配

    当同一关键字可能搜出较多结果时,对用户选择形成干扰。故系统支持是否精准匹配的设置项,可灵活开启,方便精确定位自己想要的数据。默认未开启,即为模糊匹配。
    搜表 - 图4

    手工同步

    当表新建后可能由于网络延迟或者底层偶发问题导致表没有及时同步到ES索引中,以致用户可能在地图搜索不到表,可通过“手工同步”进行手动同步。
    搜表 - 图5

    点击“手工同步”后可在弹框中输入数据源类型、数据源、库/Schema、表物理名称。
    搜表 - 图6

    说明: 对于历史存量用户,地图支持搜索所有已登记的数据源下的库表;对于未来新部署地图的用户来说,地图默认仅支持搜索hive表,若需要支持搜索其他登记的MySQL、Oracle等数据源表,需要先创建采集任务将需要检索的库表采集到平台元数据中心后,才能在地图检索这些已采集的库表。地图检索的元数据需要先采集,才能检索,避免无效的、敏感的数据被检索出来。该功能可以通过后台开关控制,详情可咨询技术支持。

    搜索偏好设置

    地图首页搜索时,用户希望能够基于关键字匹配,并且优先推荐热门读取、热门搜索或者元数据质量评分高的数据。故本次平台在ES分词检索的基础上,提供了搜索偏好设置的功能,管理员可调整各项权重因子,优化搜索推荐的功能和体验。

    默认仅项目组负责人和项目组管理员可以设置搜索偏好,其他人员需要在安全中心授权后才能操作。进入配置管理页,点击搜索偏好设置菜单,设置并保存后立即生效,可在首页搜索查看返回结果的推荐顺序。搜索偏好设置页如下所示:

    搜表 - 图7