- 数据自助服务实践指南:数据开放与洞察提效
- (美)桑迪普·乌坦坎达尼
- 473字
- 2022-05-20 19:18:47
第3章 搜索服务
到目前为止,给定一个数据集,我们能够收集所需的元数据细节,以正确解释属性的特性和意义。那么,给定跨越企业孤岛中的数千个数据集,我们如何有效地定位开发洞察所需的属性呢?例如,在开发收入仪表盘时,我们如何定位现有客户、客户使用的产品、定价和促销、活动、使用概况等数据集?我们如何定位可以在构建仪表盘时重用的指标、仪表盘、模型、ETL和即席查询等工件?本章的重点是在开发洞察的迭代过程中找到相关的数据集(表、视图、模式、文件、流和事件)和工件(指标、仪表盘、模型、ETL和即席查询)。
搜索服务简化了数据集和工件的发现过程。通过搜索服务,数据用户可以使用关键字、搜索通配符、业务术语等表达他们要查找的内容。在底层,该服务完成了发现数据源、索引数据集和工件、对结果进行排序、确保访问治理和管理持续变更等烦琐工作。这样,数据用户可以获取一个与输入搜索查询最相关的数据集和工件的列表。此类服务的成功标准是降低搜索耗时。降低搜索耗时可以显著地减少洞察耗时,因为数据用户能够快速搜索,并迭代不同的数据集和工件。减缓搜索过程会对洞察的总体时间产生负面倍增效应。