- 数据质量实践手册:4步构建高质量数据体系
- (美)普拉桑特·苏特卡尔
- 5字
- 2024-12-18 17:26:43
第1篇
定义阶段
第1章
概述
1.1 引言
如今,相比于有形资产(如土地、机器设备、库存和现金)而言,无形资产(不具有物质性质的资产,包括数据、品牌和知识产权等)的重要性迅速上升。2018年,标普500指数中的无形资产价值达到21万亿美元,占据了所有企业价值的84%。相比于1975年的17%,这是一个巨大的增长(Ali,2020)。总体来说,随着5G、人工智能、机器人、物联网(IoT)、量子计算机、数据分析、区块链等技术的普及,越来越多的企业正在研究和开发并最大化保护无形资产,特别是数据资产价值,因为所有数字技术都是以数据为基础的。
在此背景下,数据作为一种重要的无形资产,被认为是关键的商业资源,因为它可以使组织的生产力最大化。在市值排名前五的公司中,有四家是数据公司(Investopedia,2022)。加拿大丰业银行(Scotiabank)的首席执行官Brain Porter在2019年表示,“我们从事的是数据和技术业务。我们的产品恰好是银行业务,但主要是通过数据和技术来提供”(Berman,2016)。AIG和Hamilton Insurance Group宣布成立合资公司Attune,这是一个利用数据和人工智能(AI)来简化业务流程、缩短获得保险的时间并减少成本的技术平台。油田服务公司Schlumburger利用模拟器和传感器中捕获的钻井遥测数据来提高油井钻探性能。数据已经成为提高企业业务绩效的关键驱动力,更是改善企业业务绩效的关键因素,高质量的数据可以增加企业收入、降低成本和降低风险。
数据经济生态系统,即利用数据促进业务绩效的生态系统,越来越受到全球认可。Netflix、Facebook、Google和Uber等公司利用数据获得了独特的竞争优势。谷歌研究总监彼得·诺维格(Peter Norvig)曾表示,“我们没有比其他公司更好的算法,我们只是拥有更多的数据”(Cleland,2011)。到2021年,谷歌市值已经超过了墨西哥或沙特阿拉伯的国内生产总值。以数据为驱动力的公司表现出更好的业务绩效,麻省理工学院的一份报告称,数据利用率高且数字化成熟的企业比同行企业利润高出26%(MIT,2013)。麦肯锡全球研究所的研究发现,以数据为驱动力的组织获取客户的可能性是普通组织的23倍,保留客户的可能性是普通组织的6倍,并且盈利能力是其他公司的19倍(Bokman等,2014)。Forrester的研究发现,利用数据进行决策的公司实现两位数增长的可能性是其他公司的3倍(Eveslon,2020)。在大规模应用大数据后,美国保险委员会协会(NAIC)表示保险服务的获取率提高了30%,成本节约了40%~70%,麦肯锡公司的一项研究表明,在石油和天然气公司中有效实施数据分析,可以在几个月内产生相当于投资额30~50倍的回报(McKinsey,2017)。
然而,大多数公司都面临将数据转化为业务绩效增长的挑战,这主要是由于缺乏高质量的数据。根据精品数据管理公司Experian Data Quality的说法,不准确的数据影响了88%的组织,影响收入高达12%(Levy,2015)。麦肯锡公司指出,平均每个用户每天要花费2小时来查找正确的数据(Probstein,2019)。《哈佛商业评论》发表的一份报告称,在企业中只有3%的数据符合质量标准(Nagle等,2017);而IBM和卡内基梅隆大学联合进行的一项研究发现,公司中有超过90%的数据处于未被使用的状态。