2.1 “业务—数据—分析”体系:BDA分析框架

第1章中图1-1是从数据的角度区分了4个层次,从数据(Data)到信息(Information),再到知识(Knowledge)和智慧(Wisdom),数据的抽象化水平越来越高,知识密度越来越高。从企业功利的角度看,数据本身没有价值,有价值的是分析过程中萃取的规律及其指导运营决策的过程,人是分析的主体,而价值只在行动之中。

站在业务的视角看数据的生成、记录和应用过程,企业的一切数据来自业务、一切数据服务分析决策,这就构成了“业务—数据—分析”体系(Business-Data-Analysis Model)。

在这个体系中,业务是贯穿体系的核心,甚至可以把数据、分析视为业务在不同阶段的存在形态,如同水有液态、固态和气态形式,如图2-1所示。简而言之,业务土壤生成数据,数据表是对业务过程的“固化”(业务事务一旦发生,对应的数据就恒久记录),而分析指标是对业务的“抽象”(业务中不存在,人为创造出来理解业务,如利润率)。

图2-1 “业务-数据-分析”体系及相互关系

从某种意义上看,“业务”和“分析”是首尾关联甚至互为因果的。数据的收集、整合、分析过程,其实是业务的记录、重构、升华过程。数据是业务的反映和记录,而分析是对业务、数据的抽象和升华。

· 业务是数据产生的土壤。

在“业务层”,业务体现为具体、可见的业务行为。不管是线下零售交易,线上转账还是直播课堂,业务过程由业务对象构成,同时遵守特定的业务规则。此时的业务过程是鲜活的、多样的,如同液态的水灵动多变。

从数据角度看,以ERP、CRM、MES[1]等业务信息系统为载体,企业运营过程(Enterprise Operation)持续不断地产生大量数据。因此“运营型数据”(Operational Data)(见本章参考资料[1])是企业数据的主体,“运营型数据库”(Operational Database)[2]是它们的中转站。

· 数据是对企业运营过程的反映、记录和整合。

在“数据层”,具体、动态的业务被转化为抽象、静态的计算机字符,历史交易都存储在计算机磁盘或类似媒介中,这个“固化”过程如同水转化为冰。此时,数据遵循的不是业务规则,而是数据规则,典型代表是数据库的范式要求、完整性约束。数据化、标准化过程为后续分析奠定基础,这是数据库的基础。

从数据角度看,多个业务信息系统的数据需要被整合、处理、交换,最终汇总在数据库中,称为“数据仓库”(Data Warehouse)或者“分析型数据库”(Analytical Database)。其中有物理表、逻辑视图、数据模型等多种形式。复杂的数据处理催生了专门的ETL技术。

· 分析是对企业数据的抽象和升华。

在“分析层”,分析师从历史的数据中总结、归纳业务的规律性,比如,哪类客户成交率更高、什么产品最受欢迎。分析是对数据记录的组合、概括、抽象、升华,是质变过程,如同水化为“水气”。分析过程看似远离业务,却源自业务、归于业务。脱离业务的展现、不能辅助决策的分析,都是缺乏价值的。

在展现形式上,常见的分析有报表(Report)、可视化图表(Chart)、交互式仪表板(Dashboard)、数据故事(Story)等多种形式,它们帮助业务领导更好地了解业务过程,发现改进机会,做出行动决策。不同的分析形式,包含的经验成本和智慧成分也大不相同。

接下来,笔者自上而下、从抽象到具体,分别介绍。