第3问:什么是数据指标?

导读:了解完数据分析的发展后,本问开始,将从数据分析的核心—“数据指标”切入,建立全面的数据分析底层认知。数据指标是业务现状的反映,而数据分析也正是基于对业务现状的准确透视才能做出有效决策,因此,数据指标的重要性不言而喻。

为了建立对数据指标的完整认知,我们把数据指标拆成“数据”与“指标”,指标是数据之间的运算,是“衡量”事物发展程度的“模型”。也就是说通过“建立指标”评估“业务发展”是一个建模的过程,是把业务发展从物理世界映射到数据空间,只有这样才能使得“万物皆可计算”,这就是数据分析的基础。

为了厘清从数据到指标的建模过程,我们需要先对“数据”的概念进行讨论。

1.什么是“数据”?

数据是被存储起来的信息。从应用的角度看,数据是把事物做量化处理的工具。万物皆可数据化,数值是数据,文本、图像、视频等同样也是数据。

(1)按字段类型划分,可以把数据分为:

文本类:常见于描述性字段,如姓名、地址、备注等。

数值类:最为常见,用于描述量化属性,如成交金额、商品数量等。

时间类:仅用于描述事件发生的时间,是重要的分析维度(如同比、环比、累计等)。

(2)按结构划分,可以把数据分为:

结构化数据:通常指以关系数据库方式记录的数据。

半结构化数据:如日志、网页数据。

非结构化数据:如语音、图片、视频等形式的数据。

(3)根据数据连续的属性不同,可以把数据分为:

连续型数据:在任意区间可以无限取值,例如年龄、身高。

离散型数据:常见于分类数据,例如性别、年级。

2.如何理解“指标”?

指标的作用是“度量”业务,可以从三个角度对指标进行拆解:指标=维度+汇总方式+量度。

维度:从什么角度去衡量问题。

汇总方式:用什么方法去统计问题。

量度:目标是什么。

下面举两个例子。

订单数是指统计周期内,用户完成支付的订单数量总和。从维度、汇总方式、量度三个角度将订单数拆解,如下图所示。

复购率是指统计周期内,重复消费用户数(消费两次以上的用户)在总消费用户数中的占比。从维度、汇总方式、量度三个角度将复购率拆解,如下图所示。

3.数据指标如何落地使用?

了解完指标的底层逻辑(理论)后,更重要的是将指标在业务中落地。笔者团队结合数据分析经验,总结了以下数据指标的落地建议:

(1)指标基建确保数据的完整、准确。

为了打下指标模型的稳固基础,需要对数据底层进行检视:

① 检视数据源头:埋点收集的事件数据是否足以支撑所需指标的建模。

② 脏数据清洗逻辑,也就是数据仓库中常见的ETL(Extract-Transform-Load,抽取-转换-加载)概念。

(2)从业务层面理解指标。

理解业务是数据分析落地的前提,有效地使用指标也同样如此,要求熟悉数据指标背后的业务含义。例如“会员成单数”这个指标本身有很多含义(针对以购买会员为主要商业模式的App):

● 直接含义:整个团队的业务完成能力。

● 会员成单数+成本:企业的盈利能力。

● 会员成单数+产品:产品畅销程度。

● 会员成单数+用户分层:用户的需求。

(3)从指标的变动中做决策。

为了判断业务现状的好坏、趋势,需要建立衡量标准,数据指标的使用同样如此。

通过某个孤立的指标不能反映现实,例如小明身高165cm,我们看不出小明的身高特征,但是当走来一个身高180cm的人时,我们就能判断小明相对比较矮,或者当我们拿到全国平均身高水平是167cm时,也能得出同样的结论。这就是利用对比思维建立标准的过程,对比的客体可以是横向的同属性对象、总体平均,也可以是纵向的历史数据。

如果是周期性变化,那很有可能是正常波动,可以初步判作“正常”。如果是“突发+下跌”,那很有可能是异常的波动,可以初步判作“问题”。

(4)指标的生命周期不同阶段使用不同指标。

既然指标的作用在于反映业务,而业务的发展存在生命周期,那指标的使用也应存在时效性,即指标的生命周期。

沿着产品的生命周期来看,不同阶段使用的指标差异如下:

① 导入期:业务目标在于建立知名度,通过口碑引流,着重关注新注册人数、分享率指标。

② 成长期:业务目标在于通过不同渠道布局推广最大限度占有市场,着重关注新会员来源渠道占比等指标。

③ 成熟期:业务目标在于将前期流量变现,确保盈利规模,着重关注付费率、毛利率等指标。

④ 衰退期:此时,市场增量收缩,要求对存量人群精细化运营,着重关注复购率、重购金额占比等指标。

4.小结

在一定程度上,“数据指标”能揭示出产品用户的行为和业务水平状况。当然,我们也不能完全迷失在数据中,应注意以下几点:

● 数据不等同于实际场景,实际场景往往比数据更加复杂,分析时需要了解具象化的场景,而不是抽象的数据。

● 数据本身没有观点,分析时不能预设观点,只倾向于那些能够支持自己观点的数据。

● 数据具备一定的时效性,不同情况下,一些曾经的数据可能不再适用,需要找到新的数据指标。

总之,精确的数据无法代替大方向上的判断,不要过分迷恋数据,要做到具体问题具体分析,形成发现问题、分析问题、总结问题、解决问题的思路闭环。