2.5 Tableau:大数据敏捷业务分析的“代表作”

工具并无好坏之分,关键在于业务需求。对于大数据的可视化分析,既需要处理大数据,又要丰富的可视化表达,还要为业务用户提供探索分析的敏捷性。笔者在本书中以Tableau为主要工具进行介绍,并在数据合并、筛选、计算时增加Tableau与Excel、SQL的操作对比。

Tableau不仅是可视化分析工具,也是包含敏捷数据准备(ETL)、数据管理、数据科学等功能的大数据可视化分析平台,笔者把它视为“DW/BI+AI数据分析平台”,如图2-13所示。

图2-13 Tableau:大数据敏捷分析平台(在官方基础上略有调整)

本书第3章介绍适用于所有分析工具的敏捷分析方法和可视化基础,之后各章以Tableau Desktop为重点,介绍数据准备、可视化分析、筛选交互、计算等诸多内容,相关方法也适用于其他工具。

在Tableau Desktop中,只需要拖曳动作,就能生成可视化图形、增加分析深度、筛选数据样本、创建计算字段,甚至创建综合仪表板。图2-14所示为Desktop的主要界面功能。

图2-14 通过拖曳字段或者分析功能实现可视化分析

Tableau入门容易,精深很难,难不在工具,而在于技术与业务理解的结合。初学者要特别注意把握书中的抽象概念,尽快构建体系思维,之后才能在应用过程中融会贯通。这里强调如下几点。

(1)从Excel到Tableau最本质的思维跨越是层次思维。

Excel和Tableau是不同时代的产物。不要被Excel的习惯束缚了思考,也不要被Tableau中看似复杂的“概念”吓住。把握层次、掌握体系、循序渐进,每个人都可以快速走过笔者多年的路。

如图2-15所示,借助详细级别(LOD),读者可以理解数据准备、筛选和计算的类型,然后理解它们背后的对应关系。其中的关键是抽象而来的3个层次:数据表详细级别(Row LOD或Table LOD)、视图详细级别(Viz LOD)和指定的详细级别(Fixed LOD)。这是本书最重要的内容之一。

图2-15 理解3个关键主题的层次逻辑

(2)先理解原理,后掌握技能,再融会贯通。

掌握一门技术之难,难在掌握体系和逻辑。以可视化为例,可视化图形众多、功能繁杂,如果能建立主视图、视图增强、可视化组合的多个环节,而后把每个环节层层展开,就可以搭建可视化主题的完整体系。图2-16所示为本书第4章内容可视化增强分析的基本路径。

图2-16 Tableau从业务问题到深入可视化分析的框架

(3)分析之难,在于理解业务。

本章开篇介绍了“业务—数据—分析”的分析体系,其中,业务是贯穿前后的主线,数据和分析都是业务在不同阶段、不同形态的抽象化形式。可视化分析,特别是面向问题探索和商业模式优化的商业分析,难点都在于分析所依赖的业务知识、业务背景和业务方法,这也是资深数据分析师最宝贵的内容。

本书是笔者多年学习、企业培训、项目咨询的总结,读者可以在短时间内完整地学习和理解业务分析的多个方面,并在之后按需查询、快速进步。

推荐读者在阅读本书之后,选择自己擅长的行业领域,以所在企业为示例,构建企业数据地图、磨炼数据分析方法、搭建可视化分析体系,假以时日,当有大成。