- 数据可视化分析:分析原理和Tableau、SQL实践(第2版)
- 喜乐君
- 1478字
- 2024-09-19 17:38:12
2.4.2 从可视化到抽象分析:走向仪表板和高级分析
可视化不是目的,决策才是。“可视化的终极目标是帮助人们洞悉蕴含在数据中的现象和规律,这包含多重含义:发现、决策、解释、分析、探索和学习”(见本章参考资料[8])。简单可视化只能完成初级展现,难以实现高级抽象总结,于是就需要创造更多的可视化样式,借助变量、计算等方式增加交互动作或者多层次组合,这是可视化的高级阶段。
1.文字和数字是早期的可视化
早期人类用简单的数字形状,配合简单象形文字记录简单事物,很快就会遇到瓶颈——仅有的几个数字和文字,无法满足日益增加的数据记录和传播的需求。比如,几百只羊群、神话、未来。这就需要创造更多的符号,并充分利用它们的组合。
高度抽象的数字、文字形状及其组合,用来记录和反映稍微复杂的现实。
这种表达方式在罗马文字和汉字词组上表现得淋漓尽致。在数字4之后,罗马人创造多个形状代表5、10、50、100,然后组合成为各种“大数”。中国汉字也充分使用了“组合”,偏旁和部首组合构成了更多的汉字,不同汉字组合成为词组,如图2-11所示。
图2-11 小数字和简单文字的演绎发展
不过,相比罗马数字、天干地支的“形状”及其组合,印度数字的“形状+位置(进位)”在表达大数据时更有效率,所以由阿拉伯人迅速传遍了世界。
文字的发展与此类似。随着文明的发展、信息量越来越大,象形文字直观但内涵狭窄,逐渐被越来越多的“表意”文字所淹没,文字的抽象化水平越来越高,从而传递越来越复杂、抽象的信息。时至今日,简单的文字和词组会同时表达具体的、抽象的多种意义,比如“窗口”(Window)不仅指看得见的窗户,也可以指通往全世界的网络浏览器、计算机程序界面,甚至指计算的范围(SQL窗口函数和Tableau表计算)。如今,世界上的主流语言,几乎都是表意文字。
中国的汉字看似复杂,却满足了日益复杂的需求,每个汉字都可以与时俱进地表达很多意思,同时又能借助组合创造新词汇。过去代表“光明”的“囧”,如今反而成了悲伤、无奈的代名词。还有各种旧词新用、重新组合,比如“内卷”“躺平”,都赋予了汉字在互联网时代的无限生机。
笔者看来,可视化图形的魅力也是如此。简单的可视化图形通常表达精练的信息,借助可视化图形的叠加,仪表板的组合、重构,必要时创造新的可视化图形,就可能把单一的可视化图形抽象化到更高的水平,最终通往业务的理解、洞见和决策建议。
2.敏捷分析可视化是数据可视化的高级形式
常见的可视化图形对应常见的问题类型,主要有条形图、折线图、饼图、散点图、直方图、地图等。它们既可以在仪表板中相互组合,又可以在同一个空间中相互叠加,甚至可以是不同问题在单一图形上的叠加。业务用户常常称之为“多维分析”。
如图2-12所示,介绍了单维问题、多维问题的关系,以及不同的呈现形式。每个单一的问题都有最佳的可视化图形对应,多维问题则需要多个问题之间的组合,并选择恰当的方式展现背后的业务逻辑和故事。
图2-12 在简单可视化基础上组合、升级,回答更多业务问题
在业务分析中,“多维分析”的“维”代表分析角度,简单的多维分析是多个业务字段的组合(比如各地区、各产品、各年度的销售额)。高级的多维分析则是包含动态分析字段的组合(比如,按不同年度、不同客户数量的客户价值分类;基于聚合结果的二次分类,比如通过购买频次区分客户等级),后者需要通过交互式仪表板或者高级计算的方式回答。
可见,作为信息的媒介,可视化图形如同数字、文字,既是对客观现实的反映归纳,又是对世界的抽象演绎。数据时代,获取、整理数据,并以可视化方式总结、抽象,以促进信息传递和交流的技能,将成为每个人基本的“数据素养”(Data Literacy),如同读写一样重要。