可视化图表入门教程

2020-06-23 00:00:00 数据 指标 大小 维度 图表

数据可视化,即通过图表形式展现数据,帮助我们快速、准确理解信息。好的可视化会“讲故事”,能向我们揭示数据背后的规律。

本文主要介绍常见图表的信息表达特征和适用场景,帮助大家了解如何在不同的场景下选择合适的图表,从而帮助我们更清晰的传递信息。(注:正文中所有图表的制作所使用的工具为Yonghong Z-Suite)

图1:图表类型


图表基础元素

一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色、表达特定的信息。

图2:图表的基本元素

可视化图表的两个概念


1. 维度(Dimension)

如地区、性别、职业等,常常是观察数据的角度,往往是横坐标。特征为类别型字段、一般是离散的、不可进行四则运算。


2. 度量/指标(Measure)

如UV、PV、客单价、活跃用户数,数据的统计值衡量,往往是纵坐标。特征为数值型字段、一般是连续的、可进行四则运算


可视化图表类型详解


1. 折线图“家族”

折线图作为信息明了的图表,是各种图表中容易解读的图表,以下是它的几种变种:

  • 基础折线图

例如图3所表示的是:某公司4.01-5.20日期间新增用户数的变化趋势,其中标记了两个运营的重要事件,分别是“应用市场投放开始”和“应用市场投放停止”。从折线图中我们可以发现,新增用户在应用市场投放后增长明显提升,并且带动了停止投放后的自然新增。

图3:基础折线图


  • 堆积面积图

面积大小对应该类别数值大小,反映不同类别占比关系及其时间趋势变化。


以图4为例,颜色代表不同渠道,面积的大小来表示新增用户,以时间来展示趋势变化。从图4中可看出AppStore和360手机助手为该产品下载量、2的渠道。然而它的缺点是:由色块面积来表示数值大小不够直观。

图4:堆积面积图


2. 柱形图“家族”

  • 累加柱形图

累加柱形图的核心思想是“对比”,适合少量类别的对比,且对比信息特别清晰。

例如图5表示的是某公司在调整运营策略前后的成本对比,经过对比后发现,唤回成本有所提高,拉新成本有所降低。假设该公司的运营策略为侧重唤回,减少拉新,通过这张图就可以发现执行是到位的。

图5:累加柱形图


与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。


  • 多指标柱形图

主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表。


图6是某医院的科室患者和医生人数对比图。从图中可以发现在所有科室中,内科医生为医生数多的一个科室,而儿科中的患者数是多的,说明每个医生需要服务到更多的患者。

图6:多指标柱形图


  • 单一指标柱形图

单一指标柱形图,必须按照数值大小降序排列,从而提升条形图的阅读体验。当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度。

图7:单一指标柱形图


  • 瀑布图

瀑布图的核心是按维度/指标下钻分解,如公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解等。


例如图8为某公司去年收入成本的分解,从图中可以看到花费多的为仓储费用,以此来判断是否有需要降低的费用,从而来提升净利润

图8:瀑布图


  • 背离式条形图

背离式条形图比单一指标条形图的优势在于:多增加了一个对比维度以及双尾关注(正数、倒数)。当数据指标有正负对比、前后对比、左右对比概念时候,可以选择背离式柱形图。如:进出口贸易值对比、某业务的前后变化对比、人为构建的均值差异等。

图9:背离式条形图


  • 柱形图结合折线图

柱形图结合折线图,通过对比多个指标,使得一个图表可以表现两个层次的信息。

图10:柱形图结合折线图


3. 散点图“家族”

散点图适合用于发现变量间的关系与规律。


  • 基础散点图

用于观察两个指标的关系。

图11:基础散点图


  • 气泡图

在基础散点图上添加一个指标:用气泡大小来表示。


例如图12中,气泡大小表示在职时间。从图中可以看出,当人均接待数>7的时候,在职时间长的员工2分钟内的回复率较高。

图12:气泡图


  • 基于散点图的分类矩阵

在基础散点图上添加一个维度:用颜色来区分。


例如图13中的科室是我们要观察的维度,如果公司要重点运营某些科室,可能会选择右上角区域内的科室。

图13:基于散点图的分类矩阵


根据散点图的分类矩阵,可以实现分类运营。分类运营是精准运营的开始,比如常见的活跃/不活跃/平民客户/高端客户等用户分类指标。


4. 饼图“家族”


  • 基础饼图

例如图14中,面积代表占比大小。饼图需要标注具体数值,如果没有具体数值的标注,是很难看出分公司D和分公司E占比大小差异的。

图14:基础饼图


技巧:将需要突出显示的部分,置于左上角、顺时针方向。


  • 环状图

环状图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,与饼图本质上没有任何差别。

图15:环状图


饼图小结:

1)一般来说,数值大的部分排在前面,也就是12点钟方向顺时针;

2)饼图的细分项不宜过多,一般不超过8项;

3)不要制作三维的饼图,不直观;

4)切忌将饼图拉得过开,若要突出某一块,可单独将其拉开。


5. 其他图表


  • 雷达图

雷达图可以直观地呈现几个观察对象在多个指标上对比情况,但需要保证雷达图的指标代表正负倾向一致。需要注意的是:雷达图的线条不超过5条,衡量指标不要超过8个。


例如图16中可以看出,的为客服A,客服B的主要问题在于质检得分低,客服C的比较平庸,客服D的评估、比例的值很好,但是值不高,他可能为一个很值得培养的新员工。

图16:雷达图


  • 漏斗图

漏斗图适用于关键业务环节数据比较,将各环节串联起来构成漏斗,量化流程内环节,追踪各环节转化率。

图17:漏斗图


  • 地理图

地理图是将数据信息在地理区域上的分解,是空间分布的一个良好展示。


例如图18为某公司平台用户在省份的分布情况,颜色越深代表该省份用户越多。

图18:地理图


  • 箱线图

箱线图又称盒须图,是一种显示数据分布情况的统计图,从中可以观察到数据的分布是否密集、是否具有偏向性、是否存在异常值。

图19:箱线图


  • 词云图

词云图是为了描述事物的主要特征,要求能够让人一眼看出一个事物的主要特征,越明显的特征越要突出显示。


例如图20中,Word直接展示对象,Word字体大小表示某种度度量。字体越大,表示出现次数越多。

图20:词云图


  • 树形图

树形图主要用于可视化层次和整体与部分的关系。以区块表示部分与层级,不同区块用颜色区分,用矩形面积表示大小关系。


图21为某家公司用户访问APP中广告位访问的用户访问量的对比,从中我们可以发现,做了UTD活动的访问量是大的。

图21:树形图

相关文章