二战各国死亡人数图表 象形统计图

原创 服老思和同学们 P话
这一次,我们要讨论象形图及其使用。
来自数据群的讨论
本期探讨由P-talk数据组的小组朋友Mena启发的问题和想法。前段时间,Mena做了一个新冠肺炎患者性别分布的象形图,如下图。这个象形图在朋友圈发表后,被一个朋友误解了。以下是梅娜的问题:
发布到朋友圈之后,有一个朋友跟我说,他认真的数了男性和女性人形的个数,加起来为什么不等于我下面标注的样本数?我想请教大家作图的时候,用这种人比例图多吗?有没有出现过类似的状况?究竟像这样的解读有多普遍呢?还是只是个例?

简单来说,就是这个读者默认了象形图的每个图标代表了多个数据点,导致了误解。这是因为上图使用离散图标来表示连续值。在追求抽象数据可视化的同时,也可能造成误解,因为有些读者在阅读象形图时会默认每个图标代表一个或一组数据点。
如何修复呢?
我们可以考虑一个图标在图下等于多少个具体值,有利于读者对数据图有更准确的解读。如下图所示:

来源:https://www.mathsisfun.com/data/pictographs.html
另外一种可能的解决办法,就是通过在人形上显示百分比数的方式与读者沟通, 这样子做出来的人形图,就有点像饼图的变体。因为 Mena 做的人形图里男女比例随着新确诊病例的增加每天都会发生变化,所以她采用了这个办法,之前误会的朋友也说这样就清楚多了。

象形图
象形统计图,我们通常也简称为象形图,是一种通过图标来显示数据的可视化形式。每个图标表示一定数量或单位,通过了图标多少对不同类别的数据大小进行比较。通常,使用的图标切合数据主题或类别,更为直观和 “形象”。另外一个显着的优势是,同一个变量被映射到了两个视觉维度,除了传统的长度/面积外,还有图标数量,加强了图表的辨识度。这个优势在象形柱状图和华夫饼图中得到很好的体现。
使用象形图时有几点要避免:
?用于大型数据集,令人难以计数
每个图标对应的数据点数量没有明确标注,可能会导致读者产生误解
?图标的使用与主题无关,给人造成误解
考虑到读者可能会有这样的解读思维,通常在数据极小、极大的情况下使用象形图。一个图标对应一个数据点,或者一个图标对应多个点。如果一个图标代表一个非整数十进制数的值变量,可能会造成上述误解。
象形统计图的变种

象形柱状图
下面的类型是象形图和直方图的组合。用与主题相关的图标替换传统栏。传统直方图使用列的长度来比较变量,而象形直方图同时使用图标的长度和数量,从而达到多重视觉编码的效果。

https://datavizproject.com/data-type/pictorial-unit-chart/
象形比例图
这种图表更适合呈现分类变量。不同的图标代表不同的类别,图标的数量代表类别的比例。这个图像的另一个变体是二维平面的象形比例图,下面的“华夫格图”就是其中之一,也适用于表示包含关系和对比关系。

https://datavizproject . com/data-type/fraction-of-象形图/
单图标比例图
和上面的象形比例尺图一样,单图标比例尺图也侧重于表示比例尺,适合对变量进行分类。这里使用单个图标,比例关系用面积表示。值得注意的是,在这种单图标比例图中,比例值通常是用长度比例而不是面积比例来显示的。

https://datavizproject . com/data-type/picture-fraction-chart/
华夫饼图
下面的华夫格图本质上也是象形图的变体,只是这里的图标是用小方块固定的。与象形图相比,华夫格图淡化了图标带来的视觉分散,强调了物体的比例。华夫饼常用来表示比例关系,大面积色块分布有利于给读者带来视觉冲击。

推荐阅读