用数据讲故事:七种不同的数据展示方法

2017-09-06

395
0

数据可以帮助我们用不同视角叙述不同类型的故事。我们通过由 Freedom House(一个独立的监测机构)整理的数据来探讨一下每一种分类。

数据可以帮助我们用不同视角叙述不同类型的故事。我们通过由 Freedom House(一个独立的监测机构)整理的数据来探讨一下每一种分类。这些数据将每个国家按照“自由”,“部分自由”以及“不自由”进行排名。使用这个简单的数据组,我们可以讲出七个不同的故事。角度则取决于你想通过这些数据表现什么以及你将如何展现这些数据。

 

1. 叙述方式随着时间改变

 

对比2001年,有多少国家在2013年被划分为“自由”呢?事实证明随着时间变化,这个数字在急剧下降。我们可以通过数据将这种变化变得可视化,然后再解释导致变化的原因。

 

 

美国全国广播公司财经频道的 John Schoen 使用这种方法将 Dow 30公司过去87年的历史可视化。使用者可以点击每十年看到数据是如何在每一次科技爆炸、70年代的通货膨胀、甚至是经济大萧条时发生变化的。美国全国广播公司财经频道的员工基于过去的趋势将这种可视化与未来的预测结合。

 

 

2. 由大及小

 

数据可以引导读者具体深入到一个聚焦的点。用 Freedom House 的数据来说明,首先给读者一张标注得分的世界地图(整体画面),然后读者可以放大任意区域,比如亚洲,那么他会看到这个地区里一半以上的国家都被标注为“不自由”。甚至再放大一些,读者就会发现,朝鲜是所有国家里最不自由的。

 

我们通过在纸媒及互动媒体上给与提示来引导读者了解这种变化。

 

 

下面的这个例子展示了世界范围内疫苗预防疾病爆发的数据。这个概观展现了有多少例这种事例存在。读者可以通过选择国家、疾病或者年份深入阅读。读者可能会被引导看到一些其它相关的链接,比如,相比其他国家百日咳在美国更加盛行,并且文中会列出其原因。

 

疫苗可预防疾病的爆发 来源:未来研究中心

 

3. 由小及大

 

我们也可以逆推,这种由小视角扩展到大视角。例如,首先关注的是世界上最自由的三个国家(这三个国家可能都位于欧洲)。从这里开始,由小及大来展示欧洲其他国家的排序,然后再次扩大到展示全球的对比,接着读者就可以看到全世界只有超过三分之一的国家是“自由的”。

 

来源:Ben Jones

 

这是一个展示移民对住宅价值的影响的例子。读者可以通过他或她的邮政编码进入其当地的视图。接着互动的筛选会提供一个全州的视图以及一个有着全国视图的地图。

 

移民与住宅 来源:Jacob Vigdor

 

4.突出对比

 

在数据集里突出不同可以引出一个有力的叙述。最自由的十个国家都在欧洲,并且恰好距离都非常近。而最不自由的是个国家,相反的,在五个不同的地区。

 

来源:Ben Jones

 

当然,地域只是“自由”和“不自由”众多不同之处中的一个。我们的故事可以继续探讨这两个团体主要的不同方面,从国家政策到文化再到历史。一个关于差异的研究是很吸引人的。

 

下面我们来说一个相似的故事。它基于人类发展的三维图(健康长寿的生活,知识和较高的生活水平)比较了世界上所有国家的性别差距。这个图表的一端的国家都差距较大,而另一端的却基本平等。

 

人类发展指数性别差距 来源:Ramon Martinez

 

5.探究交叉点

 

当相交的数据中有两条不同的线,并且一个超过另一个时,问题就产生了。这个有关自由的数据显示出“部分自由”国家的数量超过了“不自由”的国家,继而超过了“自由”的国家。是什么导致了这种变化?当排名发生变化时,人们就想知道原因。

 

来源:本·琼斯

 

自从破窗政策在1993年起作用之后,纽约时报的 Sarah ryley 将纽约发行传票的数量可视化。起初它的数量急剧上升,并且在开始缓慢下降之前一直保持平稳。然后盘查数量的飙升导致了它在2010年与传票数量的一个交叉点。就算这样,这两条线也没有进行比较。然而,这个交叉点和它的组成部分可以书写一个有关纽约执法策略的故事。

 

“破窗政策”之后的传票 来源:Sarah Ryley

 

6.剖析原因

 

有时候一些原因集中到一起就像是一个迷,形成了一个大局。它们可能是加法或乘法的关系。比如,每个国家的自由程度得分都是法律、经济和政治自由的总和。

 

来源:本·琼斯

 

这里有一个图表体现了太阳是怎样控制天气的。这个可视化绘制了从太阳黑子到全球天气的一些点,强调了它们之间的因果关系。

 

太阳黑子 来源:马特·弗朗西斯

 

7.描绘出异常值

 

我们被那些不同于其他的事物所吸引。我们想要知道这些异常值背后隐藏的原因和原理。

发现这些异常值有时是需要一些数据研究的。将这些有关自由的数据可视化为分散点图,你可能会说这里边没有异常值。但是将它们根据区域分解成盒图,你就可以发现它们是分离的。

 

来源:本·琼斯

 

这个图体现了在2013年上半年各政府对 facebook 的需求数量。它清楚的显示了美国以8200多的需求数量优势成为了一个明显的异常值。一个伴随而来的故事可以点明美国政府在社会媒体监测上的立场,主要是用事例和可能的原因来解释美国联邦调查局不同寻常的高数量的需求。

 

Facebook 的政府需求 来源:Andy Kriebel

 

其他的故事类型

 

我们仅仅是用一个简单的数据集来探究七种不同类型故事的开端。但是正如我所提到过的,这些类型都是被作为一个思考的开端来提出的。所以我们还应该在这个列表上添加哪些故事类型呢?我们还能如何使用数据来讲故事呢?在下面的评论区分享你的看法。

 

版权所有©2017 首席数据官联盟

首席数据官联盟

 

是国内首个大数据领域的公益性联盟,打造跨行业、跨领域商业精英交流的平台,汇集了万余名来自国内知名企业、科研机构、高校的高管、行业及学术带头人,是国内最大的大数据智库,现覆盖中国95%以上的大数据企业,是国内最活跃的大数据精英交流平台。致力于推动中国的企业及政府实现“大数据+”的战略升级。

加入我们
 

1、扫描联盟秘书倪娜的二维码
2、由联盟秘书邀请您入联盟的各类微信群
     说明:将根据您的职业身份和所属行业
              邀请进入不同联盟内不同微信群
     申请时请注明:
              姓名+公司简称+职务 


 

联系我们

 

官方微信:sxsjglm
 联盟邮箱:Nina@cdoclub.cn