听多了文字游戏,那你听说过数字游戏么?
最近在埋头苦读大数据处理,期望借助火热的大数据走上人生巅峰。开个玩笑,其实CFD中也离不开数据处理,这主要体现在计算后处理中,在得到一堆计算分析数据后,相差需要将数据以可视化方式进行呈现。然而在数据呈现的过程中,相同的数据可能会以不同的面目显示,甚至可能造成误读。
以下案例来自于科普读物《解开数据真相-从小白到数据分析达人》,一个很有意思的案例。
某食品公司为了帮助人们了解燕麦的降胆固醇功能,在广告中展示了一幅条形图。如下图所示,当我们将条形图的Y轴遮住的话,这样可以猜一猜四周内胆固醇的下降量。
如果不看Y轴,但从条形图来看,可能会有这样的印象:在食用燕麦4周之后,人体胆固醇水平大概降低了75%。
好了,现在把Y轴补上,当当当当,是不是感觉很受伤?实际上四周下来,胆固醇仅仅下降了4%。
这种数据误差其实可以通过Y轴来控制,如下图所示,将Y轴显示范围更改为0~220,是不是感觉更接近真实情况呢?胆固醇的下降并不明显。
以图形显示数据时,坐标轴的取值范围很重要,直接影响人对于图形的判断。
仍然来自于此书中的案例,书中标明此案例为虚构。
某市犯罪量居高不下,令人懊恼。为此市议会聘请了一位新的警察局长,想看看换个领导是否能够降低犯罪率。其中该市过去4年的犯罪数量为:
1990年:200例
1991年:205例
1992年:195例
1992年:200例
1993年底,新局长上任,其承诺4年后向议会报告自己对于犯罪率的有效作用。
1997年底,该局长搜集了一些统计数据,准备向议会汇报工作进展。据当地报纸报道,该市犯罪活动更为猖獗了,议会正为此恨恨不已。可惜警察局局长统计出的犯罪案数量大幅上升,其上任的几年,犯罪数量为:
1994年:300例
1995年:375例
1996年:425例
1997年:450例
这可怎么办?如实禀报只怕会丢饭碗。然而该局长灵机一动,绘制出了下面的图形:
议会一看,感觉犯罪数量在下降,“恩,小伙子不错,继续好好干。”
时间有过了4年,时间到了2002年底,局长又要向议会汇报了,这次拿到统计数据后,局长傻眼了。这次数据是这样的:
1994年:550例
1999年:655例
2000年:765例
2001年:880例
这次不仅数量在增长,连增长量也在增加,上一次的花招似乎不好使了,否则画出下面的图形岂不要糟。
话说局长灵机一动,画了下面这张图。
局长并没有对数据进行任何篡改,两幅图仅仅只是一个字的差别,然而给人的印象是完全不同的。
本篇文章来源于微信公众号: CFD之道
评论前必须登录!
注册