注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

出界

轮流向科学、经济与文化方向出界

 
 
 

日志

 
 

科学松鼠会:数字陷阱无处不在   

2012-08-09 23:13:50|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

伦敦奥运会上叶诗文在女子400米混合泳比赛中夺冠,并打破了世界纪录,赛后国外媒体对叶的表现提出了各种质疑,站在国人的视角上看,这更像是羡慕嫉妒恨的表现。其实,外国不少人坚信叶诗文“异常的表现”、“无法检测出的兴奋剂”,除了酸葡萄心理以外,还因为不小心掉进了数据的陷阱,产生了错觉。

媒体上对于叶的表现存在异常的两个“铁证”是:1、叶诗文在奥运会上的表现比自己在2012年7月的表现要快7秒,短短几个星期内,这么大的进步难以解释。2、叶诗文在最后五十米比男子冠军Ryan Lochte还要快,而后者是男子第二快的世界纪录,实在太不可思议了。

如果查证一下,这两个事实本身都没有错,不了解详情的人第一眼看到以后,真的会产生叶表现不正常的印象。

不过,这其实更像是一个数字游戏或者或数字的陷阱,完整的事实是:第一,叶之前的最好纪录是在2011年,这位16岁运动员用了一年时间把成绩提高了5秒, “一个月把成绩提高了7秒”是建立在前一个事实的基础上,而处于发育期的运动员一年内的成绩有较大进步很常见;第二,叶只是在混合泳400米中最后50米比Lochte快,而非整个400米。最后50米属于自由泳,是叶诗文的强项,而且比赛中前300米,叶诗文落后于其他选手,只能奋勇一搏;而自由泳是 Lochte的弱项,比赛中Lochte在前几段已经有了不小的领先,事实上在最后50米,Lochte的成绩只排在五六位,比好几位男选手的都要差。比较整个400米全程,叶诗文比Lochte慢了20多秒,如果仅比较最后50米,叶诗文也要比和Lochte同场竞技的那一小段最快的几位男选手要慢。

了解了所有的事实之后,叶诗文的表现其实并没有多么异常,是“可以思议”的。那些大肆宣扬叶诗文“异常”的人实际上是玩弄数据的高手,忽略了完整的事实,选择性地把一些数据展示给读者。如果大家平时留意的话,此类数字陷阱的例子还有很多。

很多“神秘事件”、“未解之谜”、“灵异案例”中的猫腻就是这样的。

据说,埃及金字塔拥有种种奇异的巧合,像“如果把胡夫金字塔的高度146.59米乘以十亿,结果正好是14659万公里,正好是地球到太阳的平均距离;胡夫金字塔的底面积如果除以其高度的两倍,可以得到圆周率;胡夫金字塔的总重量约6000万吨,如果乘以10的15次方,结果恰好又是地球的重量……”古代埃及人并没有这么先进的科学,金字塔很可能是外星人造出来的。

金字塔的神秘巧合并不是外星人的作品,只是文章作者自己制造的。作者会把金字塔各种数据收集一大堆,然后把数学物理天文常数再收集一大堆,像摆积木一样,看看第一堆数据和第二堆数据之间能建立出什么联系,努力找上几个小时,总能找出几组有灵异性的巧合,于是就把金字塔无中生有地“赠送”给了外星人。对此,有人编写了专门的电脑程序,任何人只要把自己的家里的房间尺寸数据都输入进去,经过一番自动查找之后,任何人的家都可以变得像金字塔一样具有神秘色彩。

另外一个常见的传说,“美国历史上的两位总统林肯与肯尼迪都是遇刺身亡,两人都有极多相似的巧合,其中有着一种神秘的力量发挥着作用。”“林肯于1846年进入国会,肯尼迪于1946年进入国会,相隔100年。”“林肯于1860年当选美国总统,肯尼迪于1960年当选美国总统,相隔100年。”……一下子列出来n个100年。

这同样是一个数字游戏,两人之间的这些巧合除掉一些编造的和牵强附会上的,几个100年是确有其事的,不过如果仔细研究一下,就会发现两人很多个具有纪念意义的日期相隔并不是100 年,比如林肯是在1809年出生,肯尼迪在1917年出生,两者相距108年(不是100年)。林肯在1865年遇刺去世,肯尼迪在1963年遇刺,两者相距98年(不是100年)。两人的生平中,不巧合的时候远远多于巧合的时候。事实上,如果我们不选100,选一个其他数字,比如98或者102,如果仔细翻一番两人的简历,一定也可以找到一堆与98或者102有关系的“巧合”事件,两人的经历并没有跟100“干上”。林肯和肯尼迪之间的时光穿越的灵异并不存在。

不仅平淡无奇的事情凭借着精心设计的神秘数字升级成了世界之谜,媒体的新闻里出现的数据也常常会“一叶障目,不见泰山”,代表不了真相。

某个国家、某个地方的平均收入翻了一番,一定算得上跨越式增长了吧。可是如果某个小镇只有20户人,平均每户的年收入是1万元,突然有一天其中的一家发了财,年收入由1万元变成21万元,全镇的平均收入就会因为这户人家的暴发立刻翻一番,变成2万元。可是这对于小镇里其余19户并没有多大影响,他们的收入还是老样子,可见只统计平均数未必靠谱,如果把平均数和中位数一起展示出来会更好一些。

关于平均收入还有这样一个奇怪的结论:对于两个穷富不同的国家,只要富国的穷人移民到穷国,两个国家的人均收入就都会提高。

比如A国人均收入是20000元,B国人均收入是10000元,如果A国有一个收入15000元的人移民到了B国,他就从在A国的“无产阶级”变成了B国的 “一小部分先富起来的人”,相应的,A、B两国的平均收入都会得到提高。这种有点不可思议但确有可能发生的事正说明了数字在某些时候的不靠谱与片面性。

对于随处可见的百分比增长率,解读方式的不同也可以带来完全相反的结论,比如下面这个例子。

“去年,咖啡价格上涨了2%,今年,咖啡价格上涨了3%”

A:仅仅多上涨了1%而已,这样的上涨幅还是很稳定的嘛。

B:不对,今年的上涨率是去年的1.5倍,意味着上涨率提高了50%,不是小数目。

你觉得A和B到底谁说的对呢?

看来,即使数据是真实的而非伪造的,还是可以成为“任人打扮的小姑娘”,选择性地展示数据可以像变魔术一样掩盖和扭曲事实。

  评论这张
 
阅读(14721)| 评论(6)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017