87.53% 的背后

作者: , 共 982 字 , 共阅读 0

不知道最初来源于哪里,这个数字我最早是从李笑来那里看到的,我看完之后随便搜了几个数字,觉得结果也大同小异,心想为何笑来突然关注这个数字。后来才发现网上被传得到处都是,包括我的老同学也参与了,最后发现其根源是下面这条「新闻」

国家统计局称,在他们随机调查的 100 位网友中,有 87.53%的网友支持封杀 BTchina。

可是很奇怪,如果去统计局的网站或者直接在网上查找,都找不到这个「新闻」的出处,然后看到神奇数字 87.53 的真相,里面说上面新闻是造谣的,从目前情况看,他说的很可能是真相。

不过这个真相一文中的置信度的解释就比较扯淡了,如果真的抽样 100 人出现 87.53%的结果,那就是造假无疑,我觉得国内统计数据的还没有到考虑置信度的水平,而且特殊情况下才会这样出考虑置信度的统计结果同时会给出说明。

但很多时候样本数量、有效样本数量并不一定是 100 这样的整数,所以出现小数位的比例很正常。比如检验李笑来给的列表第二条,里面有详细数据,它的那个比例至少在数据上是可以解释的。事实上,抽样调查中结果是 87.53%的概率比平均比例要高:假设有效样本数量为 1 到 1000 平均分布,那么其结果为 87.53%的概率为万分之 1.059 ,比平均水平要高出 5.9%。

所以从这件事情可以知道两件事情:

  1. 国家机构公信力差,被造谣后大家很容易就相信了。
  2. 愤青很多。

补充:留言中有网友说大家质疑的是为什么会有这么多的 87.53 ,其实这点上网络上到处乱传的那个列表有不可推卸的责任。因为 87.53 严格意义上来说并不多。比如说 在 gov.cn 中搜索 」同比增长「 获得约 1,360,000 条结果,平均看来「同比增长 87.53」的结果应该有 136 条吧,但事实上, 在 gov.cn 中搜索 」同比增长 87.53「 获得 6 条结果,而我随手搜索几个数,比如在 gov.cn 中搜索 」同比增长 87.54「 获得约 65 条结果在 gov.cn 中搜索 」同比增长 86.54「 获得约 43 条结果,都比 87.53 出现的次数要多。

大家觉得 87.53 出现次数多,是因为网络上流传的那个列表把所有出现 87.53 的数据都凑到一起,给人一种错觉。其实自己稍微动动手和脑子,就会发现这个数出现得并不比别的数多。

Q. E. D.

类似文章:
相似度: 0.084
Google 新推出了图片搜索,可直接上传图片(或者用图片链接)搜索网络上的相似图片,例子。估计还没多少人意识到,这玩意儿是人肉搜索的大杀器,以后大家还是少上传私人照片到公开网络。
相似度: 0.073
注:来凑凑热闹,最先在槽边往事看到的,不过网上已经有相当多的讨论
最近因为丰县女子事件,很多自媒体都引用了这么一个数据:
相似度: 0.055
今天香港中文大学的Prof. Cai给我们上 graph algorithm。第一节课上教我们玩魔方,先给每人发了一个。我喜欢这样的教学方法 :) 。
碎碎念 » 谣言
前面 YY 无极限,最后一句最精彩,各位好好体会。
数学 » 统计
法庭上,被告被控是个坏人,那么在法庭辩论时,控方可建立零假设 H0 :被告是好人,备选假设 H1 :被告是坏人。控方试图拒绝原假设,它的方法是:先假设原假设成立,然后在此基础上观测到对原假设是小概率的事件,从而拒绝零假设
在工作中定期或不定期会收到一些数据文件,然后要将它们的附件保存到自己的电脑上,下面演示如何让 Outlook 自动做这件事情。
编程 » Excel, VBA
最近学到一招,效果不错~