快来看看这些统计学笑话,让你忍俊不禁
每到年底,都会有看不完的各种报告。
这些报告,常常会以出人意料的方式,闯入我们的日常,有时带来喜悦,有时引发不快。
于是大家都会骂,什么破榜单,什么破统计。
统计学是不是一门玄学?
恭喜你,意识到了统计学的本质。
百度百科对统计学的定义是这样的。
统计学运用搜集、归纳、研究、说明数据的方法,目的是揭示事物的内在规律,并且能够预知事物的发展趋势,是一门融合多种知识领域的学科。
发现问题了吗?
统计学本身并不代表真理,只是代表某种手段。
既然是手段,那么有阳间的,自然也有阴间的。
精明的财务人员能够将损失包装成盈利,也能将盈利伪装成损失,这得益于数据分析方法的巧妙结合以及既定准则的灵活运用。
只要用的人骚,统计学可以被玩儿出无数花招。
先前和几位同伴有露营活动,晚间闲暇时随意闲谈,其中一位任职于地质部门,有一位把野外生存纪录片看过多次的软件开发者,有一位从事数据分析工作,以及还有我本人
我们商量,如果咱们在沙漠里面迷路了,谁活下来的几率大。
我估计很快就会被淘汰了,只是以前做尽职调查时被狗追得四处逃窜时,曾经显露出极强的求生意志,实际上在野外生存方面的技能几乎全无。
地质工作者认为能够准确判断所处位置,并清楚如何继续前进,动物纪录片粉丝则觉得终于有机会品尝大象排泄物的液体,内心略感兴奋,然而统计专业人士仅用一句话,便让众人深信不疑。
他说搞统计的水分多,活得久。
这自黑,让学地理的老哥又想起了一个真实的故事。
美国北卡大学曾经实施一项研究,针对其地理系毕业生的薪资水平进行了统计。
鲜为人知的是,本校地理系毕业生的收入水平远超美国其他高校的同类专业,令人啧啧称奇。
于是开心的对外宣布:美国地理哪家强?美国北卡找蓝翔。
其他大学不服气,数据摊出来一看,倒也没话可说。
北卡选择统计的那一年,地理系毕业生之中,有一位名叫迈克尔乔丹的同学。
凭借单枪匹马,支撑了全校地理专业毕业生的薪资水准,实属难得,堪称高手。
平均数一下子就被拉起来了。
如何提高杭州人工资水平?
答案是把马云摊进来,而且得是资产摊进来。
咱们平日见得最多的,应该就是和收入相关的统计了。
这个时节了,很多机构都在借助发放实物来提升知名度,这样投入能获得双重效益,商业手段确实很精明。
时常有知名企业公布自身的薪酬水平,又或者透露给职员分配了大量股份,对此人们普遍觉得,
老王身家高达千万,他的九个朋友都非常贫穷,按这个数目平摊下来,他们每人就相当于拥有一百万。
想要收入数据好看的时候,就聊平均数;
想要强调不好看的时候,就谈中位数,都是常规操作。
这便是统计工作的一种巧妙手段,表面上声称“借助数据来证实”,实际上却变成了“利用数据来蒙蔽”。
比如早些时候,有则报道指出,我国电子竞技行业的相关人员总共只有五万名,而实际需求的人数却高达五十万,这条消息很多人至今都清楚记得。
根本没错,电子竞技确实很受欢迎,不过同一篇报道里还附带了一个信息,称中国电子竞技的市场规模已经增长到1.64亿美元。
大约一亿六千四百万美元,我们设想不存在任何中间环节的利润空间,也没有资本的回报需求,全部用于支付五万名工作人员的报酬,每人每月的平均收入为一千八百元。
很多数字真是不能乱算。
数字材料即便十分具体,表面看来十分精确,显得相当有科学依据,然而当数字大量聚集时,未必能够揭示内在的规律或反映真实情况。
就像代码是由0和1构成的。
牛老师写代码,是0还是1呢?
那个对贝爷很感兴趣的开发人员,还讲述了一个涉及他所在单位的事件,这件事十分不一般。
他们公司有一位精通安卓开发的专家,对从事苹果系统工作的团队颇有微词,随后他考察了两个团队的工作成效。
具体数据已经记不真切了,我们不妨设想一下,使用者当中有10000人采用安卓系统,另外有5000人使用IOS系统,整体上愿意付费的比例是5%。
安卓专家认真观察,哎呀,自家安卓的变现比例达到百分之六,苹果系统这边却只有百分之四,我太高兴了。
接着兴冲冲地带着这份资料去见上司,却发现上司正审阅苹果公司提交的文件。
IOS那边更骚,更早一步,数据分的更细。
老板严厉斥责,询问你工作情况,iOS手机付费表现远超安卓团队,iOS平板付费表现也远超安卓团队。
尴了个尬。
你再品这个数据,非常真实,没有一点参假。
然而整合起来安卓很出色,单独比较安卓的每项指标都败给iOS,真不可思议。
这一现象早在1951年便由英国统计学家辛普森揭示出来,他当时指出,只要将数据划分得极为精细,便总能从中发掘出支持特定叙述角度的依据。
你还记得,生态化反么?
回想当年与骗取押金的共享单车发生争执,ofo声称依据某第三方调研机构的分析,其市场占有比例达到51.2%,牢固占据首位,而其城市覆盖范围是第二名的三倍还多。
随后竞争对手们开始不安,同样委托了“中立市场调研公司”,声称月度活跃用户数他们领先,充值交易频次他们领先,市场活跃程度与增长空间远超ofo一个量级。
呵呵,我们都知道,怎么可能有车比OFO跑得快呢。
F1都不行。
我完全认可他们提供的信息确实可信,考察的方面和计算方法各有不同,划分得相当细致,因此每个人都能够声称自己是领先者。
我是公司山东籍颜值最高,身材最好,人品最佳,饭量最少的人。
当然,我来自山东,外貌平庸,体态丰满,品德糟糕,而且吃得多。
他时而声称自己是阿姆红灯区里翻版的吴彦祖,时而又说自己是阿姆特种行业里的仿制王宝强,这两种说法其实都成立。
人类迅速找到了另一种思路,采用逆向思路,将数据规模扩大,混杂各种信息,同样可以创造出有趣的成果。
这让我回想起从前学习SPSS的经历,那时热衷于探究各种变量间的关联性,诸如身高与大学期间恋爱频率的相互影响,又比如体重和餐饮开销的相互关联,这些分析都还算切合实际。
但是稍微再一扩展,就麻烦了。
那个组织的前辈曾经指出,自十九世纪起,由于海上强盗的数量持续下降,地球气候变暖的状况逐渐加剧,给人类文明造成了诸多祸患。
因此,索马里海员担当了最坚韧的生态守护者,我们皆需参与其中。
瑞典少女的愤怒,来自飞翔荷兰人的海风。
照旧强调,这两项记录,毫无瑕疵,强盗人数确实大幅下降,全球气候确实在变暖,线性分析十分明了。
一旦将这两种信息硬性合并,其可能产生的联想便极为丰富。
我统计了牛老师和富老头碰面的次数,又统计了家里猫去厕所的次数,结果很意外,两者都很有规律,猫上厕所的次数越多,牛老师和富老头谈话就越深入。
给我家猫吃泻药,牛老师走路要摇晃。
数字,就是那么的精准,不接受反驳。
你若以为这是笑谈,投资领域确曾有人试图借助此类信息进行决策,实际操作也发生过。
1990年代,数学家大卫·雷恩韦伯同投资经理戴夫·科瑞德,曾在刊物上发布一份研究内容,他们经过考察过往记录,指出孟加拉国乳脂制造量同标准普尔500指数之间存在极为密切的相互牵连,这种现象比他们寻获的其余资料都更为显著。
那个整合了孟加拉国动物油脂制造量、美国乳制品制造量、孟加拉国绵羊养殖规模这三个数据要素构建的模型,能够说明百分之九十九点零的标准普尔指数变动情况。
刺激不刺激?
雷恩韦伯原本就是喜欢恶作剧的人,他经常搞些花样,但是到了2014年,雷恩韦伯在接受《福布斯》杂志采访时透露,那个报告发布已经接近二十年,依然有投资者打电话到他的办公室,要求获取最新的孟加拉国黄油生产数据。
这比星座炒股学看上去理性多了,也离谱多了。
马克吐温说过,
虚假之词大致分为三类,荒诞之语、不可饶恕之语、以及数字的诡计(假话,假话,还有)。
其实你看老马的投资经历,就知道他的怒气是从哪里来的。
初次购入俄勒冈铁路公司的股份,是在78元价位果断介入,随后在12元价位完成卖出,由此获得了相当可观的后续操作空间,如今回想起来,似乎也是受到了相关信息的误导。
股市是公平的。
谁来都给你弄个刺激。
如果数据状态恒定,既不增添,也不删减,既不扩展,也不收缩,那么是否就能杜绝那些出其不意的手段呢?
这是小看了人类的创造力。
首先就是能调转因果关系,玩儿先有鸡还是先有蛋的概念。
统计资料表明,参与森林扑救的消防队伍数量越庞大,火灾引发的经济损失就越是严重。
所以为了降低火灾损失,就要减少消防员的数量。
根据统计数字显示,生日过的越多的人,活得越久。
所以为了活得久,要多过开生日宴,万物都在利好酱香。
我过去在高校求学期间曾为获取生活费用过心思,并且还进行过相关记录,发现家庭提供的经济支持越丰厚,其整体财力似乎也相应增长,不过这个想法很快就被父亲严厉地驳斥了。
看来鸡父母果然是个微操课,里面门道很多。
不过申请家用算不得什么,我同屋的伙伴才真叫劲爆,那时同宿舍的男性常深夜骑单车去吃烤肉,快到马路中心时他就开始猛冲,站起来用力踩那种。
他提出观点,交叉路口事故频发,因此我需迅速通过,缩短涉险时长。
听起来似乎挺有根据的,但愿他如今驾车时已忘却了那个说法,否则将来同学聚会时,参与人数恐怕会显得稀少。
这便是通过颠倒因果关系的顺序,借助数字来阐述自己期望的结论。
其次,就是用统计数据对现实决策瞎指导。
那个骑行速度极快的室友,确实非常擅长把握数据的关键点,处理起来十分到位。
那个时期大家都要参加英语四级考试,他第一次下功夫复习,结果没通过,第二次他又加倍用功,最后依然没能考过。
等到第三次的时候,我们都觉得他快要锥刺股了,结果他反而不再背诵单词了。
他的理论上,你知道连考三次都不过的概率有多低么。
看来他还是不相信自己是时代之子,于是,第三次还是没过。
这件事让我想起一个这样的逸闻,第二次世界大战期间,莫斯科受到德军空军的轰炸,市民纷纷躲进防空隧道。
统计师们非常固执,无论如何都不肯接受,当别人询问时,他们总是回答,我已经计算过了,莫斯科有七百万居民,我遭到轰炸的可能性极低。
结果几天以后,有朋友在防空洞看到了教授,问教授怎么又来了。
学者表示,莫斯科居住着七百万人,仅有单头大象,不过前天,该大象遭遇爆炸而亡。
果然,爱统计的人,总是能称为概率的幸运儿。
这则笑话说,那位学者身处炸弹的预定引爆点,倘若换个思路,假定自己就是炸弹的投掷者呢?
三位狩猎者外出时碰见一头野鹿,首位射击者放枪,弹丸向左偏离一米,未能命中目标;次位射击者接着射击,弹丸向右偏离一米,同样没有射中。
此刻轮到第三位统计学家出场,他十分高兴地放下武器,表示无需再射击,仅从前面两次射击的结果来看,目标已被平均命中。
我出生在山东,现在在杭州上班,这么说来,我算不算南京人呢?
然而,当下概率碰到了恐怖文学,在引导人生方向时,总是令我由旁观者转变为被关注者。
去年春节,我在家族群里看到一条信息,内容是官方数据统计,超过百分之九十九的人,在生命终结前都曾饮用液体,因此提醒大家,饮水不能随意。
喝水,可能会死。
还是那句话,数字是没问题的,只是用来指导生活就麻烦了。
大概类似于什么呢,语言是工具,但谣言就麻烦了。
最后一种情况,在日常生活中很常见,表现为思维方式的横向与纵向差异,这种差异显得十分特别。
如今不少排名分析报告,总爱单独呈现一个数值,显得不够生动,倾向于进行各类对照参照。
我们小的时候都体验过这种情景,期末成绩公布后,担心回家会发生肢体冲突,于是大家都会选择比较彼此的进步幅度,而不是计较分数的高低。
上次是倒数第十,这次是倒数第十五,涨势喜人,潜力巨大。
这个情况从公司通告就能明白,他们声称进步很快,收益同比增加了三倍,但仔细观察,去年才刚摆脱亏损,几乎面临破产的困境。
今年营收有所提升,具体表现为利润从一百万增长到三百万,深入分析可以发现其中运用了财务策略,其核心目的在于消耗投资方的资金。
统计人员曾向我透露,他曾经指导过一位实习生,该实习生负责研究某企业全年的经营状况,结果发现二月份的收入异常偏低,他百思不得其解。
返回家中与母亲共进晚餐,那位实习期的母亲表示,二月份正值新春佳节,可以休假大约半个月的时间。
当妈的,总能在意想不到的地方,提供职场助力。
然而,前述三种方法仅限于对信息进行剖析,担忧在于,部分信息在制定之初就已埋下隐患。
结婚率和离婚率最近是一个很热门的话题,大家都在讨论。
最近和同事谈论到婚姻解体的事,让我非常震惊,他非常肯定地表示有报道指出我国在二零一九年婚姻破裂的比例达到了百分之六十三。
据观察,每百对夫妻中,有六十三对选择在这一年结束婚姻关系,这让人联想到王母娘娘处理分离之事或许采用规模化方式。
其实症结在于数据指标的内涵与界说,民政部公布的结婚率与离婚率,系指毛结婚率及离婚率,即将结婚与离婚的次数除以当时人口平均值。
这个63%的比率,假如依照这个标准,意味着我国几乎每位公民每年都要经历一次婚姻解体,部分人甚至两次,毕竟离婚涉及两个个体,才能构成一对。
但是,不能断言63%就代表一定存在问题,因为还存在另一种算法,即离婚结婚比率,这个比率说明每100对结婚的伴侣中,对应有多少对选择离婚。
按照这个标准来说,63%的离婚率意味着,在2019年,假如全国有100万对新人登记结婚,那么与此同时,有63万对已经登记的婚姻办理了离婚手续。
这俩数字能不能直接这么比对,其实有争议。
但总有些人拿来搞大新闻,制造争议。
谈及婚事,我又联想到,先前某所院校收到举报,反映该校某个学科的女生,超过半数最终都嫁给了授课教师,此事让学校极为重视,师生之间的情感纠葛啊,比例竟然如此之大,真是骇人听闻。
核实结果后发现,不能断言举报是诬陷的,计算机系仅两名女学生,其中一位与导师恋爱并最终结婚,这个比例确实达到了五成,正好是五成。
这些统计过程中的坑,别说咱们受众,搞统计的自己也中招。
那个广为流传的段子,讲述了一名数据学者遭遇的意外,他在趟过一条河时不幸丧生,原因在于该河段的水位平均值低于一米。
这就是统计起来感觉平平,其实水很深,把握不住。
早先国内一家以数据分析见长的咨询公司,其多位高管突然下落不明,结果落入了陷阱之中。
为什么拉拉杂杂讲那么多统计这个本身并不太好玩的话题呢?
因为数字虽然不好玩,但是背后能制造出来的魔幻太多了。
因此,在年末各类统计资料纷纷公布之际,需要特别指出,若要避免受骗,务必仔细核查资料中的信息来源,评估样本范围,确认数据采集过程是否合规,从数量角度加强防范措施。
接下来需要从审视的角度,考察是否存在显著的倾向性,是否涉及金钱与数量的关联,以及是否运用了先前提及的那些手段。
否则,这份报告外表光鲜,却毫无价值,不过是数字的堆砌罢了。
这是来自那些经常自我反省的人当中,容貌出众体态匀称的男士的忠告。
妥妥的稳。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。