那天我看到一篇新闻报道,说足球运动员C罗,之所以能够在30多岁的高龄还保持顶尖的竞技状态,主要原因就在于他对自己的饮食习惯非常自律。比如他每天只吃白水煮的鸡胸肉和蔬菜色拉,从来不喝含糖饮料,不吃糕点。该文的作者在文末写道:如果你也想成为出色的运动员,学学C罗吧,从规范自己的饮食做起!
乍一看,这篇文章好像讲的挺有道理的。如果你每天大鱼大肉,怎么可能不增肥?怎么可能成为运动达人?要想获得好成绩,就先管好自己的嘴!
牙买加短跑名将尤塞恩·博尔特,大概可以算得上最近十年地球上跑的最快的男人。在他的自传《快过闪电》中,博尔特称,2008年北京奥运会时,当时22岁的他一度认为中国食物“很奇怪”,于是一头扎进附近的麦当劳,寻找最喜欢的麦乐鸡块吃。他在自传中写道:
刚开始,我午餐吃一盒20个鸡块,晚餐同量。第二天早餐,我吃了两大盒鸡块。中餐吃了一盒,晚餐又吃了两盒。我还加了些油炸薯条和苹果派配着吃。
博尔特估算,在北京的10天里,他每天吃下100个鸡块,合计1000个鸡块。他写道:“吃鸡块方面,我也应该能拿金牌了。”
现在,我们对比一下上面两个故事:顶尖的足球运动员C罗,每天只吃白水煮鸡胸,从不碰任何油腻的甜食。顶尖的短跑运动员博尔特,在奥运会期间天天吃“垃圾食品”,结果还拿了百米跑金牌。
从这两个例子中,我们能得出什么结论?
聪明的读者,应该可以看出了其中的端倪。这两个例子,都只是个案,不能说明任何问题。在统计学上,这样的情况,被称为“小样本”。其样本量N,等于1。
更科学的分析思路,应该是这样的:不管是C罗也好,博尔特也好,优秀运动员的运动成绩,是很多不同因素综合作用的结果。首先他们的身体底子就要高于常人,也就是有运动天赋。其次,很多人从很小的年纪就开始科学训练,逐步走上职业化运动道路。科学的饮食,也是训练的一部分,肯定对提高运动成绩有作用,但也不需要过分夸大。在职业运动员层面,除了比身体素质和技能之外,更重要的,还有运动员的精神状态和意志力。显而易见的是,如果只是学运动员怎么吃,那是不太可能成为下一个C罗或者博尔特的。
N为1的样本,在统计学上没有任何意义。但是在实际生活中,我们很多人,却经常陷入这样的逻辑陷阱,有时甚至还理直气壮。
举例来说,很多人都可能很熟悉这样的场景。你和一个朋友说吸烟的坏处,然后他回你:我家的邻居大爷,每天烟不离手,至少吸一包,现在活到90多岁了,身体特棒,一点毛病没有。这位朋友的潜台词是,你看,我找到一个身体健康的老烟枪,可见吸烟不一定有那么大坏处。
“吸烟有害健康”的科普教育,至少已经持续了好几十年。有点常识的民众,对这个问题基本不存在争议。但生活中还是有很多人会用样本量为1的个例来试图反驳,足见统计学知识的匮乏,对于大众的影响有多深。
基于N=1的样本量来写的“鸡汤文”,就更数不胜数了。比如前两天我看到一篇转阅10W+的火爆文章,题目是《孩子一定要逼出来》。该文的中心思想是:天下没有舒适的成功。要想取得任何成绩,一定要逼孩子度过“煎熬期”。文中举了我国著名钢琴音乐家郎朗的例子。郎朗从9岁开始便被父亲带去北京学钢琴,每天都至少要练琴6小时。但是郎朗的努力,和他父母做出的牺牲没有白费。最终郎朗终于成了举世闻名的钢琴家。
孩子最后能否成为钢琴家,和每天练习多长时间,远远不是单一的线性关系。据中国新闻网援引中国音乐家协会的数据称,早在2013年,中国学钢琴的琴童人数,大约就有3000万人。中国最好的音乐学院有9所,包括:中央音乐学院(郎朗的母校)、上海音乐学院、武汉音乐学院、四川音乐学院、天津音乐学院等。这些院校每年的招收人数,都在几百个左右。也就是说,这9所音乐学院每年的招生总人数加起来,也就几千人。毫不夸张的说,几乎每一个有自信申请音乐学院的学子,都至少会一门乐器,在家里起码每天练习6小时甚至更长。但他们显然都不可能成为郎朗。
为什么那么多人,都如此容易受到N为1的个案影响,并从中推断出并不一定存在的伪规律呢?主要有这么几个原因:
第一、我们人类,在很多时候,不得不基于小样本进行归纳总结,并做出选择。
眼前有两份工作,我应该选哪个?有两个都很不错的女孩,我应该和哪个结婚?大部分人,在生活中早晚都会遇到类似的处境。在实际生活中,我们不可能在尝试N=50份不同的工作后,再决定自己最适合干哪一行。也不可能在尝试交往50个女友后,再决定和谁结婚。这些现实,决定了我们只能在有限的小样本基础上,尽最大可能做出具有代表性的归纳总结,然后挑最适合自己的选项。
由于不得不在信息不完全的小样本环境下做决策,因此我们也养成了从小样本中总结规律的习惯:比如自己的姐夫是上海人,就去总结“嫁给上海男人如何如何”的规律。邻居的孩子去英国念书,就去总结“出国留学如何如何”的规律。
第二、眼见为实。人类的天性,就是最容易受到发生在自己身上,或者自己身边的事的影响,并将其延申,总结出所谓的普世规律。
我的一位亲戚,有一年得了一种怪病,经常感到腹痛难忍。去医院做了CT等各种检查,但是医生也无法确定到底哪里出了问题。后来那年春节,家里在吃年夜饭前拜了一下祖宗(注:当地习俗,即烧好一桌菜邀请逝去的祖宗来吃,并且焚烧纸钱来祭拜)。过完年后,他的腹痛莫名其妙好了。这位亲戚和家属,坚信之前的腹痛,是祖宗提醒他要祭拜一下。从此他每年过年、清明和冬至都要祭祖,以确保自己不再犯腹痛的毛病。
这就是眼见为实的威力:在自己身上发生过,或者亲见身边的真人真事,对人的影响远甚于学校里学到的科学知识,有时甚至能够持续一辈子。
价值投资的鼻祖格雷厄姆,一生谨慎,只喜欢买“烟屁股”股票(注:即估值便宜的股票),从来不敢买贵一些的成长股。背后主要的原因,是他的母亲在1930年代的大萧条中吃了大亏,把全家的家当都亏在股市中。幼年的记忆,影响并塑造了格雷厄姆一生的投资习惯,那就是先保证不亏,或者少亏。而保证自己亏少一点的最佳方法,就是确保买入的价格够便宜,下跌的空间有限。
美国的80和90后,很多人把现金放在银行里买定存,或者国债。在他们的生活经验中,利率不断下跌,国债价格持续走强。这个年龄阶段的群体,从来没有经历过恶性通胀。因此在他们的世界里,几乎没有考虑过恶性通胀可能带来的债券和现金贬值的风险。这些例子都表明,在自己身上发生的,N为1的小样本经历,会极大的塑造每个人的行为模式。
第三、媒体记者喜欢讲故事。
要写出一篇广为流传的新闻稿,其中的秘密之一,就是要会讲故事。
假设记者现在要写这么一篇文章:初创企业,老大和团队哪个更重要?
系统科学的研究方法,是收集几百个,或者更多创业团队的数据,然后把它们分类为“老大主导型”和“团队主导型”,并跟踪这些团队的发展轨迹,做对照分析,然后得出基于数据统计的结论。
但在这个领域不一定有相关的数据和研究。即使有,写出来也不一定能引起读者的兴趣。于是记者更可能走“讲故事”线路:找出一两个成功或者失败的创业案例,然后把创始人和团队的生活经历娓娓道来,特别对其中一些八卦着重描写一番。这样的文章,反而更能吸引眼球,冲击10万+。
由于上面提到的3个原因,导致我们很多人一不留神,就可能陷入“小样本”的统计陷阱。那么针对这个典型的人性弱点,我们应该怎么办呢?
第一、时刻提醒自己,用统计学的视角去看世界。当别人用N=1的样本来试图说服你接受某一个观点时,你的第一反应应该是:那又怎样?
举例来说,在讨论股市的有效性比以前大大提高,要战胜股市非常困难这样的话题时,经常会有人举巴菲特的例子,试图证明市场可以战胜。对于这种N=1的样本论证逻辑,我们大可以反问对方:那又怎样?你想说明什么问题?
第二、不光是N为1的样本量不可信,很多时候来自于同一类别带有明显偏差的样本量,同样没有统计意义。比如很多人喜欢读成功者的励志故事,并希望从中学到一些成功的秘诀。但我们不要忘记,这些样本带有很强的“幸存者”偏差。成功者,可能和失败者做了很多一样的尝试。但最后有些人幸存下来,并不代表其他人做相同的尝试,也能获得成功。
第三、在一些只能基于小样本做决策的情景下,要多读书,尽量多学习别人的经验教训。比如在我们面临择业和择偶的选择时,不可能通过积累足够的样本量来提高自己的认知,因此更加合理的方法,是通过阅读学习一些他人的经验和教训,提高自己选择的理性程度。
第四、多依靠数据,少依靠直觉。在能够获得数据的领域,要尽量基于更大的样本量去总结归纳。警惕其他人通过“讲故事”的方式,把那些貌似正确的观点偷偷传输给自己。在接受和认同任何一个重要的观点前,反复问自己:这个结论基于什么数据?样本量多大?是否有足够的覆盖面和代表性?只有通过反复训练,我们才可能逐渐养成科学和独立的思考习惯,用统计学武装自己,拒绝做思想上的盲目跟风者。
参考资料:
尤塞恩·博尔特,《快过闪电》,广东人民出版社,2014
0
推荐