“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验


“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

假设检验 ---- “凑巧”可以拒绝吗?【案例1】奶茶情缘
20世纪20年代初的一个午后 ,  三位科学家一边晒在英格兰午后的阳光一边喝着下午茶 。统计学家罗纳德·费希尔(Ronald Fisher)倒了一杯奶茶端给了他的同事---穆丽尔·布里斯托(Muriel Bristol) 。但她婉拒了这杯奶茶 , 因为她说先倒牛奶后倒茶的味道更好 。
Fisher不相信 。于是另外一个科学家威廉姆·洛奇(William Roach)建议大家做一个试验:背着Bristol倒一杯奶茶 , 然后让她尝 , 看看她能不能猜出倒奶和倒茶的顺序 。但是就算她说出正确答案 , 也不能说明什么 , 因为至少也有50%的概率猜对 。

“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

Ronald Fisher in 1913 (图自维基)
这是个浪漫的故事 。Bristol和Roach 因为这杯奶茶相识、相爱 。当然除了这段姻缘 , 这杯奶茶还成就了Fisher的假设检验的理论 。
Fisher 在其《试验设计》一书中写道 , 他试图驳斥这样的假设:Bristol的选择是随机的 。这就是零假设 。
Fisher设计了一种可以反驳零假设的方法 。他准备8杯茶 , 4杯先倒茶 , 4杯先倒奶 。打乱顺序后让Bristol每次品尝一杯 , 然后说出奶和茶倒入的顺序 。

“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

Bristol轻松过关 , 正确地辨认出8杯奶茶中奶和茶的倒入顺序 。因为Fisher的试验设计的非常随机 , 8杯奶茶分成两组的有

“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

种可能性 。她全部猜中的可能性是 1/70=0.014 。
虽然这是个很小很小的概率 , 但依旧无法排除Bristol是“猜”出来的可能性 。我们只能说 , 这种可能性非常小而已 。
那究竟可有性为多少我们才可以拒绝“Bristol的选择是随机的”这样的假设?
Fisher认为 , 基于零假设为真的前提 , 却依旧观测到这种结果的概率如果不到5%就可以拒绝零假设了 。Bristol猜对的概率是1.4% , 小于这个值 , 所以我们可以大胆地认为Bristol对奶茶有自己独到犀利的味觉 。
一杯奶茶 , 成就了一段浪漫的情缘 , 也成就了统计学的重要工具----假设检验 。
【案例 2】咖啡新鲜吗?
“咖啡(Coffee)“的名字最早来自埃塞俄比亚的一个名叫卡法(kaffa)的小镇 , 是“力量与热情”的意思 。它与茶叶、可可并称为世界三大饮料植物 , 受到全世界人民的普遍喜爱 。

“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

在中国 , 咖啡作为一个和“时尚”紧密相连的饮料受到越来越多年轻人的喜爱 。咖啡的浓香伴随着清晨的第一缕阳光把耳朵叫醒;紧张的工作时间 , 一杯咖啡迅速让你“满血复活”;和朋友小聚时 , 几杯咖啡、一点蛋糕 , 分享着生活和幸福 。
人们理应更喜欢新鲜磨制的咖啡(fresh coffee) , 因为它的口感更纯正、香浓 , 喝过之后唇齿留香 。但在这个“速溶”的时代 , 速溶咖啡(instant coffee)也因其便携、快速的优点成为很多人的首选 。在中国 , 有报道声称“速溶咖啡和现磨咖啡在市场上各占据半壁江山” 。某品牌现磨咖啡机在进驻中国市场之前 , 为了对中国消费者的喜好有一个更清楚的认识 , 特意做了一个试验来验证 。
有100个人参与这项试验 , 每个人都需要尝两杯没有任何标记的咖啡 , 然后告诉工作人员他们更喜欢哪杯 。事实上 , 这两杯咖啡一杯是速溶的 , 一杯是新鲜磨制的 。
这个试验的统计量是样本中更喜欢新鲜咖啡的比例 ^p 。这个符号上的帽尖(Hat)代表这只是个从样本中算出的估计值 , 并不是总体中的真实值 。结果显示 , 100人中有72人选择了新鲜咖啡 , 也就是

“凑巧”可以拒绝吗?统计学里的最重要工具之一:假设检验

文章插图

这个试验能够提供多少有力证据来反驳报纸上的观点呢?要想回答这个问题 , 就需要用到统计上的假设检验 。