统计学是什么?|支撑统计学的基础七支柱

“统计学是什么?”早在1838年就有人提出过这个问题(与英国皇家统计学会有关),此后这个问题又被反复提起 。多年来,铁打的问题和流水的答案已成为该讨论的特点 。综合问题和答案可以看出,持续的疑问源于,统计学并不是一个单一学科 。自诞生至今,统计学的工作内容经历了翻天覆地的变化:从极端强调“统计学家仅收集数据而不分析”,转变为从计划到分析的所有研究阶段皆积极寻求与科学家的合作 。并且,统计学工作者面对不同的科学领域时,需要相应调整自身角色:在某些应用中,我们接受基于数学理论推导的科学模型;而某些应用中,我们构建如牛顿力学体系一样稳定的模型 。在一些应用中,我们既是积极的计划者,又是消极的分析师;而在另一些应用中,我们的角色则恰恰相反 。统计学工作者除了角色众多,还需要为了避免失误、保持角色平衡而面对种种挑战 。这就难怪“统计学是什么”的老问题,无论面对哪个时代的新挑战,总会被重复提起 。“统计学的挑战”在19世纪30年代指经济统计,在20世纪30年代指生物问题,而目前指定义模糊的“大数据”问题 。
统计学有各种各样的问题、方法和解释,那到底有没有自己的核心科学呢?如果统计学工作者总是致力于在诸多科学领域工作——从公共政策到验证希格斯玻色子的发现——甚至有时候只被视为服务人员,那统计学还能真正合理地被大家视为统一的学科吗?它能被视为我们统计学工作者自己的科学吗?这个问题就是我想在《统计学七支柱》书中解决的 。我不打算告诉你统计学是什么或不是什么,而是尝试制定七个原则,即支撑统计学领域的七根支柱 。它们在过去曾以不同方式支撑统计学,我保证,它们一定还会在无限的未来继续起到这样的作用 。我会尽力使你相信,每根支柱的引入都是革命性的,并对统计学的发展产生了深远影响 。
本书书名借鉴了托马斯·劳伦斯(即阿拉伯的劳伦斯)完成于1926年的回忆录《智慧七柱》 。这部回忆录的名称源于《旧约·箴言》,《箴言》9:1写道:“智慧建造了房舍,雕琢了七根支柱 。”根据《箴言》,建造智慧的房屋是为了欢迎寻求知识的人 。此外,本书还有一个目的:阐释统计推理的核心思想 。
将这七个原则称作“统计学的七大支柱”之前,我先强调,它们是七根“支撑”的柱子,是统计学的学科基础,而不是完整的体系 。一方面,这七根支柱都有古老的起源;另一方面,现代学科通过自身结构的伟大独创性,以及华丽承诺不断产生的精彩的新思想,将统计学构建为多元化的科学 。在不脱离现代工作的前提下,我希望在统计学核心中建立跨时代和跨应用领域的连接和统一 。
第一根支柱称为聚合(Aggregation) 。我们也可以使用它在19世纪的名称“观测的组合”,甚至使用最简化的名称:均值 。名字太简单可能误导读者,其实,虽然它现在看来已不新鲜,但在早年却真正地具有革命性,并且时至今日依然如此——无论它在何时进入新的应用领域 。那么,它如何体现革命性?按照规定,给定一些观测值,你可以通过丢弃信息而真正获得信息!我们对观测值取简单的算术平均值,丢弃观测值的个别特征,而将其都纳入汇总值进行考虑 。目前,这在重复测量中很常见,比如观测恒星在太空中的位置 。然而在17世纪,可能需要忽略这样一些信息,比如法国是个酒鬼观测员做出的观测,俄罗斯人是用旧仪器做出的观测,英国是个很靠谱的朋友做的观测 。事实上,抹去个体观测的细节比任何单个观测都能给出更棒的指示 。
根据记录,算术平均值的使用最早出现在1635年;而其他形式的统计汇总的历史则更为悠久,可以追溯到美索不达米亚文明最初出现文字的时代 。当然,第一根支柱最近的重要实例更为复杂 。最小二乘法及其衍生方法的本质都是均值,它们通过对数据进行加权汇总而抹去数据的个体特性——指定的协变量除外 。甚至核密度估计和各类现代平滑器在本质上也是均值 。
第二根支柱叫作信息(Information),更具体地说是“信息度量”,也是说来话长又很有意思 。我们什么时候有足够的证据证明一种药物的疗效?这个问题可以追溯到古希腊 。而研究信息积累率的时代则要近很多 。18世纪早期,人们发现在很多情况下,一个数据集的信息量仅与观测个数 n 的平方根成正比,而不与 n 本身成正比 。这也是革命性的思想 。假设你试图说服一名宇航员,如果他想将研究精度提高一倍,那么他需要用 4 倍数目的观测;又或者,第二组 20 个观测值与前 20 个观测值尽管同样精确,但第二组的信息量并不像第一组的那么大 。我们将这个思想称为“根号 n 规则” 。它需要一些很强的假设,并且在很多复杂的情形中使用时需要修正 。无论如何,1900年就明确建立了这样的思想:数据中的信息可以测量,而测量的精度与数据量有关,某些情形下可以精确刻画相关性的形式 。