聚合:从表格和均值到最小二乘 | 统计学七支柱( 六 )



图1-8 高尔顿的一些复合肖像(Galton 1883)
高尔顿合成照片时施加了一些约束 , 他很清楚这种一般性肖像的局限性 。正如他自己的解释:“没有哪位统计学家会梦想着组合那些同属一个种群但没有共同的中心聚集目标的对象 。我们不应再用异质元素组合一般性肖像 , 如果这样做 , 结果会很可怕而且毫无意义 。”他的一些追随者并没有这样谨慎 。一位名叫拉斐尔·庞佩利的美国科学家于1884年4月参加美国国家科学院会议时为一些与会者拍摄了照片 , 第二年 , 他发表了图片合成的结果 。图1-9是其中一个例子 , 这是由12位数学家(这个称呼在当时还包括天文学家和物理学家)的肖像叠加生成的“平均”数学家的合成图片 。除了这张图片里的人看起来和高尔顿合成的那些罪犯一样阴险之外 , 我们还会注意到 , 将胡子剃干净的人、一些络腮胡子的人以及更多一些蓄小胡子的人的肖像组合后 , 产生的类型看起来更像是某个一周没刮胡子的人 。

聚合:从表格和均值到最小二乘 | 统计学七支柱

文章插图

图1-9 庞佩利的12位数学家的复合肖像(Pumpelly 1885)

聚合:从表格和均值到最小二乘 | 统计学七支柱

文章插图

1.4 聚合与地球的形状到18世纪中期 , 统计聚合的运用已经扩展至许多场合 , 其测量是在迥异环境中做出的 。事实上 , 这也是环境使然 。一个最简单的例子是18世纪关于地球形状的研究 。初步估计 , 地球是一个球体;但随着航海和天文学精度的增加 , 问题随之而来 。艾萨克·牛顿出于动态角度的考虑 , 提出地球是个略扁的球体(在两极处压缩 , 在赤道处膨胀) 。法国天文学家多美尼科·卡西尼则认为 , 地球是一个扁长的球体——在两极拉长 。要想解决这个问题 , 可以比较在不同纬度的地面做出的测量 。从赤道到北极的几个不同地点 , 可以测量出一个相对较短的弧长——A 。这条弧的方向垂直于赤道 , 是由北极到赤道的所谓子午线1/4圆的一段 。可以先测量沿着地面的弧长 , 再除以两个端点的纬度差 , 结果是单位纬度的弧长 。纬度可通过仪器观测北极星与水平线的夹角测得 。观察这个1°的弧是如何随着到赤道的距离变动的 , 即可解决这个问题 。
椭圆积分给出了球体的弧长与纬度之间的关系 , 但一个简单公式就足以计算短距离(而且实际上 , 只有比较短的距离才可以测量) 。令A = 沿着地面测量的1°弧长 , L = 弧中点的纬度——这也是通过观测北极星决定的 , 则赤道有L = 0° , 北极有L = 90° 。因此 , A = z + ysin2L可以良好地近似每个测量的短弧度:

聚合:从表格和均值到最小二乘 | 统计学七支柱

文章插图

y 的值可以认为是一种极地超额(如果值为负 , 那就是不足) 。“椭圆率”(从球形形状出发的偏离测量)可以近似地计算为e = y/3z , 一个稍微改进的近似计算式是e = y/(3z + 2y)(有时会用到) 。
计算需要数据 。这个问题听起来很容易:测量任意两个度数 , 也许一个在赤道 , 另一个在罗马附近 。那个年代的长度采用“突阿斯”(Toise)计量 , 是“米”制单位出现之前的单位 , 一突阿斯约合6.39英尺1 。1°的纬度大约有70英里2那么长 , 实地测量太长、太难 , 因此需要测量一个短的距离再做推断 。1736年 , 皮埃尔·布格率领一个法国考察队 , 在今天厄瓜多尔的基多附近进行测量 , 那里可以在南北方向上测量接近赤道的较长距离 。他测出的长度是A = 56 751突阿斯以及sin2 L = 0 。1750年 , 耶稣会学者鲁杰罗·朱塞佩·博斯科维奇发现罗马附近的测量值是A = 56 979突阿斯以及sin2 L = 0.4648 。这给出了两个方程:

聚合:从表格和均值到最小二乘 | 统计学七支柱

文章插图

这些方程很容易解出 , 得到z = 56 751和y = 228/0.4648 = 490.5 , 以及e = 490.5/(3·56 751) = 1/347 , 那时人们喜欢这么写计算结果 。
但在18世纪50年代末 , 到博斯科维奇写出关于这个问题的报告为止 , 已经存在5个而不是2个获得肯定的弧长记录:基多(In America)、罗马(In Italia)、巴黎(In Gallia)、拉普兰(In Lapponia)以及一路南下直到非洲最南端的好望角(Ad Prom. B. S.) 。其中任何两个都会给出一个结果 , 因此博斯科维奇面临数据的窘境:共有10个解 , 且它们各不相同(如图1-10和图1-11所示) 。