《女士品茶》第二章的核心内容聚焦于**卡尔·皮尔逊(Karl Pearson)及其导师弗朗西斯·高尔顿(Francis Galton)**如何开启了统计学革命,并将科学研究的焦点从“精确测量”转移到了“概率分布”上。
以下是第二章《偏斜分布》的学习笔记:
1. 统计革命的开端:从决定论到概率论
背景:19世纪的科学观是决定论的,认为一切皆有精确的数学公式,观测误差仅是仪器不精确造成的。
皮尔逊的突破:卡尔·皮尔逊(Karl Pearson)在19世纪90年代提出了一种革命性的观点。他认为,实验结果的随机性是大自然固有的,而非仅仅是测量误差。科学研究的对象不应是某个具体的物体或一次测量的数值,而是描述这些数值出现概率的数学分布函数。
2. 弗朗西斯·高尔顿与生物统计
生物统计实验室:皮尔逊受到了高尔顿的深刻影响。高尔顿在伦敦建立了生物统计实验室,收集了大量家庭成员的身高、体重等数据。
均值回归与相关性:高尔顿通过数据发现了“均值回归”现象(例如,极高父亲的儿子往往比父亲矮,极矮父亲的儿子往往比父亲高),这解释了为什么物种特征能保持稳定。他还发明了“相关系数”来量化这种关系。
3. 皮尔逊的“偏斜分布”体系
皮尔逊提出了一套**“偏斜分布”**(Skewed Distributions)的族系,宣称这套体系可以描述科学中遇到的任何数据分布。
在这个体系中,任何分布都可以由四个参数来确定:
均值(中心位置)
标准差(分散程度)
对称度(偏斜程度)
峰度(极端值的频度
哲学转变:这标志着一种哲学转变——现实是概率分布,我们观测到的数据只是分布的随机样本。科学家需要做的是通过数据去估计这四个参数。
4. 《生物统计》(Biometrika)期刊的创立
目的:为了用数学方法证明达尔文的进化论(特别是自然选择如何改变物种的分布参数),皮尔逊、高尔顿和韦尔登(Weldon)联手创办了《生物统计》期刊。
内容:期刊收集了世界各地的生物测量数据(从蟹壳大小到人类头骨),并计算其分布参数,试图寻找进化的证据。虽然他们没能直接观察到物种形成,但这本期刊奠定了现代数理统计学的基础。
5. 韦尔登的螃蟹实验
书中提到了韦尔登设计的一个著名实验,试图通过对比在泥水和清水中生存的螃蟹的甲壳尺寸分布,来证明自然选择的作用。虽然实验因韦尔登去世而未得出最终定论,但它展示了早期统计学家如何试图用数据验证生物学理论。
总结:
第二章确立了统计学的核心世界观:世界是随机的,但这种随机性服从特定的数学分布。皮尔逊的工作让科学家们意识到,他们不再需要追求单个数据的绝对精确,而是通过收集数据来估计支配这些现象的“分布参数”。这是现代科学建模思想的起源。
第2章完~