一、一句话答案
2.66是统计学家算好的“尺子”,专门用来把“批间波动”换算成“单值正常范围”。
就像血压计上的刻度是事先标定好的,2.66这个数字也是统计学家通过复杂计算确定的“标尺刻度”。
二、拆解“2.66”背后的三层逻辑
第一层:我们要画一个“正常范围框”
目标:找到一个范围,让99.73%的正常数据都落在这个框里
统计学原理:数据如果服从正态分布,那么99.73%的数据会在平均值±3个标准差之内
第二层:但我们不知道“标准差”是多少
问题来了:标准差(σ)需要很多数据才能算准,而我们只有“批间变化幅度”(平均移动极差)这个相对容易算的指标。
巧妙转换:用“平均变化幅度”来估计“标准差”
统计学家发现:
标准差 ≈ 平均移动极差 ÷ 1.128
这个1.128也是个固定系数(叫做d₂系数,当n=2时)。
第三层:把两层逻辑合并
我们想要的是:控制限 = 平均值 ± 3 × 标准差
代入上面的转换:
控制限 = 平均值 ± 3 × (平均移动极差 ÷ 1.128)
= 平均值 ± (3 ÷ 1.128) × 平均移动极差
= 平均值 ± 2.66 × 平均移动极差
看!2.66就是这么来的:
2.66 = 3 ÷ 1.128
三、用生活中的例子理解
例子1:估测人群身高
假设你想快速估测中国人的平均身高范围,但没时间测量每个人,你发现:
兄弟俩的身高差平均是5厘米
统计规律:人群中身高差大约是兄弟身高差的1.128倍
正常人身高范围是平均身高±3倍标准差
那么:
正常身高范围 = 平均身高 ± 3×(5×1.128)
= 平均身高 ± 3×5.64
= 平均身高 ± 16.92
这里的“16.92”就像我们的2.66,是个换算系数。
例子2:看股票波动
如果你观察:
股票每日涨跌幅度平均是2元
历史规律:股价单日波动幅度大约是隔日价差的1.128倍
股价的正常波动范围是平均股价±3倍标准差
那么正常波动范围系数就是2.66。
四、为什么必须是2.66,不能是2.5或3.0?
这由数学规律决定
移动极差(相邻两批差异)与真正标准差的关系是固定的数学关系,就像:
圆的周长和直径比一定是π(3.14159...)
正方形的对角线和边长比一定是√2(1.414...)
对于“相邻两个数的差异”与“整体标准差”的关系:
换算系数 = 3 ÷ d₂
当比较两个数时,d₂ = 1.128
所以系数 = 3 ÷ 1.128 ≈ 2.66
对比不同情况下的系数
看出规律了吗? 比较的数据越多,系数越小,因为估算更准了。
五、在I-MR图中的具体应用
I图系数:2.66
控制上限 = 平均值 + 2.66 × 平均移动极差 控制下限 = 平均值 - 2.66 × 平均移动极差
作用:判断单个批次是否异常偏高或偏低。
MR图系数:3.267
控制上限 = 3.267 × 平均移动极差
这个3.267也是类似原理算出来的,专门用于判断“批间波动”是否异常。
六、实战中你只需要记住
2.66是“位置监控系数”
用来画I图的上下限
判断“这批次数值本身”是否异常
3.267是“波动监控系数”
用来画MR图的上限
判断“批次间变化幅度”是否异常
这两个数都是统计学家算好的
就像π=3.14159一样,是固定常数
你不需要自己算,直接用就行
全世界都用同样的系数,保证可比性
七、如果你真想自己验算
可以这样理解公式推导:
标准差σ ≈ MR̄ / d₂
其中d₂ = 1.128 (当n=2时)
3σ控制限 = 平均值 ± 3σ
= 平均值 ± 3 × (MR̄ / 1.128)
= 平均值 ± (3/1.128) × MR̄
= 平均值 ± 2.66 × MR̄
总结
2.66不是凭空捏造的,而是:
3σ原则(包含99.73%正常数据)的体现
通过移动极差估计标准差的数学转换结果
专门为“相邻两个数据比较” 场景设计的固定系数
在实际工作中,你不需要记住推导过程,只需要知道:
用2.66算出的范围,能抓住99.73%的正常批次
超出这个范围的批次,确实值得你重点关注
这是国际通用的标准方法,你的数据用这个方法处理,别人都看得懂
就像你用体温计不需要知道水银膨胀系数一样,用I-MR图也不需要深究2.66的推导——但知道了它的来历,你用起来会更踏实。