均值标准误(standard error of the mean, SEM)的含义和计算方法

2015年10月14日

SEM这玩意儿看着简单,却花了我好些时间来理解其具体含义,在这里记一下。

假设你有一个非常奇怪的分布$X$,你想估计它的均值。非常简单地,抽取一个大小为$N$的样本,记为$x_1,x_2,…,x_N$。这$N$个样本的均值就是其均值的一个估计,但是你不知道这个估计有多准确,因为估计的样本均值会和抽样有关。

于是,我们分批次抽样,每批抽$N$个,都可以计算出一个样本均值$\mu$,并且这些样本均值会形成一个正态分布,此正态分布的均值为分布$X$的均值。 每次抽样的样本均值都会偏离这个样本均值正态分布的均值(也就是分布$X$的均值),也就是说用某一个样本均值来估计总体均值是有误差的。 自然地,我们想估计这个误差有多大。刚好样本均值正态分布的标准差可以代表误差的范围。

可以证明,样本均值正态分布的标准差,其中$\sigma$原始分布$X$的标准差,$N$为每次抽样的样本大小。

然而,$\sigma$我们也是不知道的,只有用某一次抽样的样本标准差来代替了。于是就得到了均值标准误$SE_{\bar{x}}=\frac{s}{\sqrt{N}}$。注意样本标准差是$s^2=\frac{\sum{(x-\bar{x})^2}}{N-1}$。

所以,计算SEM很简单,做一次抽样,样本数量为$N$,计算此样本的均值和标准差,可以代表这个均值的估计准确程度的SEM就是样本标准差除以$\sqrt{N}$。

显然,如果本来原始分布的标准差很大,对其均值的估计就不那么准,但是可以提高样本数量来提高估计的精确度。