Android with root Git for version control Lircd with Raspberry Pi for IR receiver and sender Tips for Windows Depolying your own password management tool -- KeeWeb Depoly your flask app into Heroku Fix shit IE code manually ISBN to Book Category by Scraping DangDang A Generic Makefile for C/C++ Program Configure Raspberry pi Remove watermark with PyPDF2 tips for docker Anaconda+TensorFlow+CUDA Snippets Configure Remote Mathematica Kernel Build your own ngrok server Access Array SSL VPN 使用Rstudio制作html5幻灯片 tips for Mac OS X system Tips for ipython notebook 配置Ubuntu server + Openbox (Obuntu) tips for Vimperator tips for Vim 安装CUDA My First Jekyll Blog rsync常见选项 在Linux中读取Ipod touch的文件 tip for texmacs 在VPS上建站的一些tip Gnuplot绘图札记 Samba系统和autofs自动挂载 Linux中alsamixer声卡无法录音 搭建自己的RSS订阅器——Tiny Tiny RSS Grub2引导安装Ubuntu awk tips 将Ubuntu系统装入U盘 The Great Rtorrent 编译GCC 再这样剁手!!!该死的libgd 使用ulimit进行资源限制 使用SSH代理上IPV6 使用RCurl抓取网页数据 修复Ubuntu Grub记 openbox中的文件关联 在Ubuntu 12.04下编译qtiplot 处理BCM4312网卡驱动纪实 配置我的Ubuntu Server记 Cygwin杂记 Linux 使普通用户具有以超级权限执行脚本 让firefox自定义地处理文件类型 WordPress优秀主题及插件 在phpcloud上搭建wordpress UBUNTU下用pptpd做VPN server ubuntu升级内核过后的一些问题 安装telnet服务 kubuntu札记 64位kubuntu札记 统计软件R Virtualbox stardict星际译王 Ubuntu重装windows系统后的grub引导修复 SSH服务及花生壳域名解析 采用cbp2make工具由code::blocks工程创建makefile文件 UBUNTU 札记

均值标准误(standard error of the mean, SEM)的含义和计算方法

2015年10月14日

SEM这玩意儿看着简单,却花了我好些时间来理解其具体含义,在这里记一下。

假设你有一个非常奇怪的分布$X$,你想估计它的均值。非常简单地,抽取一个大小为$N$的样本,记为$x_1,x_2,…,x_N$。这$N$个样本的均值就是其均值的一个估计,但是你不知道这个估计有多准确,因为估计的样本均值会和抽样有关。

于是,我们分批次抽样,每批抽$N$个,都可以计算出一个样本均值$\mu$,并且这些样本均值会形成一个正态分布,此正态分布的均值为分布$X$的均值。 每次抽样的样本均值都会偏离这个样本均值正态分布的均值(也就是分布$X$的均值),也就是说用某一个样本均值来估计总体均值是有误差的。 自然地,我们想估计这个误差有多大。刚好样本均值正态分布的标准差可以代表误差的范围。

可以证明,样本均值正态分布的标准差\(SD_{\bar{x}}=\frac{\sigma}{\sqrt{N}}\),其中$\sigma$原始分布$X$的标准差,$N$为每次抽样的样本大小。

然而,$\sigma$我们也是不知道的,只有用某一次抽样的样本标准差来代替了。于是就得到了均值标准误$SE_{\bar{x}}=\frac{s}{\sqrt{N}}$。注意样本标准差是$s^2=\frac{\sum{(x-\bar{x})^2}}{N-1}$。

所以,计算SEM很简单,做一次抽样,样本数量为$N$,计算此样本的均值和标准差,可以代表这个均值的估计准确程度的SEM就是样本标准差除以$\sqrt{N}$。

显然,如果本来原始分布的标准差很大,对其均值的估计就不那么准,但是可以提高样本数量来提高估计的精确度。