首页 > 学院 > 开发设计 > 正文

【数学】方差/标准差的各种估计辨析

2019-11-06 08:55:22
字体:
来源:转载
供稿:网友

常用的方差(variance)、标准偏差(standard derivation)的内涵和计算方法有许多容易混淆之处,本文进行梳理。

统计量的定义

对于随机变量

对于随机变量X,我们用期望定义了其统计量。这些统计量都是固定的常数。 均值: μ=E[X]

方差: var=σ2=E[(X−μ)2]=E[X2]−μ2

标准偏差就是方差的平方根: std=σ

对于已知样本集

如果全体样本集(polulation)的每一个样本x1,x2...xN都能直接使用,可以直接计算出该样本集的各种统计量。 μ=1N∑ixi

var=1N∑i(xi−μ)2

std=var−−−√

这样计算得到的方差常被称为全体方差(population variance)。

统计量的估计

有时候无法得知统计量的实际值: - 对于随机变量,无法观测产生这个变量的参数,只能得到一系列随机采样; - 对于数量巨大、甚至无穷多的样本集,我们无法使用全部样本进行计算,只能随机有放回地抽取一部分采样

由于两种情况都包含有随机性,所以估计得到的统计量本身也是个随机变量,并非真实值。用上横线以示区分。

估计可以有不同方法,各有不同性质。

复习一下期望的性质。 E(A+B)=EA+EB, E(AB)≠EA⋅EB, 换言之:期望和线性运算可交换。

均值

对均值的估计直观而统一: μ¯=1N∑ixi

这个估计是无偏的(估计的期望等于真实值): E[μ¯]=1N∑iE[xi]=E[X]=μ

方差

方差涉及到二次项,情况复杂一些。

有偏方差

var¯=1N∑i(xi−μ¯)2 这个估计是有偏的

证明提示:把μ¯写成xi的求和形式。利用以下两个性质: E[x2i]=σ2+μ2 E[xixj]=E[xi]E[xj]=μ2

具体推导引自wiki: 这里写图片描述

这样的估计方差总是小于真实方差。 估计方差和真实方差之间差距为1Nσ2,采样越多,偏差越小。

换句话说,总有你想不到的幺蛾;见识越少,幺蛾越大。

不过,如果随机变量/样本集的均值已知,则类似的方差估计是无偏的: var¯=1N∑i(xi−μ)2

证明提示:μ是常数,可以直接和期望交换。

无偏方差

对有偏方差进行矫正: var¯=1N−1∑i(xi−μ¯)2

标准偏差

标准偏差的问题更为复杂。从定义上来说std¯=var¯−−−√。但由于开根号不是线性运算,不能和期望交换。

无矫正(uncorrected)标准偏差

喜闻乐见的直观形式: std¯=1N∑i(xi−μ¯)2−−−−−−−−−−−−√

这个估计当然是有偏的(比真实值小),不过是一致的(consistent,随着N增大依概率收敛到真值)。

矫正(corrected)标准偏

通过对无偏方差开根号得来: std¯=1N−1∑i(xi−μ¯)2−−−−−−−−−−−−−−−√

需要注意的是,由于平方根不能和期望交换,这个估计依然是有偏的,不过比前一个估计好一些。

考察这个估计的期望: E[std¯]=E[var¯−−−√] 再考虑交换运算的式子: E[var¯]−−−−−−√=var−−−√=std 由于期望是线性运算,开根号是凹函数,根据延森不等式: E[std¯]=E[var¯−−−√]<E[var¯]−−−−−−√=var−−−√=std

这个估计仍然比真实的标准偏差。具体小多少,要依数据分布而定。

无偏标准偏差

不同随机变量的无偏标准偏差估计具有不同形式,具体参看这里。 一个近似的估计是将前一方法中的分母N−1增大为N−1.5std¯=1N−1.5∑i(xi−μ¯)2−−−−−−−−−−−−−−−−−√


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表