本节内容主要整理自教材《Introduction to Econometrics 4th》James H. Stock & Mark W. Watson 中文译本 王立勇 & 徐晓莉 机械工业出版社 2023

注:本章内容以对$\mu_Y$的估计为例,简要分析假设检验原理,其他参数估计类似

1. 假设检验

假设检验是统计学中的一个重要概念,也是计量的核心之一。在费很大劲构造了样本估计量之后,此时为了验证原假设是否正确,需要进一步构建检验统计量例如t统计量,根据其(大样本)分布进而计算p值,而这往往也是大家最关心的(hhh)。一般来讲,假设检验分三步:1. 计算估计量标准误;2. 构建检验统计量;3. 计算p值并结合预定的显著性水平判断原假设是否成立。

1.1 原假设和备择假设

原假设($\text{H}_0$)是指需要检验的假设,备择假设($\text{H}_1$)是与原假设构成比较的假设,即当原假设不成立时,备择假设成立。具体例子:

$$ \begin{align*} \text{H}_0: \quad \text{E}(Y) &= \mu_{Y,0} \\ \text{H}_1: \quad \text{E}(Y) &\neq \mu_{Y,0} \end{align*}$$

1.2 p值

p值是指原假设为真时,样本统计量与原假设之间的差异程度大于样本实际值与原假设之间的差异程度的概率。以$\bar{Y}$为例:

$$ \text{p-value} = \text{Pr}_{\text{H}_0}(| \bar{Y} - \mu_{Y,0}| > |\bar{Y}^\text{act} - \mu_{Y,0}|) $$

简单来说,p值反映了单次抽样结果是否异常:若不存在异常(p值较大,即该抽样结果与原假设差距较小),我们可以认为原假设成立,只是存在抽样误差;若存在异常(p值较小,即该抽样结果与原假设差距很大),我们可以认为若原假设成立,则抽到这样的样本的概率很小,因此更合理的结论是原假设不成立。

1.3 当$\sigma_Y$已知时p值计算

$$ \begin{align} \begin{aligned} \text{p-value} &= \text{Pr}{\text{H}_0}(| \frac{\bar{Y} - \mu{Y,0}}{\sigma_\bar{Y}}| > |\frac{\bar{Y}^\text{act} - \mu{Y,0}}{\sigma_\bar{Y}}|) \\ &= 2 \Phi(- |\frac{\bar{Y}^\text{act} - \mu_{Y,0}}{\sigma_\bar{Y}}|) \quad \text{and} \quad \sigma_\bar{Y} = \frac{\sigma_Y}{\sqrt{n}} \end{aligned} \end{align} $$

具体推导如下:

$$ \begin{align} \begin{aligned} \sigma_\bar{Y}^2 &= \text{Var}(\frac{1}{n} \sum Y_i) \\ &= \frac{1}{n^2} \text{Var}(\sum Y_i) \\ &= \frac{1}{n^2} \sum \sum \text{Cov}(Y_i, Y_j) \\ &= \frac{1}{n^2}(\sum \text{Var}(Y_i) + \sum \sum_{i\neq j} \underbrace{\text{Cov}(Y_i, Y_j)}_{0, \ \text{for i.i.d.}}) \\ &= \frac{1}{n^2}\sum \text{Var}(Y_i) \\ &= \frac{\sigma_Y^2}{n} \end{aligned} \end{align} $$

1.4 当$\sigma_Y$未知时p值计算

$$ \text{p-value} = 2 \Phi(-|\frac{\bar{Y}^\text{act} - \mu_{Y,0}}{\hat{\sigma}_\bar{Y}}|) \quad \text{and} \quad \hat{\sigma}_\bar{Y} = \frac{s_Y}{\sqrt{n}} $$

1.5 $t$统计量

$$ t = \frac{\bar{Y} - \mu_{Y,0}}{\hat{\sigma}_\bar{Y}} $$

下面证明$t$统计量依分布收敛于标准正态分布。

首先,将$t$分解为两项,具体地,

$$ t = \frac{\sqrt{n}(\bar{Y} - \mu_{Y,0})}{\sigma_Y} \bigg/ \frac{s_Y}{\sigma_Y} $$

对于第一项,利用中心极限定理即可知其依分布收敛于标准正态分布;而对于第二项,我们此前已经证明过$\frac{s_Y^2}{\sigma_Y^2} \stackrel{p}{\longrightarrow} 1$,此时根据连续映射定理,可以得到$\frac{s_Y}{\sigma_Y} \stackrel{p}{\longrightarrow} 1$。


连续映射定理(Continuous mapping theorem)

$$ \begin{align} \text{if} \quad S_n &\stackrel{p}{\longrightarrow} a, &g(S_n)\stackrel{p}{\longrightarrow}g(a) \\ \text{if} \quad S_n &\stackrel{d}{\longrightarrow} S, &g(S_n)\stackrel{d}{\longrightarrow}g(S) \end{align} $$

最后利用Slutsky定理即可完成证明。此时,$\text{p-value} = 2 \Phi(-|t^\text{act}|)$,可以通过标准正态分布来计算p值,进一步地,可以根据显著性水平构建置信区间,若为5%,则$\mu_Y$的95%置信区间为$\bar{Y}^\text{act} \pm 1.96 \hat{\sigma}_\bar{Y}$。

一蓑烟雨任平生
最后更新于 2025-03-30