1. 前言
《女性品茶:20世纪统计怎样变革了科学》
作者:萨尔斯伯格,美国统计学会(the American Statistical Association)的Fellow
该书通俗生动地介绍了20世纪统计学的发展主线
2. 假设检验的基本步骤
- Step1:建立假设:\(H_0: \theta \in \Theta_0 \ vs \ H_1: \theta \in \Theta_1\)
- Step2:选择检验统计量,给出拒绝域\(W\)的形式。
- 所谓拒绝域是指使原假设被拒绝的样本观测值所在的区域\(W\),一般将\(\bar{W}\)称为接受域。
- Step3:选择显著性水平\(\alpha\)。
- \(\alpha = P(拒绝H_0|H_0为真) = P_0(X \in W), \theta \in \Theta_0\),给出拒绝域的具体范围。
3. 假设检验问题的两类错误和P值
3.1 假设检验问题的两类错误
原假设成立 | 原假设不成立 | |
---|---|---|
接受 | \(\surd\) | 第二类错误(受伪) |
拒绝 | 第一类错误(拒真) | \(\surd\) |
第一类错误即为显著性水平\(\alpha = P(拒绝H_0 | H_0为真) = P_0(X \in W)\)
第二类错误的概率表达为\(\beta = P(接受H0 | H_1为真) = P_0(X \in \bar{W}), \theta \in \Theta_1\)
- 假设检验中,犯两类错误的概率不可能同时减小,二者相互制约
- 犯第一类错误的概率越小,则犯第二类错误的概率越大
- 犯第二类错误的概率越小,则犯第一类错误的概率越大
- 比如在考试中,设置分数线高低,对于学的好的同学和学的差同学的通过率问题
- 原假设和备择假设不能随意互换位置,原假设是人们经验上认为正常的假设
- 理想的检验应该是在控制犯第一类错误的基础上,尽量少犯第二类错误
- 显著性检验具有“保护原假设”的特点,显著性水平也不是越小越好
- 固定第一类错误的发生概率,可通过增加样本量降低犯第二类错误的概率
3.2 P值
\(p\)值:在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平,称为检验的\(p\)值。或者说,在原假设下,出现比观测值更极端情况的概率。\(p\)值是相对某一次观测结果而言的。
4. 单个正态总体参数的假设检验
设\(X_1, X_2, …, X_n\)是来自正态总体\(N(\mu, \sigma^2)\)的样本,考虑如下3种关于\(\mu\)的检验问题
\(H_0: \mu \leq \mu_0 \ vs \ H_1: \mu > \mu_0\),单侧检验1
\(H_0: \mu \geq \mu_0 \ vs \ H_1: \mu < \mu_0\),单侧检验2
\(H0: \mu = \mu_0 \ vs \ H_1: \mu \ne \mu_0\),双侧检验3
4.1 \(\sigma\)已知时
对于单侧检验1,\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\),故选用服从标准正态分布的检验统计量\[\mu = \frac{\bar{X} - \mu_0}{\frac{\sigma}{\sqrt{n}}},\]通常称为\(u\)检验。
拒绝域选为\[W = \left\{(x_1, x_2, …, x_n): u = \frac{\sqrt{n}(\bar{x}-\mu_0)}{\sigma} \geq c\right\},\]
\(c\)为临界值,简记为\({u \geq c}\)。
若显著性水平要求为\(\alpha\),则可确定\(c = u_{1-\alpha}\)。
4.2 \(\sigma\)未知时
正态总体\(N(\mu, \sigma^2)\)关于\(\mu\)的假设检验,可以利用服从\(n-1\)自由度的\(t\)分布统计量\(t = \frac{\sqrt{n}(\bar{X} - \mu_0)}{S}\)进行检验,通常称为t检验,三种关于\(\mu\)检验问题的显著性水平为\(\alpha\)的拒绝域分别为
- \(W = \left\{(x_1, x_2, …, x_n): t = \frac{\sqrt{n}(\bar{x} - \mu_0)}{s} \geq t_{1-\alpha}(n - 1)\right\}\)
- \(W = \left\{(x_1, x_2, …, x_n): t = \frac{\sqrt{n}(\bar{x} - \mu_0)}{s} \leq t_{1-\alpha}(n - 1)\right\}\)
- \(W = \left\{(x_1, x_2, …, x_n): t = \frac{\sqrt{n}(\bar{x} - \mu_0)}{s} \leq t_{1-\frac{\alpha}{2}}(n - 1)\right\}\)
4.3 假设检验与置信区间存在密切的关联
- \(H_0: \mu \leq \mu_0 \ vs \ H_1: \mu > \mu_0\),接受域为\(1 - \alpha\)置信水平的上侧置信限的置信区间
- \(H_0: \mu \geq \mu_0 \ vs \ H_1: \mu < \mu_0\),接受域为\(1 - \alpha\)置信水平的下侧置信限的置信区间
- \(H_0: \mu = \mu_0 \ vs \ H_1: \mu \ne \mu_0\),接受域为\(1 - \alpha\)置信水平的双边置信区间
5. 拟合优度检验
5.1 卡方检验
设总体服从离散分布$X $