假设检验

假设检验

零假设和备择假设

假设检验的a问题

只有两种选择的假设检验问题

检验过程(test)

判断假设的实验过程

零假设和备择假设

$H_0$叫做零假设,$H_1$叫做备择假设。当实验结果是$\theta \in \Omega_0$时,我们not reject $H_0$; 当实验结果是$\theta \in \Omega_1$时,我们reject $H_0$

简单假设 混合假设

定义

如果$\Omega_i$包含多个值,那么$H_i$就是混合假设;如果$\Omega_i$只包含一个值,那么$H_i$就是简单假设

举例

  • 一个简单空假设$H_0:\theta = \theta_0$

单边和双边假设

定义

  1. 单边假设

$$ H_0 \le \theta ,H_1 \gt \theta \\\ \\ H_0 \ge \theta ,H_1 \lt \theta $$

  1. 双边假设

$$ (一般,若零假设为简单假设),即H_0 = \theta \\\ \\ 那么H_1 \neq \theta,为\pmb{双边假设} $$

批判性区域和检验统计

批判性区域

$$ 对于一个均值未知,方差已知的正态分布 \\\ \\ H_0 : \mu = \mu_0 ; H_1 : \mu \neq \mu_0 \\\ \\ c是一个很小的常数 \\\ \\ 当\overline {X_n}和\mu的差值超过c,我们就拒绝H_0\\\ \\ 即 S_0 = \lbrace x: |\overline{X_n} - \mu_0| \lt c\rbrace . \ S_1 = S_0^c \\\ \\ S_1 就叫做\pmb{批判性区域} $$

  • 在大多数情况下,用统计量$T = r(\pmb X)$表示,叫做rejection region

检验统计和拒绝域

$$ 对于一个分布X, T = r(X)是统计量,R是实线 的子集\\\ \\ 假设一个检验过程有以下假设 \\\ \\ H_0: \theta \in \Omega_0 , H_1: \theta \in \Omega_1 \\\ \\ 若在T \in R时,我们\pmb{拒绝 H_0} \\\ \\ 那么T叫做\pmb{检验统计},R叫做\pmb{拒绝域} $$

幂函数和错误类型

幂函数

$$ \pi (\theta | \delta) 叫做测试\delta 的幂函数 \\\ \\ 并且 \pi (\theta | \delta) = Pr(X \in S_1 | \theta) , \theta \in \Omega \\\ \\ 或者 \pi (\theta | \delta) = Pr(T \in R| \theta) , \theta \in \Omega $$

两种错误类型

Type I 弃真

$H_0: \theta \in \Omega_0$是真的,但是我们reject $H_0$

Type II 纳伪

$H_0: \theta \in \Omega_0$是假的,但是我们not to reject $H_0$

显著性($\alpha$)水平

定义

显著水平,也称为α水平或显著性水平,是用于衡量在假设检验中拒绝原假设的临界值。通常情况下,显著水平的取值为0.05或0.01,代表了在一次实验中,我们允许犯错误的概率大小。

p-值

定义

一般的,p值是最小的显著性水平\alpha_0

计算

假设检验的步骤

  1. 确定原假设和备择假设:原假设(null hypothesis)是我们想要检验的陈述,通常是指样本数据与总体相同。备择假设(alternative hypothesis)则是与原假设相反的假设,通常是指样本数据与总体不同。

  2. 确定显著水平:显著水平(significance level)是判断是否拒绝原假设的临界值,通常设定为0.05或0.01。

  3. 选择合适的假设检验方法:根据样本数据类型和实验设计等因素,选择合适的假设检验方法,如t检验、F检验、卡方检验等。

  4. 计算统计量:根据假设检验方法的要求,计算相应的统计量,如t值、F值、卡方值等。

  5. 确定拒绝域:拒绝域是指统计量达到或超过一定临界值时,我们会拒绝原假设的范围。

  6. 计算p值:p值是指在原假设成立的情况下,出现观察值或更极端观察值的概率。通过计算p值,我们可以判断观察值是否落在了拒绝域内。

  7. 做出结论:根据p值或统计量是否达到拒绝域,来判断是否拒绝原假设。如果拒绝原假设,则说明样本数据与总体存在显著差异;反之,则说明样本数据与总体相同。

几种检验

t检验

$$ 单样本t检验 \\\ \\ t = \frac{X-\mu}{\sigma / \sqrt{n}} \\\ \\ 双样本t检验 \\\ \\ 独立样本t检验 \\\ \\ t = \frac{X_1 -X_2}{\sqrt{\sigma^2_1/n_1 + \sigma_2^2/n_2}} \\\ \\ 配对样本t检验 \\\ \\ t = \frac{D}{\sigma_D/\sqrt n} \\\ \\ 其中,D为配对样本的差值,\sigma_D为D的标准差 $$

F检验

Licensed under CC BY-NC-SA 4.0
comments powered by Disqus
Built with Hugo
Theme Stack designed by Jimmy