电话做网站的推广,用jsp做的网站前后端交互,网页界面设计与制作书籍,如何被百度收录contents 前言第5章 大数定律与中心极限定理独立同分布中心极限定理 第6章 数理统计的基本概念6.1 总体与样本6.2 经验分布与频率直方图6.3 统计量6.4 正态总体抽样分布定理6.4.1 卡方分布、t 分布、F 分布6.4.2 正态总体抽样分布基本定理 第7章 参数估计7.1 点估计7.1.1 矩估计… contents 前言第5章 大数定律与中心极限定理独立同分布中心极限定理 第6章 数理统计的基本概念6.1 总体与样本6.2 经验分布与频率直方图6.3 统计量6.4 正态总体抽样分布定理6.4.1 卡方分布、t 分布、F 分布6.4.2 正态总体抽样分布基本定理 第7章 参数估计7.1 点估计7.1.1 矩估计法7.1.2 极大似然估计法 7.2 估计量的评价标准7.2.1 无偏性7.2.2 有效性7.2.3 一致性 7.3 区间估计7.3.1 基本概念7.3.2 区间估计常用方法之主元法7.3.3 正态总体的区间估计 第8章 假设检验8.1 假设检验的基本概念8.2 单个正态总体均值的假设检验8.3 单个正态总体方差的假设检验 前言
更好的阅读体验https://blog.dwj601.cn/GPA/4th-term/ProbAndStat/
笔记范围五至八章。一至四章请跳转https://blog.csdn.net/qq_73408594/article/details/140190525
教材情况
课程名称选用教材版次作者出版社ISBN号概率论与数理统计Ⅰ概率论与数理统计第一版刘国祥王晓谦 等主编科学出版社978-7-03-038317-4
学习资源 视频资源《概率论与数理统计》教学视频全集宋浩 教材答案https://pan.baidu.com/s/1yeC0rxatHaLeNHQaW85Kpw?pwd448w
第5章 大数定律与中心极限定理
{% note light %}
本章只需要知道一个独立同分布中心极限定理即可至于棣莫弗-拉普拉斯中心极限定理其实就是前者的 { X i } i 1 ∞ \{X_i\}_{i1}^{\infty} {Xi}i1∞ 服从伯努利 n n n 重分布罢了。
{% endnote %}
独立同分布中心极限定理
定义 { X i } i 1 ∞ \{X_i\}_{i1}^{\infty} {Xi}i1∞ 独立同分布且非零方差其中 E X i μ , D X i σ 2 EX_i\mu,DX_i\sigma^2 EXiμ,DXiσ2则有 ∑ i 1 n X i ∼ N ( ∑ i 1 n ( E X i ) , ∑ i 1 n ( D X i ) ) ∼ N ( n μ , n σ 2 ) \begin{aligned} \sum_{i1}^n X_i \sim N(\sum_{i1}^n(EX_i),\sum_{i1}^n(DX_i)) \\ \sim N(n\mu,n\sigma^2) \end{aligned} i1∑nXi∼N(i1∑n(EXi),i1∑n(DXi))∼N(nμ,nσ2) 解释其实就是对于独立同分布的随机事件 X i X_i Xi在事件数 n n n 足够大时就近似为正态分布术语叫做依分布。这样就可以很方便利用正态分布的性质计算当前事件的概率。至于棣莫弗-拉普拉斯中心极限定理就是上述 μ p , σ 2 p ( 1 − p ) \mup,\sigma^2p(1-p) μp,σ2p(1−p) 的特殊情况罢了
第6章 数理统计的基本概念
{% note light %}
开始统计学之旅。
{% endnote %}
6.1 总体与样本
类比 ML数据集总体样本样本。
我们只研究一种样本简单随机样本 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn)。符合下列两种特点 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) 相互独立 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) 同分布
同样的我们研究总体 X X X 的分布与概率密度一般概率密度会直接给需要我们在此基础之上研究所有样本的联合密度 分布由于样本相互独立故 F ( x 1 , x 2 , . . . , x n ) F ( x 1 ) F ( x 2 ) ⋯ F ( x n ) F(x_1,x_2,...,x_n)F(x_1)F(x_2) \cdots F(x_n) F(x1,x2,...,xn)F(x1)F(x2)⋯F(xn) 联合密度同样由于样本相互独立故 p ( x 1 , x 2 , . . . , x n ) p ( x 1 ) p ( x 2 ) ⋯ p ( x n ) p(x_1,x_2,...,x_n)p(x_1)p(x_2) \cdots p(x_n) p(x1,x2,...,xn)p(x1)p(x2)⋯p(xn)
6.2 经验分布与频率直方图
经验分布函数是利用样本得到的。也是给区间然后统计样本频度进而计算频率只不过区间长度不是固定的。
频率直方图就是选定固定的区间长度然后统计频度进而计算频率作图。
6.3 统计量
统计量定义关于样本不含未知数的表达式。
常见统计量假设 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) 为来自总体 X X X 的简单随机样本
一、样本均值和样本方差 样本均值 X ‾ 1 n ∑ i 1 n X i \displaystyle \overline{X} \frac{1}{n} \sum_{i1}^n X_i Xn1i1∑nXi 样本方差 S 0 2 1 n ∑ i 1 n ( X i − X ‾ ) 2 1 n ∑ i 1 n X i 2 − X ‾ 2 \displaystyle S_0^2 \frac{1}{n} \sum_{i1}^n (X_i - \overline{X})^2 \frac{1}{n}\sum_{i1}^n X_i^2 - \overline{X}^2 S02n1i1∑n(Xi−X)2n1i1∑nXi2−X2 样本标准差 S 0 S 0 2 \displaystyle S_0 \sqrt{S_0^2} S0S02 修正样本方差 S 2 1 n − 1 ∑ i 1 n ( X i − X ‾ ) 2 \displaystyle S^2 \frac{1}{n-1} \sum_{i1}^n (X_i - \overline{X})^2 S2n−11i1∑n(Xi−X)2 修正样本标准差 S S 2 \displaystyle S \sqrt{S^2} SS2 {% fold light 推导 %} 设总体 X X X 的数学期望和方差分别为 μ \mu μ 和 σ 2 \sigma^2 σ2 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) 是简单随机样本则 即样本均值的数学期望 总体的数学期望 即样本方差的数学期望 ≠ \ne 总体的数学期望 上图即修正样本方差推导 {% endfold %} 样本 k k k 阶原点矩 A k 1 n ∑ i 1 n X i k , k 1 , 2 , ⋯ \displaystyle A_k \frac{1}{n} \sum_{i1}^n X_i^k,\quad k1,2,\cdots Akn1i1∑nXik,k1,2,⋯ 样本 k k k 阶中心矩 B k 1 n ∑ i 1 n ( X i − X ‾ ) k , k 2 , 3 , ⋯ \displaystyle B_k \frac{1}{n} \sum_{i1}^n (X_i-\overline{X})^k,\quad k2,3,\cdots Bkn1i1∑n(Xi−X)k,k2,3,⋯
二、次序统计量
序列最小值序列最大值极差 序列最大值 - 序列最小值
6.4 正态总体抽样分布定理
{% note light %}
时刻牢记一句话构造性定义
{% endnote %}
6.4.1 卡方分布、t 分布、F 分布
分位数
我们定义实数 λ α \lambda_\alpha λα 为随机变量 X X X 的上侧 α \alpha α 分位数点当且仅当 P ( X λ α ) α P(X \lambda_\alpha) \alpha P(Xλα)α我们定义实数 λ 1 − β \lambda_{1-\beta} λ1−β 为随机变量 X X X 的下侧 β \beta β 分位数点当且仅当 P ( X λ 1 − β ) β P(X \lambda_{1-\beta})\beta P(Xλ1−β)β χ 2 \chi^2 χ2 分布
{% fold light 密度函数图像 %} {% endfold %}
定义
对于 n n n 个独立同分布的标准正态随机变量 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots ,X_n X1,X2,⋯,Xn若 Y X 1 2 X 2 2 ⋯ X n 2 Y X_1^2 X_2^2 \cdots X_n^2 YX12X22⋯Xn2则 Y Y Y 服从自由度为 n n n 的 χ 2 \chi^2 χ2 分布记作 Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Y∼χ2(n)
性质 可加性若 Y 1 ∼ χ 2 ( n 1 ) , Y 2 ∼ χ 2 ( n 2 ) Y_1 \sim \chi^2(n_1), Y_2 \sim \chi^2(n_2) Y1∼χ2(n1),Y2∼χ2(n2) 且 Y 1 , Y 2 Y_1,Y_2 Y1,Y2 相互独立则 Y 1 Y 2 ∼ χ 2 ( n 1 n 2 ) Y_1Y_2 \sim \chi^2(n_1n_2) Y1Y2∼χ2(n1n2) 统计性对于 Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Y∼χ2(n)有 E Y n , D Y 2 n EY n, DY 2n EYn,DY2n {% fold light 推导 %} EY 的推导利用 E X 2 D X − ( E X ) 2 EX^2 DX - (EX)^2 EX2DX−(EX)2 DY 的推导利用方差计算公式、随机变量函数的数学期望进行计算 {% endfold %} t t t 分布
{% fold light 密度函数图像 %} {% endfold %}
定义
若随机变量 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0, 1),Y \sim \chi^2 (n) X∼N(0,1),Y∼χ2(n) 且 X , Y X,Y X,Y 相互独立则称随机变量 T X Y / n T \displaystyle \frac{X}{\sqrt{Y/n}} TY/n X 为服从自由度为 n n n 的 t t t 分布记作 T ∼ t ( n ) T \sim t(n) T∼t(n)
性质
密度函数是偶函数具备对称性 F F F 分布
{% fold light 密度函数图像 %} {% endfold %}
定义
若随机变量 X ∼ χ 2 ( m ) , Y ∼ χ 2 ( n ) X \sim \chi^2(m), Y \sim \chi^2(n) X∼χ2(m),Y∼χ2(n) 且相互独立则称随机变量 G X / m Y / n G\displaystyle \frac{X/m}{Y/n} GY/nX/m 服从自由度为 ( m , n ) (m,n) (m,n) 的 F F F 分布记作 G ∼ F ( m , n ) G \sim F(m, n) G∼F(m,n)
性质
倒数自由度转换 1 G ∼ F ( n , m ) \displaystyle \frac{1}{G} \sim F(n, m) G1∼F(n,m)三变性质 F 1 − α ( m , n ) [ F α ( n , m ) ] − 1 \displaystyle F_{1-\alpha}(m, n) \left [F_\alpha (n, m)\right]^{-1} F1−α(m,n)[Fα(n,m)]−1
6.4.2 正态总体抽样分布基本定理
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots ,X_n X1,X2,⋯,Xn 是来自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的简单随机样本 X ‾ , S 2 \overline{X},S^2 X,S2 分别是样本均值和修正样本方差。则有
定理 X ‾ ∼ N ( μ , σ 2 n ) \displaystyle \overline{X} \sim N(\mu, \frac{\sigma^2}{n}) X∼N(μ,nσ2) ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \displaystyle \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1) X ‾ \overline{X} X 和 S 2 S^2 S2 相互独立
推论 n ( X ‾ − μ ) S ∼ t ( n − 1 ) \displaystyle \frac{\sqrt{n}(\overline{X} - \mu)}{S} \sim t(n-1) Sn (X−μ)∼t(n−1)
第7章 参数估计
{% note light %}
有些时候我们知道数据的分布类型但是不清楚表达式中的某些参数这就需要我们利用「已有的样本」对分布表达式中的参数进行估计。本章我们将从点估计、估计评价、区间估计三部分出发进行介绍。
{% endnote %}
7.1 点估计
{% note light %}
所谓点估计策略就是直接给出参数的一个估计值。本目我们介绍点估计策略中的两个方法矩估计法、极大似然估计法。
{% endnote %}
7.1.1 矩估计法
其实就一句话我们用样本的原点矩 A k A_k Ak 来代替总体 E ( X k ) E(X^k) E(Xk) k k k 个未知参数就需要用到 k k k 个原点矩 E ( X k ) A k 1 n ∑ i 1 n X i k E(X^k) A_k \frac{1}{n}\sum_{i1}^nX_i^k E(Xk)Akn1i1∑nXik
7.1.2 极大似然估计法
基本原理是在当前样本数据的局面下我们希望找到合适的参数使得当前的样本分布情况发生的概率最大。由于各样本相互独立因此我们可以用连乘的概率公式来计算当前局面的概率值 L ( θ ; x 1 , x 2 , ⋯ , x n ) L(\theta;x_1,x_2,\cdots,x_n) L(θ;x1,x2,⋯,xn) 上述 L ( θ ; x 1 , x 2 , ⋯ , x n ) L(\theta;x_1,x_2,\cdots,x_n) L(θ;x1,x2,⋯,xn) 即似然函数目标就是选择适当的参数 θ \theta θ 来最大化似然函数。无论是离散性还是连续型都可以采用下面的方式来计算极大似然估计
写出似然函数 L ( θ ) L(\theta) L(θ)将上述似然函数取对数求对数似然函数关于所有未知参数的偏导并计算极值点解出参数关于样本统计量的表达式
离散型随机变量的似然函数表达式 L ( θ ) ∏ i 1 n p ( x i ; θ ) ∏ i 1 n P ( X i x i ) L(\theta) \prod_{i1}^n p(x_i;\theta) \prod_{i1}^n P(X_i x_i) L(θ)i1∏np(xi;θ)i1∏nP(Xixi) 连续型随机变量的似然函数表达式 L ( θ ) ∏ i 1 n p ( x i ; θ ) L(\theta) \prod_{i1}^n p(x_i;\theta) L(θ)i1∏np(xi;θ) 可以看出极大似然估计本质上就是一个多元函数求极值的问题。特别地当我们没法得到参数关于样本统计量的表达式 L ( θ ) L(\theta) L(θ) 时可以直接从定义域、原函数恒增或恒减等角度出发求解这个多元函数的极值。
7.2 估计量的评价标准
{% note light %}
如何衡量不同的点估计方法好坏我们引入三种点估计量的评价指标无偏性、有效性、一致性。其中一致性一笔带过不做详细讨论。补充一点参数的估计量 θ \theta θ 是关于样本的统计量因此可以对其进行求期望、方差等操作。
{% endnote %}
7.2.1 无偏性
顾名思义就是希望估计出来的参数量尽可能不偏离真实值。我们定义满足下式的估计量 θ ^ \hat \theta θ^ 为真实参数的无偏估计 E θ ^ θ E\hat \theta \theta Eθ^θ
7.2.2 有效性
有效性是基于比较的定义方法。对于两个无偏估计 θ ^ 1 , θ ^ 2 \hat\theta_1,\hat\theta_2 θ^1,θ^2谁的方差越小谁就越有效。即若 D ( θ ^ 1 ) , D ( θ ^ 2 ) D(\hat\theta_1),D(\hat\theta_2) D(θ^1),D(θ^2) 满足下式则称 θ ^ 1 \hat\theta_1 θ^1 更有效 D ( θ ^ 1 ) D ( θ ^ 2 ) D(\hat\theta_1) D(\hat\theta_2) D(θ^1)D(θ^2)
7.2.3 一致性
即当样本容量 n 趋近于无穷时参数的估计值也能趋近于真实值则称该估计量 θ ^ \hat\theta θ^ 为 θ \theta θ 的一致估计量
7.3 区间估计
{% note light %}
由于点估计只能进行比较无法对单一估计进行性能度量。因此引入「主元法」的概念与「区间估计」策略
{% endnote %}
7.3.1 基本概念
可靠程度参数估计区间越长可靠程度越高
精确程度参数估计区间越短可靠程度越高
7.3.2 区间估计常用方法之主元法
主元法的核心逻辑就一个在已知数据总体分布的情况下构造一个关于样本 X X X 和待估参数 θ \theta θ 的函数 Z ( X , θ ) Z(X,\theta) Z(X,θ)然后利用置信度和总体分布函数通过查表得到 Z ( X , θ ) Z(X,\theta) Z(X,θ) 的取值范围最后通过移项变形得到待估参数的区间也就是估计区间。
7.3.3 正态总体的区间估计
我们只需要掌握「一个总体服从正态分布」的情况。这种情况下的区间估计分为三种其中估计均值 μ \mu μ 有 2 种估计方差 σ 2 \sigma^2 σ2 有 1 种。估计的逻辑我总结为了以下三步
构造主元 Z ( X , θ ) Z(X,\theta) Z(X,θ)利用置信度 1 − α 1-\alpha 1−α 计算主元 Z Z Z 的取值范围对主元 Z Z Z 的取值范围移项得到参数 θ \theta θ 的取值范围
为了提升区间估计的可信度我们希望上述第 2 步计算出来的关于主元的取值范围尽可能准确。我们不加证明的给出以下结论取主元的取值范围为 主元服从的分布的上下 α 2 \frac{\alpha}{2} 2α 分位数之间。
(一) 求 μ \mu μ 的置信区间 σ 2 \sigma^2 σ2 已知
构造主元 Z ( X , θ ) Z(X,\theta) Z(X,θ) Z X ‾ − μ σ / n ∼ N ( 0 , 1 ) Z \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1) Zσ/n X−μ∼N(0,1) 利用置信度 1 − α 1-\alpha 1−α 计算主元 Z Z Z 的取值范围 P ( ∣ Z ∣ ≤ λ ) 1 − α ↓ Z ∈ [ − λ , λ ] [ − u α 2 , u α 2 ] \begin{aligned} P(|Z| \le \lambda) 1-\alpha \\ \downarrow\\ Z \in [-\lambda,\lambda] [-u_{\frac{\alpha}{2}},u_\frac{\alpha}{2}] \end{aligned} P(∣Z∣≤λ)Z∈[−λ,λ]1−α↓[−u2α,u2α] 对主元 Z Z Z 的取值范围移项得到参数 θ \theta θ 的取值范围 X ‾ − σ n u α 2 ≤ μ ≤ X ‾ σ n u α 2 \overline{X} - \frac{\sigma}{\sqrt{n}} u_\frac{\alpha}{2} \le \mu \le \overline{X} \frac{\sigma}{\sqrt{n}} u_\frac{\alpha}{2} X−n σu2α≤μ≤Xn σu2α (二) 求 μ \mu μ 的置信区间 σ 2 \sigma^2 σ2 未知
构造主元 Z ( X , θ ) Z(X,\theta) Z(X,θ) Z X ‾ − μ S / n ∼ t ( n − 1 ) Z \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1) ZS/n X−μ∼t(n−1) 利用置信度 1 − α 1-\alpha 1−α 计算主元 Z Z Z 的取值范围 P ( ∣ Z ∣ ≤ λ ) 1 − α ↓ Z ∈ [ − λ , λ ] [ − t α 2 ( n − 1 ) , t α 2 ( n − 1 ) ] \begin{aligned} P(|Z| \le \lambda) 1-\alpha \\ \downarrow\\ Z \in [-\lambda,\lambda] [-t_{\frac{\alpha}{2}}(n-1),t_\frac{\alpha}{2}(n-1)] \end{aligned} P(∣Z∣≤λ)Z∈[−λ,λ]1−α↓[−t2α(n−1),t2α(n−1)] 对主元 Z Z Z 的取值范围移项得到参数 θ \theta θ 的取值范围 X ‾ − S n t α 2 ( n − 1 ) ≤ μ ≤ X ‾ S n t α 2 ( n − 1 ) \overline{X} - \frac{S}{\sqrt{n}} t_\frac{\alpha}{2}(n-1) \le \mu \le \overline{X} \frac{S}{\sqrt{n}} t_\frac{\alpha}{2}(n-1) X−n St2α(n−1)≤μ≤Xn St2α(n−1) (三) 求 σ 2 \sigma^2 σ2 的置信区间构造的主元与总体均值无关因此不需要考虑 μ \mu μ 的情况
构造主元 Z ( X , θ ) Z(X,\theta) Z(X,θ) Z ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) Z \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) Zσ2(n−1)S2∼χ2(n−1) 利用置信度 1 − α 1-\alpha 1−α 计算主元 Z Z Z 的取值范围 P ( λ 1 ≤ Z ≤ λ 2 ) 1 − α ↓ Z ∈ [ λ 1 , λ 2 ] [ χ 1 − α 2 2 ( n − 1 ) , χ α 2 2 ( n − 1 ) ] \begin{aligned} P(\lambda_1 \le Z \le \lambda_2) 1-\alpha \\ \downarrow\\ Z \in [\lambda_1,\lambda_2] [\chi^2_{1-\frac{\alpha}{2}}(n-1),\chi^2_\frac{\alpha}{2}(n-1)] \end{aligned} P(λ1≤Z≤λ2)Z∈[λ1,λ2]1−α↓[χ1−2α2(n−1),χ2α2(n−1)] 对主元 Z Z Z 的取值范围移项得到参数 θ \theta θ 的取值范围 ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) ≤ σ 2 ≤ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) \frac{(n-1)S^2}{\chi^2_\frac{\alpha}{2}(n-1)} \le \sigma^2 \le \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)} χ2α2(n−1)(n−1)S2≤σ2≤χ1−2α2(n−1)(n−1)S2
第8章 假设检验
{% note light %}
第 7 章的参数估计是在总体分布已知且未知分布表达式中某些参数的情况下基于「抽取的少量样本」进行的参数估计。
现在的局面同样我们已知总体分布和不完整的分布表达式参数。现在需要我们利用抽取的少量样本判断样本所在向量空间是否符合某种性质。本章的「假设检验」策略就是为了解决上述情况而诞生的。我们主要讨论单个正态总体的情况并针对均值和方差两个参数进行假设和检验
假设均值满足某种趋势利用已知数据判断假设是否成立假设方差满足某种趋势利用已知数据判断假设是否成立
{% endnote %}
8.1 假设检验的基本概念
基本思想首先做出假设并构造一个关于样本观察值和已知参数的检验统计量接着计算假设发生的情况下小概率事件发生时该检验统计量的取值范围拒绝域最终代入已知样本数据判断计算结果是否在拒绝域内。如果在则说明在当前假设的情况下小概率事件发生了对应的假设为假反之说明假设为真。
为了量化「小概率事件发生」这个指标我们引入显著性水平 α \alpha α 这一概念。该参数为一个很小的正数定义为「小概率事件发生」的概率上界。
基于数据的实验导致我们无法避免错误因此我们定义以下两类错误
第一类错误弃真错误。即假设正确但由于数据采样不合理导致拒绝了真实的假设第二类错误存伪错误。即假设错误同样因为数据的不合理导致接受了错误的假设
8.2 单个正态总体均值的假设检验
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots ,X_n X1,X2,⋯,Xn 是来自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的简单随机样本。后续进行假设判定计算统计量 Z Z Z 的真实值时若总体均值 μ \mu μ 已知就直接代入若未知题目也一定会给一个阈值代这个阈值即可。
当总体方差 σ 2 \sigma^2 σ2 已知时我们构造样本统计量 Z Z Z 为正态分布 Z X ‾ − μ σ / n ∼ N ( 0 , 1 ) Z \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1) Zσ/n X−μ∼N(0,1)
检验是否则求解双侧 α \alpha α 分位数检验单边则求解单侧 α \alpha α 分位数
当总体方差 σ 2 \sigma^2 σ2 未知时我们构造样本统计量 Z Z Z 为 t t t 分布 Z X ‾ − μ S / n ∼ t ( n − 1 ) Z \frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1) ZS/n X−μ∼t(n−1) {% note warning %}
注之所以这样构造是因为当总体 σ \sigma σ 未知时上一个方法构造的主元已经不再是统计量我们需要找到能够代替未知参数 σ \sigma σ 的变量这里就采用其无偏估计「修正样本方差 S 2 S^2 S2」来代替 σ 2 \sigma^2 σ2。也是说直接拿样本的修正方差来代替总体的方差了。
{% endnote %}
检验是否则求解双侧 α \alpha α 分位数检验单边则求解单侧 α \alpha α 分位数
8.3 单个正态总体方差的假设检验
设 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots ,X_n X1,X2,⋯,Xn 是来自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的简单随机样本。后续进行假设判定计算统计量 Z Z Z 的真实值时若总体方差 σ 2 \sigma^2 σ2 已知就直接代入若未知题目也一定会给一个阈值代这个阈值即可。
我们直接构造样本统计量 Z Z Z 为 χ 2 \chi^2 χ2 分布 Z ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) Z \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) Zσ2(n−1)S2∼χ2(n−1)
检验是否则求解双侧 α \alpha α 分位数检验单边则求解单侧 α \alpha α 分位数