《抽样分布参数估计简介假设检验基本原理.ppt》由会员分享,可在线阅读,更多相关《抽样分布参数估计简介假设检验基本原理.ppt(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样分布参数估计简介假设检验基本原理 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望抽样分布的概念抽样分布的概念n样本统计量的概率分布称为抽样分布样本统计量的概率分布称为抽样分布(sampling distribution)样本是通过对总体的随机抽样获得的样本是通过对总体的随机抽样获得的 样本统计量是随机变量,有一定的概率分布样本统计量是随机变量,有一定的概率分布n简单随机样本简单随机样本抽样是完全随机的抽样是完全随机的-总体中的每个个体都总体中的每个个体都有相同
2、的机会被抽中有相同的机会被抽中抽样是彼此对立的抽样是彼此对立的-每次抽样的结果都不每次抽样的结果都不会影响到其他抽样的结果会影响到其他抽样的结果抽样分布的概念抽样分布的概念原总体原总体样本样本1样本样本2样本样本n新总体新总体n 统计量统计量 2(chi-square)分布分布n定义定义设随机变量设随机变量X1,X2,Xn彼此独立且都服从彼此独立且都服从标准正态分布标准正态分布 N(0,1),则随机变量,则随机变量服从自由度为服从自由度为n的的 2分布,记为分布,记为 2 分布分布 2 分布分布n性质性质 2 分布随机变量的取值范围为(分布随机变量的取值范围为(0,)若若Y1 2(n),Y2
3、2(m),且相互独立,则,且相互独立,则Y1 Y2 2(n m)2 分布为非对称分布,其分布曲线的形状由分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称自由度决定,自由度越大,分布越趋于对称当当 n ,2(n)N(n,2n)2 分布分布n 2 分布分布上侧上侧分位数表:分位数表:附表附表3(p.277)t 分布分布 n定义定义设设Z N(0,1),Y 2(n),且相互独立,则,且相互独立,则 服从自由度为服从自由度为n的的 t 分布,记为分布,记为t 分布分布t 分布分布n性质性质与标准正态分布相似与标准正态分布相似关于关于 t=0对称对称只有一个峰,峰值在只有一个峰
4、,峰值在t=0分布曲线受自由度影响,自由度越小,离散分布曲线受自由度影响,自由度越小,离散程度越大程度越大当当 n ,t(n)N(0,1)t 分布分布nt 分布与正态分布的比较分布与正态分布的比较t 分布分布nt分布分布双侧双侧分位数表:分位数表:附表附表4(p.279)F 分布分布 n定义定义若若 X 2(m),Y 2(n),且相互独立,则,且相互独立,则服从自由度为服从自由度为m(第一自由度)(第一自由度)和和n(第二(第二自由度)的自由度)的 F 分布,记为分布,记为F 分布分布F 分布分布n性质性质F分布随机变量的取值范围为(分布随机变量的取值范围为(0,)F分布的分布曲线受两个自由度
5、的影响分布的分布曲线受两个自由度的影响若若F F(m,n),则,则 1/F F(n,m)若若X t(n),则,则 X2 F(1,n)F 分布分布nF分布的分布的上侧上侧分位数表:附表分位数表:附表5(p.281)正态总体样本平均数的分布正态总体样本平均数的分布n样本平均数的期望和方差样本平均数的期望和方差设样本来自均数为设样本来自均数为,方差为,方差为 2的总体的总体设样本为简单随机样本设样本为简单随机样本正态总体样本平均数的分布正态总体样本平均数的分布n期望期望正态总体样本平均数的分布正态总体样本平均数的分布n方方差差n标准差标准差(平均数的标准误)(平均数的标准误)正态总体样本平均数的分布
6、正态总体样本平均数的分布n正态总体样本平均数的分布正态总体样本平均数的分布设样本来自正态总体设样本来自正态总体 N(,2),则样本平均数也,则样本平均数也服从正态分布,其总体均数为服从正态分布,其总体均数为 ,方差为,方差为 2/n。中心极限定理中心极限定理 无论样本所来自的总体是否服从正态分布,无论样本所来自的总体是否服从正态分布,只要样本足够大,样本平均数就近似服从正只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。态分布,样本越大,近似程度越好。所需的样本含量随原总体的分布而异,但只所需的样本含量随原总体的分布而异,但只要样本含量要样本含量 30,无论原总体是何分布,
7、都,无论原总体是何分布,都足以满足近似的要求。足以满足近似的要求。设原总体的期望为设原总体的期望为,方差为,方差为 2,则样本平,则样本平均数的期望为均数的期望为,方差为,方差为 2/n。正态总体样本方差的正态总体样本方差的 分布分布n样本方差的期望和方差样本方差的期望和方差设样本来自均数为设样本来自均数为,方差为,方差为 2的总体的总体设样本为简单随机样本设样本为简单随机样本正态总体样本方差的正态总体样本方差的 分布分布n样本方差的分布样本方差的分布参数估计参数估计n参数估计的定义参数估计的定义以样本统计量对总体参数进行估计以样本统计量对总体参数进行估计n基本形式基本形式点估计(点估计(po
8、int estimation)区间估计(区间估计(interval estimation)参数估计参数估计-点估计点估计 以样本统计量作为总体参数的一个估计值以样本统计量作为总体参数的一个估计值例:例:样本观测值样本观测值参数估计参数估计-点估计点估计 基本方法基本方法-构造函数构造函数g(x)的方法的方法矩法:矩法:用与总体参数相应的样本统计量作用与总体参数相应的样本统计量作为估计值,必要时可对统计量作适当调整为估计值,必要时可对统计量作适当调整最大似然法:最大似然法:用使样本观测值的似然函数用使样本观测值的似然函数达到最大的统计量作为估计值达到最大的统计量作为估计值最小二乘法:最小二乘法:
9、用使估计误差平方和的统计用使估计误差平方和的统计量作为估计值量作为估计值贝叶斯法:贝叶斯法:根据贝叶斯理论构造估计量根据贝叶斯理论构造估计量参数估计参数估计-点估计点估计n衡量估计值优劣的指标衡量估计值优劣的指标无偏性无偏性:无偏估计:无偏估计:有偏估计:有偏估计:参数估计参数估计-点估计点估计样本方差的期望样本方差的期望s2是是 2的无的无偏估计量偏估计量参数估计参数估计-点估计点估计抽样方差抽样方差/标准误标准误:估计值的方差:估计值的方差/标准差标准差样本平均数的抽样方差:样本平均数的抽样方差:样本方差的抽样方差:样本方差的抽样方差:参数估计参数估计-点估计点估计均方误差均方误差:一致性
10、一致性:估计值随着样本的增大而更加接近:估计值随着样本的增大而更加接近 真值真值有效性有效性:抽样方差达到最小的无偏估计抽样方差达到最小的无偏估计充分性充分性:估计函数包含了关于被估参数的全估计函数包含了关于被估参数的全 部信息部信息参数估计参数估计-区间估计区间估计n以一定的置信度对参数可能取值范围的以一定的置信度对参数可能取值范围的估计估计1-:置信度(置信水平)t1,t2:置信区间t1、t2:置信限(置信下限、置信上限)求统计量求统计量 t1和和 t2,使得对于给定的,使得对于给定的 (0 1,常用,常用 =0.05和和 =0.01),有,有参数估计参数估计-区间估计区间估计n正态总体平
11、均数的区间估计正态总体平均数的区间估计当当 2已知已知标准正态分标准正态分布两尾概率布两尾概率分位点分位点参数估计参数估计-区间估计区间估计n正态总体平均数的区间估计正态总体平均数的区间估计当当 2未知未知参数估计参数估计-区间估计区间估计t分布两尾分布两尾概率分位点概率分位点参数估计参数估计-区间估计区间估计n正态总体方差的区间估计正态总体方差的区间估计 2分布上尾分布上尾概率分位点概率分位点参数估计参数估计-区间估计区间估计/2/21-假设检验假设检验n 假设假设(hypothsis)对总体的某些未知的或不完全知道的性质所对总体的某些未知的或不完全知道的性质所提出的待考察的命题提出的待考察
12、的命题n 假设检验假设检验对假设成立与否做出的推断对假设成立与否做出的推断假设检验的基本原理假设检验的基本原理n问题的提出问题的提出 例例:某猪场称该场的猪在体重为:某猪场称该场的猪在体重为100kg时时的平均背膘厚度为的平均背膘厚度为9mm。问题:此说法是否正确?有问题:此说法是否正确?有4种可能性(假种可能性(假设)设)1)正确:)正确:9 2)不正确:)不正确:9(|9|0)3)不正确:不正确:9三对假设:三对假设:9 vs 9,9 vs 9假设检验的基本原理假设检验的基本原理n 如何回答如何回答随机抽取一个样本随机抽取一个样本 计算该样本的平均数计算该样本的平均数 比较样本平均数与比较
13、样本平均数与9mmn 难题难题 存在抽样误差存在抽样误差 当样本平均数与当样本平均数与9mm之差达到多大时可否定之差达到多大时可否定 9假设检验的基本原理假设检验的基本原理n解决的思路解决的思路针对要回答的问题提出一对对立的假设,并针对要回答的问题提出一对对立的假设,并对其中的一个进行检验对其中的一个进行检验 找到一个样本统计量,它与提出的假设有关,找到一个样本统计量,它与提出的假设有关,其抽样分布已知其抽样分布已知根据这个统计量观察值出现的概率,利用小根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断概率事件原理对假设是否成立做出推断这个过程称为假设检验这个过程称为假设
14、检验(hypothesis testing)假设检验的基本原理假设检验的基本原理n 小概率事件原理小概率事件原理 小概率事件在一次试验中几乎不会发生小概率事件在一次试验中几乎不会发生 如果某事件在一次试验中发生了,我们可认如果某事件在一次试验中发生了,我们可认为它不是一个小概率事件为它不是一个小概率事件 如果在某个假设下应当是小概率的事件在一如果在某个假设下应当是小概率的事件在一次试验中发生了,可认为该假设不能成立次试验中发生了,可认为该假设不能成立假设检验的基本原理假设检验的基本原理n假设检验的基本步骤假设检验的基本步骤1)提出一对对立的假设)提出一对对立的假设2)构造并计算检验统计量)构造
15、并计算检验统计量3)确定否定域)确定否定域4)对所作的假设进行推断)对所作的假设进行推断假设检验的基本原理假设检验的基本原理n例(续)例(续)设由该场随机抽取了设由该场随机抽取了10头猪,测得它们在体重为头猪,测得它们在体重为100kg时的平均背膘厚为时的平均背膘厚为8.7mm。已知该场猪的背膘。已知该场猪的背膘厚服从正态分布,总体方差为厚服从正态分布,总体方差为 2 2.5mm2 1)提出假设)提出假设原假设原假设(null hypothesis):H0:=9mm备择假设备择假设(alternative hypothesis):HA:9mm假设检验的基本原理假设检验的基本原理2)构造并计算检
16、验统计量构造并计算检验统计量检验统计量:用于检验原假设能否成立的检验统计量:用于检验原假设能否成立的统计量,满足以下条件统计量,满足以下条件 必须利用原假设提供的信息 抽样分布已知假设检验的基本原理假设检验的基本原理3)确定否定域)确定否定域在检验统计量抽样分布的尾部(在检验统计量抽样分布的尾部(1侧或侧或2侧)中划定一小概率区域,一旦计算侧)中划定一小概率区域,一旦计算的检验统计量的实际值落入此区域,的检验统计量的实际值落入此区域,就否定原假设,接受备择假设。就否定原假设,接受备择假设。这个小概率也称为显著性水平,用这个小概率也称为显著性水平,用 表示表示通常取通常取 5或或 1假设检验的基
17、本原理假设检验的基本原理若取若取 5,则,则接受域95%否定域2.5%1.96-1.96否定域:否定域:Z 1.96 或或 Z 1.96 否定域2.5%假设检验的基本原理假设检验的基本原理4)对所作的假设进行推断)对所作的假设进行推断 差异不显著差异不显著:在:在 5水平下,检验统计量的观察值落在接受域中检验统计量的观察值落在接受域中 差异显著差异显著:在:在 5水平下,检检验统计量的观察值落在否定域中验统计量的观察值落在否定域中 差异极显著差异极显著:在:在 1水平下,检验统计量的观察值落在否定域中检验统计量的观察值落在否定域中假设检验的基本原理假设检验的基本原理 z=-3.162 2.58
18、 或或 Z -2.58仍有仍有 z=-3.162 -2.58 结论:该场猪的平均背膘厚与结论:该场猪的平均背膘厚与9mm差异极显著差异极显著假设检验的基本原理假设检验的基本原理n几个相关概念几个相关概念1)双侧检验和单侧检验)双侧检验和单侧检验双侧检验:否定域在检验统计量分布双侧检验:否定域在检验统计量分布的两尾的两尾单侧检验:否定域在检验统计量分布单侧检验:否定域在检验统计量分布的一侧的一侧左侧检验:否定域在检验统计量分布的左侧右侧检验:否定域在检验统计量分布的右侧假设检验的基本原理假设检验的基本原理n例(续)例(续)左侧检验左侧检验 1)假设:)假设:H0:=9,HA:9 2)检验统计量:
19、同双侧检验,)检验统计量:同双侧检验,z=-3.162 3)否定域:)否定域:取取 =0.05 4)推断:)推断:5%-1.64 z=-3.162 9 2)检验统计量:同双侧检验,)检验统计量:同双侧检验,z=-3.162 3)否定域:)否定域:取取 =0.05 4)推断:)推断:5%1.64 z=-3.162 1.64 接受接受原假设原假设假设检验的基本原理假设检验的基本原理2)相伴概率)相伴概率 P检验统计量观察值以及所有所有比它检验统计量观察值以及所有所有比它更为极端的可能值出现的概率之和更为极端的可能值出现的概率之和 双侧检验:双侧检验:P=P(Z 3.162)=0.002 左侧检验:
20、左侧检验:P=P(Z -3.162)=0.999 假设检验的基本原理假设检验的基本原理 -3.1623.162 -3.162双侧检验的相伴概率双侧检验的相伴概率左侧检验的相伴概率左侧检验的相伴概率假设检验的基本原理假设检验的基本原理相伴概率可用于对假设的统计推断相伴概率可用于对假设的统计推断:检验统计量的观察值落在否定域中等检验统计量的观察值落在否定域中等价于相伴概率小于显著性水平价于相伴概率小于显著性水平,即,即 P 可以用否定域,也可用相伴概率对原可以用否定域,也可用相伴概率对原假设进行推断假设进行推断 如果检验统计量是连续分布的,用否如果检验统计量是连续分布的,用否定域进行推断定域进行推
21、断 如果检验统计量是离散分布的,用相如果检验统计量是离散分布的,用相伴概率进行推断伴概率进行推断假设检验的基本原理假设检验的基本原理3)两类错误)两类错误 任何假设检验的结果都有犯错误的可能任何假设检验的结果都有犯错误的可能一类错误:以真为假一类错误:以真为假-原假设正确但被原假设正确但被否定。否定。P(一类错误一类错误)=二类错误:以假为真二类错误:以假为真-原假设错误但被原假设错误但被接受。接受。P(二类错误二类错误)=一般无法计算!一般无法计算!1/2 2/2假设检验的基本原理假设检验的基本原理假设分布假设分布真实分布真实分布假设检验的基本原理假设检验的基本原理假设检验的基本原理假设检验
22、的基本原理假设检验的基本原理假设检验的基本原理影响影响 II 型错误概率大小的因素型错误概率大小的因素 显著性水平显著性水平 样本含量样本含量 n 假设分布与真实分布总体平均数之假设分布与真实分布总体平均数之差差 两个分布的总体方差两个分布的总体方差假设检验的基本原理假设检验的基本原理4)检验功效)检验功效 一个错误的原假设能够被否定的概率一个错误的原假设能够被否定的概率 检验功效检验功效 1 II 型错误概率型错误概率假设检验的基本原理假设检验的基本原理n几点说明几点说明关于假设关于假设关于统计推断的结论关于统计推断的结论关于单侧检验的假设关于单侧检验的假设假设检验与置信区间的关系假设检验与置信区间的关系假设检验的基本原理假设检验的基本原理 假设假设 真实情况真实情况 决策决策 犯错误犯错误H0:有效:有效 有效有效 接受接受H0 无无 否定否定H0 I 型型 无效无效 接受接受H0 II型型 否定否定H0 无无 H0:无效:无效 有效有效 接受接受H0 II型型 否定否定H0 无无 无效无效 接受接受H0 无无 否定否定H0 I 型型习题习题nP.59 6,7