《抽样理论以及总体参数估计.ppt》由会员分享,可在线阅读,更多相关《抽样理论以及总体参数估计.ppt(113页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于抽样理论及总体参数的估计第一张,PPT共一百一十三页,创作于2022年6月第一节随机抽样的基本概念与方法v一、随机抽样的基本概念总体(Population)-要研究的事物或现象的总体。个体(Itemunit)-组成总体的每个元素(成员)。总体容量(Populationsize)-一个总体中所含个体的数量。样本(Sample)-从总体中抽取的部分个体第二张,PPT共一百一十三页,创作于2022年6月样本容量(Samplesize)-样本中所含个体的数量。抽样(Sampling)-为推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体的过程。统计量(Statistic)-由样本构造,
2、用来估计总体参数的函数。统计量是样本的函数,只依赖于样本;统计量不含任何参数。样本均值、样本方差等都是统计量。第三张,PPT共一百一十三页,创作于2022年6月v二、随机抽样方法v(1)简单随机抽样(Simplerandomsampling)v完全随机地选取样本,要求有一个完美的抽样框或有总体中每一个个体的详尽名单。可以采取抽签或随机数字表的办法实现。v(2)分层抽样(Reducedsampling)v先将总体分成不同的“层”,然后,在每一“层”内进行简单随机抽样。可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。第四张,PPT共一百一十三页,创作于2022年6月(3)整群抽样(Clu
3、sterSampling)在整群抽样中,总体首先被分成称作群的独立的元素组,总体中的每一元素属于且仅属于某一群。抽取一个以群为元素的简单随机样本,样本中的所有元素组成样本。在理想状态下,每一群是整个总体小范围内的代表。(4)系统抽样(Systematicsampling)又称等距抽样。从前k个元素中随机选一个,然后在样本框中每隔一定距离抽取一个。第五张,PPT共一百一十三页,创作于2022年6月第二节抽样分布v一、抽样分布的基本概念1、总体分布、总体分布2、样本分布样本分布3、抽样分布抽样分布1.总体中各元素的观察值所形成的分布2.分布通常是未知的3.可以假定它服从某种分布第六张,PPT共一百
4、一十三页,创作于2022年6月总体总体第七张,PPT共一百一十三页,创作于2022年6月1.一个样本中各观察值的分布2.也称经验分布3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布第八张,PPT共一百一十三页,创作于2022年6月样本样本第九张,PPT共一百一十三页,创作于2022年6月从随机变量从随机变量X中,随机抽取中,随机抽取n个样本元素:个样本元素:x1、x2 xn 则则f(f(x1、x2 xn)的统计量分布的统计量分布随机变量是随机变量是 样本统计量样本统计量样本均值样本均值,样本比例,样本方差等样本比例,样本方差等结果来自容量相同的所有可能样本结果来自容量相同的所有可能样本提
5、供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据论基础,也是抽样推断科学性的重要依据 第十张,PPT共一百一十三页,创作于2022年6月第十一张,PPT共一百一十三页,创作于2022年6月样本平均数的抽样分布v1、样本均值X分布的含义v采用随机抽样的方法,从总体中抽取大小为n的一个样本,计算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个体,又可以计算出平均值X2,再将n个个体放回去,再抽取n个个体,如此可以计算出无限个X,这些样本均值X所有可能值的概率分布叫均值X的抽样分布.第十二张,PPT共一百一十三
6、页,创作于2022年6月设X1,X2,Xn为某总体中抽取的随机样本,X1,X2,Xn为相互独立,且与总体有相同分布的随机变量.(1)当总体为正态分布N(,2)时,X的抽样分布仍为正态分布,当越来越大时,X的离散程度越来越小,即用X估计越准确。第十三张,PPT共一百一十三页,创作于2022年6月(2)当总体的分布不是正态分布时,只要样本容量足够大时,样本均值的分布总是近似正态分布,此时要求总体方差2有限。假定总体均值为,方差为2第十四张,PPT共一百一十三页,创作于2022年6月一个正态总体一个正态总体 X N(2)的情形的情形方差方差 2已知已知,的置信区间的置信区间推导推导 由选取枢轴量 第
7、十五张,PPT共一百一十三页,创作于2022年6月由确定解得 的置信度为 的置信区间为第十六张,PPT共一百一十三页,创作于2022年6月方差方差 2未知未知,的置信区间的置信区间 由确定故 的置信区间为推导推导 选取枢轴量公式(2)第十七张,PPT共一百一十三页,创作于2022年6月第三节总体参数的估计概括地说:经常需要对总体进行估计的两个数字特征是:总体的均值和方差。如果将总体的均值和方差视为数轴上的两个点,这种估计称为点估计。如果要求估计总体的均值或方差将落在某一段数值区间,这种估计称为区间估计。第十八张,PPT共一百一十三页,创作于2022年6月第三节总体参数的估计v一、点估计1.点估
8、计点估计 点点估估计计:当总体参数不清楚时,用一个特定值(一般用样本统计量)对其进行估计,称为点估计。第十九张,PPT共一百一十三页,创作于2022年6月用样本平均数估计总体平均数用样本平均数估计总体平均数样本平均数是总体均值的良好估计。公式:第二十张,PPT共一百一十三页,创作于2022年6月用样本方差估计总体方差用样本方差估计总体方差同理,用样本标准差估计总体标准差第二十一张,PPT共一百一十三页,创作于2022年6月1、一个好的样本统计量估计总体参数的要求一个好的样本统计量估计总体参数的要求v无偏性是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,
9、这时,这个统计量就是无偏估计量。v一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。即:当N时,X,S2n-12。第二十二张,PPT共一百一十三页,创作于2022年6月v有效性是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。v充分性是指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。第二十三张,PPT共一百一十三页,创作于2022年6月二、区间估计 区间估计:区间估计:是指用数轴上的一段距离表示未知参数可能落入的范围。第二十四张,PPT共一百一十三页,创作于2022年6月2、一个好的样本统计量估
10、计总体参数的要求、一个好的样本统计量估计总体参数的要求v无偏性是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。v一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。即:当N时,X,S2n-12。第二十五张,PPT共一百一十三页,创作于2022年6月v有效性是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。v充分性是指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。第二十六张,PPT共一百一十三页,创作于2022年6月二、区间估
11、计第二十七张,PPT共一百一十三页,创作于2022年6月1、总体均数的区间估计第二十八张,PPT共一百一十三页,创作于2022年6月有关区间估计的几个概念有关区间估计的几个概念 置信区间置信区间:区间估计是求所谓置信区间的方法。置信区间:区间估计是求所谓置信区间的方法。置信区间:区间估计是求所谓置信区间的方法。置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信心而在点估计两边就是我们为了增加参数被估计到的信心而在点估计两边就是我们为了增加参数被估计到的信心而在点估计两边就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。设置的估计区间。设置的估计区间
12、。设置的估计区间。显著性水平显著性水平显著性水平显著性水平 :用置信区间来估计的不可靠程度。:用置信区间来估计的不可靠程度。区间估计的任务是,在点估计值的两侧设置一个区间,区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。可靠性和精确性使得总体参数被估计到的概率大大增加。可靠性和精确性(即信度和效度即信度和效度)在区间估计中是相互矛盾的两个方面。在区间估计中是相互矛盾的两个方面。第二十九张,PPT共一百一十三页,创作于2022年6月 置信度置信度置信度置信度(水平)(水平)(水平)(水平):用置信区间估计的可靠性(把握度):用置信区间估计的可靠性(把握度):用
13、置信区间估计的可靠性(把握度):用置信区间估计的可靠性(把握度)4 4抽样平均误差抽样平均误差抽样平均误差抽样平均误差 与与与与概率度概率度概率度概率度 Z Z 抽样平均误差抽样平均误差抽样平均误差抽样平均误差 :样本均值抽样分布的标准差。反映:样本均值抽样分布的标准差。反映:样本均值抽样分布的标准差。反映:样本均值抽样分布的标准差。反映在参数周围抽样平均值的平均变异程度。在参数周围抽样平均值的平均变异程度。在参数周围抽样平均值的平均变异程度。在参数周围抽样平均值的平均变异程度。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。第三十张,PPT共一百一十三
14、页,创作于2022年6月 显著性水平、置信水平、概率度显著性水平、置信水平、概率度显著性水平、置信水平、概率度显著性水平、置信水平、概率度之间的关系:之间的关系:=0.10时,时,时,时,=0.90=0.90,Z Z/2/2=1.65=1.65 =0.05时,时,=0.95,Z/2=1.96=1.96 =0.01时,时,时,时,=0.99,Z Z/2=2.58=2.58第三十一张,PPT共一百一十三页,创作于2022年6月 从点估计值开始,向两侧展开一定倍数的抽样平从点估计值开始,向两侧展开一定倍数的抽样平从点估计值开始,向两侧展开一定倍数的抽样平从点估计值开始,向两侧展开一定倍数的抽样平均误
15、差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之内。内。内。内。第三十二张,PPT共一百一十三页,创作于2022年6月设 为待估参数,是一给定的数,(030)或小样本(n30)时v(2)当总体已知,总体虽不呈正态分布,大样本(n30)时,样本平均数可以转换成标准记分。两种类型两种类型第三十九张,PPT共一百一十三页,创作于2022年6月如果一个随机变量如果一个随机变量Z服从标准正态分布服从标准正态分布(=0,2=1的正态分布的正态分布),那么那么 P-1.96Z1
16、.96=0.95 P-2.58Z30)时,样本平均数可以转换成t值。第五十五张,PPT共一百一十三页,创作于2022年6月方差方差 2未知未知,的置信区间的置信区间 由确定故 的置信区间为推导推导 选取枢轴量公式公式(2)(2)第五十六张,PPT共一百一十三页,创作于2022年6月求标准误求标准误计算标准误的公式为:样本n30则仍用正态分布。第五十七张,PPT共一百一十三页,创作于2022年6月平均数标准误的估计量有三种算法:平均数标准误的估计量有三种算法:第五十八张,PPT共一百一十三页,创作于2022年6月条件为:总体为正态分布,XN(,2),当总体方差2未知时,求总体平均值的置信区间步骤
17、:v由样本容量为n的随机变量X的值X1,X2,X3,Xn求出X,S,自由度df=n-1;v求出SEx=S/n-1;v确定显著性水平,查t值分布表,找出临界值;第五十九张,PPT共一百一十三页,创作于2022年6月v由于Pt=0.95,将公式t=(X-)/SEx代入上式,得:P(X-)/SEx=0.95整理得:PX-SExX+SEx=0.95分别求出:X-Sn-1/n和X+Sn-1/nv求出总体平均值的置信区间:X-SEx,X+SEx第六十张,PPT共一百一十三页,创作于2022年6月课堂练习课堂练习例1:对某校学生的智商水平进行抽样测查,共测量了20名学生,所得智商分数如下:90,92,94,
18、95,97,98,99,101,101,102,103,104,105,105,106,110,115,120,88,85。问该校学生平均智商分数在什么范围内?给出平均数和标准差:X=Xi/n=100.5S2n-1=(Xi-X)2/(n-1)=76第六十一张,PPT共一百一十三页,创作于2022年6月v总体平均数95%置信区间为:总体平均数总体平均数99%置信区间为:置信区间为:第六十二张,PPT共一百一十三页,创作于2022年6月课堂练习v某校对高中一年级学生进行英语水平测试,测试后从中抽取的9个考生的成绩为83、91、62、50、74、68、70、65、85,试对该年级考生的该次考试成绩均
19、值作区间估计(取=0.05)第六十三张,PPT共一百一十三页,创作于2022年6月第六十四张,PPT共一百一十三页,创作于2022年6月2 2、小样本,且为正态总体、小样本,且为正态总体、小样本,且为正态总体、小样本,且为正态总体 ,总体均值的区间估计,总体均值的区间估计,总体均值的区间估计,总体均值的区间估计(用用用用 分布分布分布分布)第六十五张,PPT共一百一十三页,创作于2022年6月 例例例例 在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为2525的样本,其均值的样本,其均值的样本,其均值的样本,其均值为为为为
20、5252,标准差为,标准差为,标准差为,标准差为1212,求置信水平为,求置信水平为,求置信水平为,求置信水平为9595的总体均值的置信区的总体均值的置信区的总体均值的置信区的总体均值的置信区间。间。间。间。解解解解 根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用 分布分布分布分布统计量。由统计量。由统计量。由统计量。由9595置信水平查置信水平查置信水平查置信水平查 分布表得概率度分布表得概率度分布表得概率度分布表得概率度 (24)(24)2.0642.064 代入公式得代入公式
21、得代入公式得代入公式得 522.064 522.064 525.06525.06 因此,置信水平因此,置信水平因此,置信水平因此,置信水平9595的总体均值的置信区的总体均值的置信区的总体均值的置信区的总体均值的置信区 间是从间是从间是从间是从46.9446.94到到到到57.0657.06。第六十六张,PPT共一百一十三页,创作于2022年6月v例如:某年高考结束后从某地区随机抽取20名考生,计算得他们数学的平均分为63,标准差为8.922,试求该地区这一年高考数学平均分95%和99%的置信区间。第六十七张,PPT共一百一十三页,创作于2022年6月解:解:总体平均数总体平均数95%95%置
22、信区间为:置信区间为:第六十八张,PPT共一百一十三页,创作于2022年6月同理,总体平均数同理,总体平均数99%置信区间为:置信区间为:答答:该该地地区区这这一一年年高高考考数数学学平平均均分分95%95%和和99%99%的的置置信信区区间间分分别别为为58.7258.72至至67.2867.28分分之之间间和和57.1457.14至至68.8668.86分分之间。之间。第六十九张,PPT共一百一十三页,创作于2022年6月v3.大样本的情况:v首先看抽样分布如何,一般是t分布。但由t分布的性质可知,当样本容量比较大,自由度在逐渐增大,这时的t分布已经非常接近正态分布。这时可把t分布转成标准
23、正态分布来作处理。然后再作区间估计。这时临界值就不用查表获得。当显著水平定为95%时,就可以把1.96直接代入;同理,99%对应2.58。这时就得到所求估计区间。第七十张,PPT共一百一十三页,创作于2022年6月 未知,用未知,用 代替代替 第七十一张,PPT共一百一十三页,创作于2022年6月 例例例例 从某校随机地抽取从某校随机地抽取从某校随机地抽取从某校随机地抽取100100名男学生,测得平均身名男学生,测得平均身名男学生,测得平均身名男学生,测得平均身高为高为高为高为170170厘米,标准差为厘米,标准差为厘米,标准差为厘米,标准差为7.57.5厘米,试求该校学生平均身厘米,试求该校
24、学生平均身厘米,试求该校学生平均身厘米,试求该校学生平均身高高高高9595的置信区间。的置信区间。的置信区间。的置信区间。解解解解 按题意,此为大样本,且总体方差未知,又按题意,此为大样本,且总体方差未知,又按题意,此为大样本,且总体方差未知,又按题意,此为大样本,且总体方差未知,又 100100,170170,7.57.5,0.950.95查表得查表得查表得查表得 1.961.96,代入公式有,代入公式有,代入公式有,代入公式有 1701.96 1701.96 1701.471701.47因此,有因此,有因此,有因此,有9595的把握,该校学生的平均身高在的把握,该校学生的平均身高在的把握,
25、该校学生的平均身高在的把握,该校学生的平均身高在168.5 171.5168.5 171.5厘米之间。厘米之间。厘米之间。厘米之间。第七十二张,PPT共一百一十三页,创作于2022年6月方差方差 2未知未知总体服从正态分布,XN(,2)用S2代替2,建立区间估计统计量置信区间为:n足够大,大于等于30时,也可用正态分布.第七十三张,PPT共一百一十三页,创作于2022年6月v从某区小学五年级学生的数学推理测试成绩中随机抽取26个,求得其平均数为86分,标准差为。已知全区五年级学生的数学成绩服从正态分布,请以0.95置信度估计该区五年级数学推理测试成绩的置信区间第七十四张,PPT共一百一十三页,
26、创作于2022年6月总体比率的区间估计第七十五张,PPT共一百一十三页,创作于2022年6月某种特征占全部单位的比例p,样本比例为p,在大样本下(np5,nq5),可将二项分布变换为正态分布总体比例p的置信区间:第七十六张,PPT共一百一十三页,创作于2022年6月随机抽取某校小学二年级学生40名用维克斯勒智力测试量表测量它们的智力水平,结果智商成绩在115分以上的有25名。试已0.95的可靠性估计全校二年级学生智力测验分数总体在110分以上者占总体比例的置信区间。第七十七张,PPT共一百一十三页,创作于2022年6月第四节样本容量的确定v一、基本问题第七十八张,PPT共一百一十三页,创作于2
27、022年6月确定n十分重要,n过大,增加费用,n过小误差增大。n的确定依赖于多大置信度(可靠性),什么样的精度(多宽的区间)。1、估计时n的确定(总体标准差已知)正态总体或非正态总体但大样本时,置信区间为(用样本均值估计时允许的最大绝对误差)第七十九张,PPT共一百一十三页,创作于2022年6月v已知某小学六年级数学成绩的标准差为10分。先从该校随机抽取一部分学生,要求有0.95的把握用这部分学生的数学成绩估计全校六年级平均成绩的差异不超过2分,那么最低抽取多少学生才能满足这一要求。第八十张,PPT共一百一十三页,创作于2022年6月2、总体标准差未知第八十一张,PPT共一百一十三页,创作于2
28、022年6月v六年级学生英语成绩抽样调查,抽取一部分,总体标准差估计值。现要了解六年级学生英语成绩的平均水平,在0.99的可靠性下,允许最大误差为3分,抽取的样本容量应多大。第八十二张,PPT共一百一十三页,创作于2022年6月样本容量样本容量n,总体方差总体方差 2,允许误差,允许误差,可靠性系数,可靠性系数Z/2的关系:(1)总体方差越大,需要的样本容量越大;反之亦然;(2)允许误差越大,需要的样本容量越小,反之亦然;(3)可靠性系数越大,需要的样本容量越大,反之亦然.例6.11要使95%置信区间的允许误差为5,应选取多大的样本容量?假定总体的标准差为25.例6.12一家广告公司想估计某类
29、商店去年所花的平均广告费有多少。经验表明,总体方差约为1800000。如置信度取95,并要使估计值处在总体平均值附近500元的范围内,这家广告公司应取多大的样本?第八十三张,PPT共一百一十三页,创作于2022年6月3、估计总体比例时,样本容量的确定、估计总体比例时,样本容量的确定估计总体比例时,允许的最大绝对误差为第八十四张,PPT共一百一十三页,创作于2022年6月v已知某市一所初中历届中考升学率为0.25,今年的学生水平与往年相当,要估计今年的升学率,要求误差不超过0.02,可靠性为0.95,至少要抽取多少人进行调查。第八十五张,PPT共一百一十三页,创作于2022年6月例6.13一家市
30、场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对p的估计误差不超过0.05,要求的可靠程度为95%,应取多大容量的样本?例6.14一项调查中,总体比率的计划值为0.35,则当允许的最大绝对误差为0.05时,在求其95%置信区间时应采用多大的样本容量。第八十六张,PPT共一百一十三页,创作于2022年6月二、方差的区间估计v利用卡方分布公式公式1 1公式2第八十七张,PPT共一百一十三页,创作于2022年6月 利用利用 2分布估计总体方差分布估计总体方差2的置信区间的置信区间(1)利用公式1进行计算已知:2=(n-1)S2n-1/2,置信度为0.05在横轴上设2个临界点1和2,使
31、:P122=0.95,将上式代入,得:P1(n-1)S2n-1/22=0.95两边同除(n-1)S2n-1得:1/(n-1)S2n-1 1/2 2/(n-1)S2n-1 第八十八张,PPT共一百一十三页,创作于2022年6月得总体方差总体方差2的置信区间的置信区间:(n-1)S2n-1/22(n-1)S2n-1/1写成:(n-1)S2n-1/2,(n-1)S2n-1/1其中:1为2/2,2为21-/2(n-1)S2n-1/2/2,(n-1)S2n-1/21-/2第八十九张,PPT共一百一十三页,创作于2022年6月课堂练习v某校高中语文毕业考试中,随机抽取15份,其成绩如下:75,68,72,
32、89,86,78,91,92,79,83,88,90,85,77,82.试确定语文成绩的方差在什么范围?(5.36,11.54)第九十张,PPT共一百一十三页,创作于2022年6月第九十一张,PPT共一百一十三页,创作于2022年6月(2)利用公式)利用公式2计算计算 由由由由 分布的性质,我们知道有分布的性质,我们知道有分布的性质,我们知道有分布的性质,我们知道有 因此,对于给定的置信水平因此,对于给定的置信水平因此,对于给定的置信水平因此,对于给定的置信水平 ,总体方差的区间估计为,总体方差的区间估计为,总体方差的区间估计为,总体方差的区间估计为 第九十二张,PPT共一百一十三页,创作于2
33、022年6月 例例例例 研究者调查某社区居民家庭收入情况,现随机抽查了研究者调查某社区居民家庭收入情况,现随机抽查了研究者调查某社区居民家庭收入情况,现随机抽查了研究者调查某社区居民家庭收入情况,现随机抽查了1010户,得到样本方差为户,得到样本方差为户,得到样本方差为户,得到样本方差为S S200(200(元元元元2 2),试以,试以,试以,试以9090的置信水平估计居民的置信水平估计居民的置信水平估计居民的置信水平估计居民总体家庭收入之方差的置信区间。总体家庭收入之方差的置信区间。总体家庭收入之方差的置信区间。总体家庭收入之方差的置信区间。解解解解 根据题意,查分布表得根据题意,查分布表得
34、根据题意,查分布表得根据题意,查分布表得 3.3253.325 16.91916.919代入公式有代入公式有代入公式有代入公式有 所以该社区居民收入之方差所以该社区居民收入之方差所以该社区居民收入之方差所以该社区居民收入之方差9090置信水平的置信区间为置信水平的置信区间为置信水平的置信区间为置信水平的置信区间为118.2118.2601.5601.5(元元元元2 2)。第九十三张,PPT共一百一十三页,创作于2022年6月课堂练习课堂练习例:根据30名被试的视反应时的实验结果,计算出视反应时的方差为900毫秒,试估计当置信度为0.05时,总体方差的置信区间。第九十四张,PPT共一百一十三页,
35、创作于2022年6月三、三、F分布与二总体方差之比的区间估计分布与二总体方差之比的区间估计(一)利用(一)利用F分布估计二总体方差之比的置信区间公式分布估计二总体方差之比的置信区间公式由F分布知:F=S2n1-1/S2n2-1,服从F分布,且df1=n1-1,df2=n2-1。又知样本方差S2是总体方差的无偏估计,其之比S2n1-1/S2n2-1是围绕总体方差之比12/22上下波动,故二总体方差12=22二个样本的总体方差相等的区间估计则用下式:12/22=1而不用12-22=0第九十五张,PPT共一百一十三页,创作于2022年6月由于F分布不是对称分布,若F分布右侧一端的概率为:F=S2n1
36、-1/S2n2-1,则另一侧的概率可用:F=1/F=S2n2-1/S2n1-1第九十六张,PPT共一百一十三页,创作于2022年6月11222第九十七张,PPT共一百一十三页,创作于2022年6月212=22第九十八张,PPT共一百一十三页,创作于2022年6月二、课堂练习二、课堂练习例:8名男女生在某项心理实验中所得测量结果的方差分别为1.12和4.98。问男女生测量值的总体方差是否相等。第九十九张,PPT共一百一十三页,创作于2022年6月样本统计量估计总体参数小结:1.点估计用样本平均数、方差和标准差估计总体平均数、方差和标准差用样本平均数、方差和标准差估计总体平均数、方差和标准差公式:
37、第一百张,PPT共一百一十三页,创作于2022年6月2.区间估计(1)样本平均数对总体平均数的区间估计)样本平均数对总体平均数的区间估计A。总体方差。总体方差 2已知,对总体平均数的估计已知,对总体平均数的估计标准误:SEx=/nZ值:Z=(X-)/SEx求解总体平均值估计的公式:PX-1.96SExX+1.96SEx=0.95第一百零一张,PPT共一百一十三页,创作于2022年6月B。总体方差。总体方差 2未知时,对总体平均数的估计未知时,对总体平均数的估计求标准误公式:求总体平均值的置信区间:X-SEx,X+SEx其中,查t分布表得出临界值第一百零二张,PPT共一百一十三页,创作于2022
38、年6月(2)利用利用 2分布估计总体方差分布估计总体方差2的置信区间的置信区间A。样本方差已知得总体方差总体方差2的置信区间的置信区间:(n-1)S2/22(n-1)S2/1写成:(n-1)S2/2,(n-1)S2/1其中:1为2/2,2为21-/2第一百零三张,PPT共一百一十三页,创作于2022年6月B。样本方差未知。样本方差未知总体方差总体方差2的置信区间的置信区间:(Xi-X)2/2,(Xi-X)2/1其中:1=21-/2,2=2/2第一百零四张,PPT共一百一十三页,创作于2022年6月(3)利用)利用F分布估计二总体方差之比的置信区间分布估计二总体方差之比的置信区间A。1222B。
39、12=22第一百零五张,PPT共一百一十三页,创作于2022年6月 区间估计区间估计引例引例 已知 X N(,1),不同样本算得的 的估计值不同,因此除了给出 的点估计外,还希望根据所给的样本确定一个随机区间,使其包含参数真值的概率达到指定的要求.的无偏、有效点估计为随机变量常数7.37.3第一百零六张,PPT共一百一十三页,创作于2022年6月如引例中,要找一个区间,使其包含 的真值的概率为0.95.(设 n=5)取查表得第一百零七张,PPT共一百一十三页,创作于2022年6月这说明即称随机区间为未知参数 的置信度为0.95的置信区间.第一百零八张,PPT共一百一十三页,创作于2022年6月
40、例例1 1 某工厂生产一批滚珠,其直径 X 服从解解(1)即正态分布 N(2),现从某天的产品中随机(1)若 2=0.06,求 的置信区间(2)若 2未知,求 的置信区间(3)求方差 2的置信区间.抽取 6 件,测得直径为15.1,14.8,15.2,14.9,14.6,15.1置信度均为0.95例例1 1第一百零九张,PPT共一百一十三页,创作于2022年6月由给定数据算得由公式(1)得 的置信区间为(2)取查表由给定数据算得第一百一十张,PPT共一百一十三页,创作于2022年6月由公式(4)得 2 的置信区间为(3)选取枢轴量查表得由公式(2)得 的置信区间为第一百一十一张,PPT共一百一十三页,创作于2022年6月若总体 X 的分布未知,但样本容量很大,由中心极限定理,可近似地视若若 2 2已知已知,则 的置信度为1-的置信区间可取为若若 2 2未知未知,则 的置信度为1-的置信区间可取为 非正态总体均值的区间估计非正态总体均值的区间估计(四四)第一百一十二张,PPT共一百一十三页,创作于2022年6月感谢大家观看第一百一十三张,PPT共一百一十三页,创作于2022年6月