《抽样调查的意义与基本概念.pptx》由会员分享,可在线阅读,更多相关《抽样调查的意义与基本概念.pptx(83页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 抽样调查 第一节第一节 抽样调查的意义及基本概念抽样调查的意义及基本概念 一、抽样调查的意义一、抽样调查的意义一一般所讲的抽样调查,即指狭义的抽样般所讲的抽样调查,即指狭义的抽样调查调查( (随机抽样随机抽样) ):按照随机原则从总体中抽:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。代表,对总体作出数量上的推断分析。二、抽样调查的适用范围二、抽样调查的适用范围 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济
2、国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多
3、的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:三、抽样调查的基本概念三、抽样调查的基本概念 ( (一一) ) 全及总体和抽样总体全及总体和抽样总体( (总体和样本总体和样本) )全全及总体:所要调查观察的全部事物。及总体:所要调查观察的全部事物。 总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查观察的单位。 抽样总体的单位数用抽样总体的单位数用
4、n n表示。表示。 n 30 n 30 大样本大样本 n 30 n 30 小样本小样本( (二二) ) 全及指标和抽样指标全及指标和抽样指标( (总体指标和样本指标总体指标和样本指标) )全全及指标:全及总体的那些指标。及指标:全及总体的那些指标。抽抽样指标:抽样总体的那些指标。样指标:抽样总体的那些指标。 xXpP所所谓谓,就就是是用用抽抽样样指指标标来来推推断断全全及及指指标标。是是用用抽抽样样平平均均数数 推推断断全全及及平平均均数数 ,从从而而推推断断总总体体标标志志总总量量是是用用抽抽样样成成数数 推推断断全全及及成成数数 ,从从而而推推断断总总推推断断一一体体二二单单位位总总量量2
5、2ss 在在抽抽样样调调查查中中应应用用的的总总体体指指标标和和样样本本指指标标还还有有:方方差差:总总体体方方差差、样样本本方方差差标标准准差差:总总体体标标准准差差 、样样本本标标准准差差 抽抽样框样框 即总体单位的名单,是指对可以选择作为即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。确定总体的抽样范围和结构。样样本数本数指从总体中可能抽取的样本的数量。指从总体中可能抽取的样本的数量。样样本容量本容量指一个样本所包括的单位数。指一个样本所包括的单位数。 第二节第二节 抽样调查的组织形式抽样调查的组织形式
6、 通常有以下四种组织形式:通常有以下四种组织形式:一、简单随机抽样一、简单随机抽样( (纯随机抽样纯随机抽样) )即从总体单位中不加任何分组、排队,即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:1.1.直接抽选法;直接抽选法;2.2.抽签法;抽签法;3.3.随机数码表法;随机数码表法;二、类型抽样二、类型抽样( (分类抽样分类抽样) )先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类( (层层) ),然后再从各类,然后再从各类( (层层) )中按随机原则抽中按随机原则抽取
7、样本,组成一个总的样本。取样本,组成一个总的样本。 类型的划分:类型的划分:一一是必须有清楚的划类界限;是必须有清楚的划类界限;二二是必须知道各类中的单位数目和比例;是必须知道各类中的单位数目和比例;三三是分类型的数目不宜太多。是分类型的数目不宜太多。类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调查本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。抽样数目可以减少。两种类型:两种类型:1.1.等等比例类型抽样比例类型抽样( (类型比例抽样类型比例抽样) );2.2.不不等比例类型抽样等比例类型抽
8、样( (类型适宜抽样类型适宜抽样) )。三、机械抽样三、机械抽样( (等距抽样等距抽样) ) 先先将全及总体的所有单位按某一标志将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单顺序排队,然后按相等的距离抽取样本单位。位。排列次序用的标志有两种:排列次序用的标志有两种:1. 1. 选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关, 称无关标志排队。称无关标志排队。2. 2. 选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关, 称有关标志排队。称有关标志排队。机械抽样按样本单位抽选的方法不机械抽样按样本单位抽选的方法不同,可分为三种:同,可
9、分为三种:1.1.随随机起点等距抽样机起点等距抽样2.2.半半距起点等距抽样距起点等距抽样3.3.对对称等距抽样称等距抽样机械抽样的好处:机械抽样的好处: 1. 1. 可可以使抽样过程大大简化,减轻抽样的以使抽样过程大大简化,减轻抽样的工作量;工作量;2. 2. 如如果用有关标志排队,还可以缩小抽样果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。误差,提高抽样推断效果。机械抽样机械抽样,实际上是一种特殊的类,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下
10、,则类型抽抽一个样本,在这种情况下,则类型抽样就成了机械抽样。样就成了机械抽样。四、整群抽样四、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样本单位,即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。对抽中的群内的所有单位都进行观察。整群抽样的好处:整群抽样的好处:组织工作比较简单方便,组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。其它抽样方式的抽样误差大。五、多阶段抽样五、多阶段抽样 即把抽样本单位的过程分为两个或几个即把抽样本单位的过程分为两个或几个阶段来进行。阶段来进行。
11、(如果一次就直接抽选出具体样本单位,这叫单阶(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:段抽样)具体讲: 先抽大单位先抽大单位( (可以用类型抽样可以用类型抽样或机械抽样或机械抽样) ), 再在大单位中抽小单位再在大单位中抽小单位( (可用整可用整群抽样或简单随机抽样群抽样或简单随机抽样) ),小单位中再抽更小的,小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。单位;而不是一次就直接抽取基层的调查单位。六、重复抽样和不重复抽样六、重复抽样和不重复抽样 以上每一种组织方式又有不同的抽取样本方以上每一种组织方式又有不同的抽取样本方法法( (机械抽样和整群抽样没有重复抽样
12、机械抽样和整群抽样没有重复抽样) ):重复抽样:重复抽样:又称有放回抽样。又称有放回抽样。不重复抽样:不重复抽样:又称不放回抽样。又称不放回抽样。例例,50001,50001,50001例例,49981,49991,50001第三节第三节 抽样平均误差抽样平均误差 一、抽样误差的概念及其影响程度一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况不一在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。致,两者的偏离称为统计误差。统计误差统计误差登记误差登记误差代表性误差代表性误差系统性误差系统性误差随机误差随机误差实际误差实际误差抽样平均误差抽样平均误差抽样误差抽样误差即
13、指随机误差,这种误差是抽即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。样调查固有的误差,是无法避免的。 xXpP抽抽样样误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、。抽样误差的影响因素:抽样误差的影响因素: 1. 1. 全全及总体标志变异程度。及总体标志变异程度。正比关系正比关系2. 2. 抽抽样单位数目的多少。样单位数目的多少。反比关系反比关系3. 3. 不不同的抽样方式。同的抽样方式。4. 4. 不不同的抽样组织形式。同的抽样组织形式。抽样误差的作用:抽样误差的作用:1. 1. 在在于说明样本指标的代表性大小。于说明样本指标的
14、代表性大小。 误差大,则样本指标代表性低;误差大,则样本指标代表性低; 误差小,则样本指标代表性高;误差小,则样本指标代表性高; 误差等于误差等于0 0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2. 2. 说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。二、抽样平均误差二、抽样平均误差 抽样平均误差抽样平均误差实际上是样本指标的标准差。实际上是样本指标的标准差。通常用通常用表示。在表示。在N N中抽出中抽出n n样本,从排列组样本,从排列组合中可以有各种各样的样本组:合中可以有各种各样的样本组:1. 1. 如果是重复抽样:如果是重复抽样:1(2)n
15、nNNnDC 考考虑虑顺顺序序的的重重复复抽抽样样:不不虑虑顺顺序序的的重重复复抽抽样样:样样本本种种数数种种考考5(1)() 50312,500,000nnNBN 例例2. 2. 如果是不重复抽样如果是不重复抽样:)!(!)()(nNNnNNNNAnN 121考虑顺序的不重复抽样:考虑顺序的不重复抽样:例例)(种2002512544647484950550 A不考虑顺序的不重复抽样不考虑顺序的不重复抽样:)!( !nNnNCnN 例例)(!种7601182123452002512545550550 AC2 1020304050X30()525()五户家庭三月份购买某商品的支出:元, 元, 元
16、, 元, 元元现从五户中抽取二户作调查,如果为重复抽样 考虑顺序种排列组合如下:例例101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -5 25204030 0 0205035 5 25301020-10 100302025 -5 25303030 0 0 x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本304035 5 2530504010 100401025 -5 2540203
17、0 0 0403035 5 2540404010 10040504515 225501030 0 0502035 5 2550304010 10050404515 22550 505020 400合 计-2 500接左:接左:)()(10252500)()(2为样本配合总数元抽样平均误差nnXxx 以上资料编成次数分配表如下:以上资料编成次数分配表如下:x样本数样本数f (f (即次数分配即次数分配) )101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计 25 -xX 2(xX) ff 抽样误差抽样误差是所有可能出现的样本指标的是所有可
18、能出现的样本指标的 标准差标准差。它是由于抽样的随机性而产生的样本指标与它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。总体指标之间的平均离差。 抽取样本抽取样本样本平均数样本平均数离差离差10 2015-1522510 3020-1010010 4025 -5 2510 5030 0 020 3025 -5 2520 4030 0 020 5035 5 2530 4035 5 2530 50401010040 504515225合 计-750 xxX 2xX )(66.810750)(元抽样平均误差n)X-x( 2x上例五户中抽取二户调查,如采取不考虑顺序的不重复抽上例五户中抽
19、取二户调查,如采取不考虑顺序的不重复抽样方法,则:样方法,则:)(30)(10124525元种XC三、简单随机抽样的抽样平均误差三、简单随机抽样的抽样平均误差 ( (一一) ) 平均数的抽样平均误差平均数的抽样平均误差或或xx2 nn 1.1.重重复抽样复抽样取得取得的途径有:的途径有: 1.1.用用过去全面调查或抽样调查的资料,若同时过去全面调查或抽样调查的资料,若同时有有n n个个的资料,应选用数值较大的那个的资料,应选用数值较大的那个;2. 2. 用用样本标准差样本标准差S S代替全及标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的大规模调查前,先搞个小规模的试
20、验性的调查来确定调查来确定S S,代替,代替;4. 4. 用用估计的方法。估计的方法。2.2.不不重复抽样重复抽样:2xNnnN1 2xNnn(1)nN 但但实实际际中中, 往往往往 很很大大, 很很小小,故故改改用用下下列列公公式式:x400100(1)1.99()10010000 上上例例中中,若若为为不不重重复复抽抽样样,则则:小小时时( (二二) ) 成数的抽样平均误差成数的抽样平均误差 已证明得:已证明得:成数的方差为成数的方差为p(1-p)p(1-p) nPPp)1 ( )1 ()1 (NnnPPp四、类型抽样的抽样平均误差四、类型抽样的抽样平均误差 在重复抽样情况下在重复抽样情况
21、下:nix2 NNiii 22 2ixn (1)nN 在在不不重重复复抽抽样样情情况况下下:不重复抽样不重复抽样 :)1 ()1 (NnnPPp在成数情况下:在成数情况下:重复抽样重复抽样 :nPPp)1 ( 五、机械抽样五、机械抽样( (等距抽样等距抽样) )的抽样平均误差的抽样平均误差 1.1.若若按无关标志排队按无关标志排队一般采用简单随机抽样一般采用简单随机抽样不重复抽样公式不重复抽样公式:xp2n (1)nNp(1p)n (1)nN 为为简简便便起起见见,也也可可采采用用重重复复抽抽样样公公式式。2. 2. 若若按有关标志排队按有关标志排队2xp np(1 p) n 一般用类型抽样重
22、复抽样的公式一般用类型抽样重复抽样的公式:六、整群抽样的抽样平均误差六、整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响:整群抽样的抽样平均误差受三个因素影响:(1)(1)抽抽出的群数出的群数(r)(r)多少多少 ( (反比关系反比关系) )(2)(2)群群间方差间方差( ) ( ) (正比关系正比关系) )2 d d一般计算方法如下:一般计算方法如下:rrxxix22)(d为抽样各群的总平均数为抽样各群的平均数xxi为抽样各群的总成数为抽样各群的成数ppirrppip22)(d(3) (3) 抽抽样方法样方法 ,当当R R的数目较大的数目较大整群抽样都采用不重复抽样,所以在计算抽
23、样整群抽样都采用不重复抽样,所以在计算抽样误差时要使用修正系数误差时要使用修正系数1RrR时,可用时,可用Rr1来代替。来代替。)1 (2Rrrxxd)1 (2Rrrppd七、多阶段抽样的抽样平均误差七、多阶段抽样的抽样平均误差 以两阶段抽样为例以两阶段抽样为例设总体分设总体分R R组,每组包含组,每组包含 个单位,若各组个单位,若各组 相等,则相等,则iMMRMN 在抽样第一阶段,从在抽样第一阶段,从R R组中抽出组中抽出r r组;组;在抽样第二阶段,在中选的在抽样第二阶段,在中选的r r组中随机抽选组中随机抽选 个个im单位,若各组单位,若各组m m相等,则相等,则n=rmn=rm则则:在
24、重复抽样下:在重复抽样下在不重复抽样下在不重复抽样下)()(1122 MmMrmRrRrx d d rmrx22 d d 以上抽样平均误差的公式归纳如下:以上抽样平均误差的公式归纳如下:最基本的是最基本的是:nx2nPPp)1 ( 若为若为不重复抽样不重复抽样:)1 (Nn乘以若为若为类型抽样类型抽样:22)1 ()1 (PPPP若为若为整群抽样整群抽样:22xd2)1 (pPPdRN rn 第四节第四节 全及指标的推断全及指标的推断 一、点估计和区间估计一、点估计和区间估计( (一一) )点估计点估计xXpP是是由由样样本本指指标标直直接接代代替替全全及及指指标标,不不考考虑虑任任何何抽抽样
25、样误误差差因因素素。即即用用 直直接接代代表表 ,用用直直接接代代表表 。就就100 x1002p98%X1002P98% 在在全全部部产产品品中中,抽抽取取件件进进行行仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。例例( (二二) )区间估计区间估计是是根据样本指标和抽样误差去推断根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计全及指标的可能范围,它能说清楚估计的准确程度和把握程度。的准确程度和把握程度。 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样足够大时,
26、抽样总体为正态分布,根据正态分布规律可知,样本总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率信区间,即在概率F(t)F(t)的保证下:的保证下: 抽样极限误差抽样极限误差=t=t,(,(t t为概率度)为概率度)可见,抽样极限误差,即扩大或缩小了以后的可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样误差范围。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时
27、,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例例 抽样误差范围的实际意义是要求被估计的抽样误差范围的实际意义是要求被估计的全及指标全及指标 或或P P落在抽样指标一定范围内,即落在抽样指标一定范围内,即落在落在 Xxx 或或pp 的范围内。的范围内。二、全及平均数和全及成数的推断二、全及平均数和全及成数的推断 在概率在概率F(t)F(t)的保证下:的保证下:xxxXxpppPp即:全及平均数即:全及平均数( (成数成数)=)=抽样平均数抽样平均数( (成数成数) )t三、全及总体总量指标的推断三、全及总体总量指标的推
28、断( (一一) ) 直接换算法直接换算法抽样平均数抽样平均数( (成数成数) )总体单位数总体单位数= =总体标志总量总体标志总量1.1.如如果采用点估计方法:上例果采用点估计方法:上例1 1中:中:40040010000=400(10000=400(万千克万千克) ) 如果用区间估计方法:上例如果用区间估计方法:上例1 1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为: t=2: (397.62 t=2: (397.62 402.38) 402.38)10000=397.62 10000=397.62 402.38( 402.38(万千克万千克) ) t=3: (396.43 t=3
29、: (396.43 403.57) 403.57)10000=396.43 10000=396.43 403.57( 403.57(万千克万千克) ) 2.2.上上例例2 2中,全部一级品数量的范围为:中,全部一级品数量的范围为: (92.82% (92.82% 97.18%) 97.18%)8000=7425.6 8000=7425.6 7774.4( 7774.4(件件) )( (二二) ) 修正分数法修正分数法就就是用抽样所得的调查结果同有关资是用抽样所得的调查结果同有关资料对比的分数来修正全面统计资料时采用料对比的分数来修正全面统计资料时采用的一种方法。的一种方法。第五节第五节 必要抽
30、样单位数的确定必要抽样单位数的确定 一、影响必要抽样单位数的因素一、影响必要抽样单位数的因素21. P(1P)() 体体各各单单位位的的标标志志变变异异程程度度,即即或或的的大大小小 正正比比总总2. () 许许误误差差 的的大大小小 反反比比允允3. t()率率度度 的的数数值值 正正比比概概4. 样样方方式式和和组组织织形形式式抽抽( (一一) ) 简单随机抽样简单随机抽样二、必要抽样单位数的计算公式二、必要抽样单位数的计算公式: 重重复复抽抽样样222t n 22t P(1P)n 不不重重复复抽抽样样:22222Nt nNt 222N P(1P)tnNt P(1P) ( (二二) ) 类
31、型抽样类型抽样22 ; P(1-P)P(1-P) 重复抽样重复抽样:221ppptn )(222xtn 不重复抽样不重复抽样:22222 tNNtnx )()(pptNNpptnp 11222( (三三) ) 机械抽样机械抽样 在有总体差异程度和比重的全面资料时,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;可采用类型抽样的公式; 没有总体的全面资料时,可采用简单随没有总体的全面资料时,可采用简单随机抽样的公式。机抽样的公式。( (四四) ) 整群抽样整群抽样22x222xx22p222ppRt rRtRt rRtd d d dd d d d不不:重重复复抽抽样样222)1 (px
32、xppRNrndd第六节第六节 假设检验假设检验一、假设检验的意义一、假设检验的意义所谓所谓假设检验假设检验,就是对某一总体参数先作,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出则假设的参数是可信的,作出“接受接受”的结论,的结论,若两者的差异很大,则假设的参数准确的可能性若两者的差异很大,则假设的参数准确的可能性很小,作出很小,作出
33、“拒绝拒绝”的结论。的结论。二、假设检验的程序二、假设检验的程序 ( (一一) )提出原假设和替代假设提出原假设和替代假设原假设原假设( (又称虚无假设又称虚无假设) )是接受检验的假设,是接受检验的假设,记作记作H H0 0;替代假设替代假设( (又称备选假设又称备选假设) )是当原假设被否定是当原假设被否定时的另一种可成立的假设,记作时的另一种可成立的假设,记作H H1 1;H H0 0与与H H1 1两者是对立的,如两者是对立的,如H H0 0真实,则真实,则H H1 1不真不真实;如实;如H H0 0不真实,则不真实,则H H1 1为真实。为真实。 H H0 0和和H H1 1在统计学
34、在统计学中称为统计假设。中称为统计假设。关于总体平均数的假设有三种情况: (1) H0: =0 H1: 0 (2) H0: 0 H1: 0以上三种类型,对第一种类型的检验,称双边双边检验检验,因为0,包含0和0。而对第二、三种类型的检验,称单边检验单边检验。例例( (二二) )选定检验统计量及其分布选定检验统计量及其分布 如如下下:样样本本统统计计检检验验统统计计量量的的基基本本量量被被假假设设参参数数检检验验统统计计量量统统形形式式计计量量的的标标准准差差XX Z tSnn 检检验验总总体体平平均均值值的的统统有有计计,量量: 例例( (三三) )选择显著性水平选择显著性水平 当当原假设原假
35、设H H0 0为真时,却因为样本指标的为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概差异而被否定,这种否定真实的原假设的概率就是显著性水平。用率就是显著性水平。用表示。表示。例例 =0.05(=0.05(即即5%)5%)或或=0.01(=0.01(即即1%)1%) 在假设检验中,要分析样本数值与参数在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著
36、的,就要否定原假显著,如两者差异是显著的,就要否定原假设,因此,假设检验又称设,因此,假设检验又称显著性检验显著性检验。( (四四) )确定临界值确定临界值 要根据显著性水平要根据显著性水平的值确定接受的值确定接受域、拒绝域的临界值。域、拒绝域的临界值。( (五五) )计算检验统计量计算检验统计量 在在计算检验统计量时,要注意是双边检计算检验统计量时,要注意是双边检验还是单边检验。验还是单边检验。( (六六) )根据样本指标计算的检验统计量的数值作根据样本指标计算的检验统计量的数值作出决策出决策 如如果检验统计量的数值落在拒绝域内果检验统计量的数值落在拒绝域内( (包括临界值包括临界值) ),
37、就说明原假设,就说明原假设H H0 0与样本描述与样本描述的情况有显著差异,应该否定原假设;如果的情况有显著差异,应该否定原假设;如果该数值落在接受域内,就说明原假设该数值落在接受域内,就说明原假设H H0 0与样与样本描述的情况无显著差异,则应接受原假设。本描述的情况无显著差异,则应接受原假设。三、假设检验的基本方法三、假设检验的基本方法 ( (一一) ) 总体均值的假设检验总体均值的假设检验1.1.一个总体均值的假设检验一个总体均值的假设检验正态分布、方差已知情况正态分布、方差已知情况双边检验双边检验 H H0 0 : :=0 0 H H1 1 : :0 022220ZZZZH2ZZ 在在
38、假假设设的的双双边边检检验验中中,如如果果检检验验统统计计量量的的数数值值过过大大或或过过小小,都都将将否否定定原原假假设设。否否定定域域位位于于正正态态分分布布曲曲线线两两边边,在在显显著著性性水水平平 条条件件下下,每每个个尾尾部部的的面面积积分分别别为为,临临界界值值为为和和。当当检检验验统统计计量量的的数数值值时时,就就否否定定原原假假设设;时时,认认为为差差异异不不显显著著,就就接接受受原原假假设设,见见图图:221)(2临界值Z)(2临界值Z否定域否定域接受域单边检验单边检验图:,则为右边检验,见下如,则为左边检验;在单边检验中,如0101: :HH1ZZ否定域接受域否定域接受域1
39、右边检验左边检验645. 1 645. 1 1 . 02645. 1 645. 105. 0ZZZZ,再查得临界值,当单边检验时,取因为正态分布是双边的,时,当。 对于正态分布、方差未知的情况,大样本对于正态分布、方差未知的情况,大样本时依然可采用时依然可采用Z Z统计量进行假设检验,未知的统计量进行假设检验,未知的总体方差以样本方差总体方差以样本方差 代替,代替,其观察值用计算公式:其观察值用计算公式:2SnSxt0(见书P316例)2.2.两个总体均值之差的假设检验两个总体均值之差的假设检验 如果从两个总体抽取的样本容量均超过如果从两个总体抽取的样本容量均超过3030,可采用可采用Z Z检
40、验统计量:检验统计量:2221212121)()(nnxxZ该题意即为检验两厂灯泡的平均寿命是否相等。该题意即为检验两厂灯泡的平均寿命是否相等。这是一个双边检验的问题。可作如下假设:这是一个双边检验的问题。可作如下假设:210:H211:H:根据已知条件,计算检验统计量:根据已知条件,计算检验统计量:38. 27512010095)0()12201180(22Z22,96. 1ZZZ由于说明检验统计量落在否定域中,所以拒绝说明检验统计量落在否定域中,所以拒绝 ,0H接受接受 ,即认为两厂生产的灯泡的平均寿命有,即认为两厂生产的灯泡的平均寿命有1H显著性差异。显著性差异。( (二二) ) 总体成
41、数的假设检验总体成数的假设检验1.1.一个总体成数的假设检验一个总体成数的假设检验0100:,:) 1 (PPHPPH0100:,:)2(PPHPPH0100:,:)3(PPHPPH检验统计量检验统计量:nPPPPZ)1 (0002.2.两个总体比例之差的假设检验两个总体比例之差的假设检验如果两个样本抽自独立的两个总体,可选择如果两个样本抽自独立的两个总体,可选择Z Z检验统计量:检验统计量:2221112121)1 ()1 ()()(nppnppPPppZ谢谢 谢谢22.4.2421:12:0621:1221:1222.4.2422.4.2421:1221:1221:12:0622.4.2422.4.2421:12:062022年4月24日星期日21时12分6秒