《第六章抽样调查优秀课件.ppt》由会员分享,可在线阅读,更多相关《第六章抽样调查优秀课件.ppt(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章抽样调查第1页,本讲稿共100页第一节第一节 抽样调查的意义及基本概念抽样调查的意义及基本概念 一、抽样调查的意义一、抽样调查的意义一一般所讲的抽样调查,即指狭义的抽样调般所讲的抽样调查,即指狭义的抽样调查查(随机抽样随机抽样):按照随机原则从总体中抽取一:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。总体作出数量上的推断分析。第2页,本讲稿共100页二、抽样调查的适用范围二、抽样调查的适用范围 抽抽样调查方法是市场经济国家
2、在调查方法上样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。低、速度快、应用面广等优点。第3页,本讲稿共100页1.1.实实际工作不可能进行全面调查观察,而又需要了解其全面际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物总体
3、的单位样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设进行用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:第4页,本讲稿共100页三、抽样调查的基本概念三、抽样调查的基本概念(一一)全及总体和抽样总体全及总体和抽样总体(总体和样本总体和样本)全全及总体:所要调查观察的全部事物。及总体:所要调查观察的全部事物。总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位。样总体:抽取出
4、来调查观察的单位。抽样总体的单位数用抽样总体的单位数用n n表示。表示。n 30 n 30 大样本大样本 n 30 n 30 小样本小样本第5页,本讲稿共100页(二二)全及指标和抽样指标全及指标和抽样指标(总体指标和样本指标总体指标和样本指标)全全及指标:全及总体的那些指标。及指标:全及总体的那些指标。抽抽样指标:抽样总体的那些指标。样指标:抽样总体的那些指标。第6页,本讲稿共100页 抽抽样框样框 即总体单位的名单,是指对可以选择作为即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以样本的总体单位列出名册或顺序编号,以确确定总体的抽样范围和结构。定总体的抽样范围和结构
5、。样样本数本数指从总体中可能抽取的样本的数量。指从总体中可能抽取的样本的数量。样样本容量本容量指一个样本所包括的单位数。指一个样本所包括的单位数。第7页,本讲稿共100页 第二节第二节 抽样调查的组织形式抽样调查的组织形式 通常有以下四种组织形式:通常有以下四种组织形式:第8页,本讲稿共100页一、简单随机抽样一、简单随机抽样(纯随机抽样纯随机抽样)即从总体单位中不加任何分组、排队,即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:1.1.直接抽选法;直接抽选法;2.2.抽签法;抽签法;3.
6、3.随机数码表法;随机数码表法;第9页,本讲稿共100页二、类型抽样二、类型抽样(分类抽样分类抽样)先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类(层层),然后再从各类,然后再从各类(层层)中按随机原则抽取中按随机原则抽取样本,组成一个总的样本。样本,组成一个总的样本。第10页,本讲稿共100页类型的划分:类型的划分:一一是必须有清楚的划类界限;是必须有清楚的划类界限;二二是必须知道各类中的单位数目和比例;是必须知道各类中的单位数目和比例;三三是分类型的数目不宜太多。是分类型的数目不宜太多。第11页,本讲稿共100页类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差
7、小、抽样调查成本较本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以低。如果抽样误差的要求相同的话则抽样数目可以减少。减少。第12页,本讲稿共100页两种类型:两种类型:1.1.等等比例类型抽样比例类型抽样(类型比例抽样类型比例抽样);2.2.不不等比例类型抽样等比例类型抽样(类型适宜抽样类型适宜抽样)。第13页,本讲稿共100页三、机械抽样三、机械抽样(等距抽样等距抽样)先先将全及总体的所有单位按某一标志顺序将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排队,然后按相等的距离抽取样本单位。第14页,本讲稿共100页排列次序用的标志有两种
8、:排列次序用的标志有两种:1.1.选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称无称无关标志排队。关标志排队。2.2.选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关,称称有关标志排队。有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例第15页,本讲稿共100页机械抽样按样本单位抽选的方法不同,可机械抽样按样本单位抽选的方法不同,可分为三种:分为三种:1.1.随随机起点等距抽样机起点等距抽样k k k k+a 2k
9、+a (n-1)k+aak(k为抽取间隔)示意图:示意图:第16页,本讲稿共100页2.2.半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)示意图:示意图:第17页,本讲稿共100页3.3.对对称等距抽样称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)第18页,本讲稿共100页机械抽样的好处:机械抽样的好处:1.1.可可以使抽样过程大大简化,减轻抽样的工作以使抽样过程大大简化,减轻抽样的工作量;量;2.2.如如果用有关标志排队,还可以缩小抽样误差,果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。提高抽样推断效果。第19页,本讲
10、稿共100页机械抽样机械抽样,实际上是一种特殊的类型抽,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。种情况下,则类型抽样就成了机械抽样。第20页,本讲稿共100页四、整群抽样四、整群抽样 整群抽样整群抽样即从全及总体中成群地抽取样本单位,对抽即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。中的群内的所有单位都进行观察。整群抽样的好处:整群抽样的好处:组织工作比较简单方便,适用组织工作比较简单方便,适用
11、于一些特殊的研究对象。其不足之处是,一般比其它抽样于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。方式的抽样误差大。第21页,本讲稿共100页五、多阶段抽样五、多阶段抽样 即把抽样本单位的过程分为两个或几个阶段即把抽样本单位的过程分为两个或几个阶段来进行。来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:抽样)具体讲:先抽大单位先抽大单位(可以用类型抽样或机可以用类型抽样或机械抽样械抽样),再在大单位中抽小单位再在大单位中抽小单位(可用整可用整群抽样或简单随机抽样群抽样或简单随机抽样),小单位中再抽更小的小单位
12、中再抽更小的单位;而不是一次就直接抽取基层的调查单位。单位;而不是一次就直接抽取基层的调查单位。第22页,本讲稿共100页六、重复抽样和不重复抽样六、重复抽样和不重复抽样 以上每一种组织方式又有不同的抽取样本方法以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样机械抽样和整群抽样没有重复抽样):重复抽样:重复抽样:又称有放回抽样。又称有放回抽样。不重复抽样:不重复抽样:又称不放回抽样。又称不放回抽样。例例例例第23页,本讲稿共100页第三节第三节 抽样平均误差抽样平均误差 一、抽样误差的概念及其影响程度一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况不一致,
13、两在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。者的偏离称为统计误差。第24页,本讲稿共100页抽样误差抽样误差即指随机误差,这种误差是抽样即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。调查固有的误差,是无法避免的。第25页,本讲稿共100页抽样误差的影响因素:抽样误差的影响因素:1.1.全全及总体标志变异程度。及总体标志变异程度。正比关系正比关系2.2.抽抽样单位数目的多少。样单位数目的多少。反比关系反比关系3.3.不不同的抽样方式。同的抽样方式。4.4.不不同的抽样组织形式。同的抽样组织形式。第26页,本讲稿共100页抽样误差的作用:抽样误差的作用:1.1.在
14、在于说明样本指标的代表性大小。于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差小,则样本指标代表性高;误差等于误差等于0 0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2.2.说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。第27页,本讲稿共100页二、抽样平均误差二、抽样平均误差 抽样平均误差抽样平均误差实际上是样本指标的标准差。实际上是样本指标的标准差。通常用通常用表示。在表示。在N N中抽出中抽出n n样本,从排列组样本,从排列组合中可以有各种各样的样本组:合中可以有各种各样的
15、样本组:第28页,本讲稿共100页1.1.如果是重复抽样:如果是重复抽样:例例第29页,本讲稿共100页2.2.如果是不重复抽样如果是不重复抽样:考虑顺序的不重复抽样:考虑顺序的不重复抽样:例例第30页,本讲稿共100页不考虑顺序的不重复抽样不考虑顺序的不重复抽样:例例第31页,本讲稿共100页例例第32页,本讲稿共100页101010-20 400102015-15 225103020-10 100104025 -5 25105030 0 0201015-15 225202020-10 100203025 -5 25204030 0 0205035 5 25301020-10 1003020
16、25 -5 25303030 0 0304035 5 2530504010 100401025-5 25402030 0 0403035 5 2540404010 10040504515 225501030 0 0502035 5 2550304010 10050404515 22550 505020 400合 计-2 500接左:接左:第33页,本讲稿共100页第34页,本讲稿共100页以上资料编成次数分配表如下:以上资料编成次数分配表如下:样本数样本数f(f(即次数分配即次数分配)101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计
17、25 -第35页,本讲稿共100页抽样误差抽样误差是所有可能出现的样本指标的标准差。它是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。间的平均离差。第36页,本讲稿共100页抽取样本抽取样本样本平均数样本平均数离差离差10 2015-1522510 3020-1010010 4025-5 2510 5030 0 020 3025-5 2520 4030 0 020 5035 5 2530 4035 5 2530 50401010040 504515225合 计-750上例五户中抽取二户调查,如采取不考
18、虑顺序的不重复抽样方法,上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:则:第37页,本讲稿共100页三、纯随机抽样的抽样平均误差三、纯随机抽样的抽样平均误差(一一)平均数的抽样平均误差平均数的抽样平均误差1.1.重重复抽样复抽样第38页,本讲稿共100页取得取得的途径有:的途径有:1.1.用用过去全面调查或抽样调查的资料,若同时有过去全面调查或抽样调查的资料,若同时有n n个个的的资料,应选用数值较大的那个;资料,应选用数值较大的那个;2.2.用用样本标准差样本标准差S S代替全及标准差代替全及标准差;1.1.3.3.在在大规模调查前,先搞个小规模的试验性的调查来确定大规模调查
19、前,先搞个小规模的试验性的调查来确定S S,代替,代替;4.4.用用估计的方法。估计的方法。第39页,本讲稿共100页 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,例例第40页,本讲稿共100页2.2.不不重复抽样重复抽样:第41页,本讲稿共100页(二二)成数的抽样平均误差成数的抽样平均误差 已证明得:已证明得:成数的方差为成数的方差为p(1-p)p(1-p)第42页,本讲稿共100页 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取
20、150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例例第43页,本讲稿共100页四、类型抽样的抽样平均误差四、类型抽样的抽样平均误差 在重复抽样情况下在重复抽样情况下:第44页,本讲稿共100页第45页,本讲稿共100页 某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。麦田类型抽样的平均误差计算表类 型全场播种面积(公顷)抽样调查面积(公顷)单位面积产量不均匀程度指标(千克)符 号Ninii丘陵地区 6000600 75
21、0337500000平原地区 3600360 840254016000山 地 24002401000240000000合 计120001200-831516000例例第46页,本讲稿共100页第47页,本讲稿共100页高产麦田比重的平均误差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵802016 60096.0平原9010 9 36032.4山地604024 24057.6合计-1200 186第48页,本讲稿共100页五、机械抽样五、机械抽样(等距抽样等距抽样)的抽样平均误差的抽样平均误差
22、 第49页,本讲稿共100页1.1.若若按无关标志排队按无关标志排队公式用以上纯随机抽样的公式,一般采用公式用以上纯随机抽样的公式,一般采用不重复抽样公式:不重复抽样公式:第50页,本讲稿共100页2.2.若若按有关标志排队按有关标志排队公式用类型抽样的公式:公式用类型抽样的公式:第51页,本讲稿共100页六、整群抽样的抽样平均误差六、整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响:整群抽样的抽样平均误差受三个因素影响:(1)(1)抽抽出的群数出的群数(r)(r)多少多少 (反比关系反比关系)(2)(2)群群间方差间方差()()(正比关系正比关系)第52页,本讲稿共100页计算方
23、法如下:计算方法如下:第53页,本讲稿共100页(3)(3)抽抽样方法样方法 第54页,本讲稿共100页 假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产品的合格率,检查结果如下:合格率群数rpipir80%20.80 1.6-0.09960.0198485%40.85 3.4-0.04960.0098490%120.90 10.8 0.0004 (太小不计)95%30.95 2.85 0.05040.0076298%30.98 2.94 0.08040.01939合计24-21.59-0.05669例例第55页,本讲稿共100页七、多阶段抽样的抽样平均误差七、多
24、阶段抽样的抽样平均误差 以两阶段抽样为例以两阶段抽样为例设总体分设总体分R R组,每组包含组,每组包含 个单位,若各组个单位,若各组 相等,则相等,则在抽样第一阶段,从在抽样第一阶段,从R R组中抽出组中抽出r r组;组;在抽样第二阶段,在中选的在抽样第二阶段,在中选的r r组中随机抽选组中随机抽选 个个单位,若各组单位,若各组m m相等,则相等,则n=rmn=rm第56页,本讲稿共100页则则:在重复抽样下:在重复抽样下在不重复抽样下在不重复抽样下第57页,本讲稿共100页例例 设某大学在学期初对学生进行体重抽样调查,先从全校80个班以不重复抽样方法随机抽取8个班,然后再从抽取的班中再分别抽
25、取10个人作为第二阶段抽样单位。计算所得的抽样平均体重为60.5千克,抽样各班内方差平均数 为50,各班之间体重方差 为22。假设全校各班均为40人。试以94.45%(t=2)的概率,推断该校学生平均体重的范围。第58页,本讲稿共100页已知已知:解解:第59页,本讲稿共100页以上抽样平均误差的公式归纳如下:以上抽样平均误差的公式归纳如下:第60页,本讲稿共100页 第四节第四节 全及指标的推断全及指标的推断 一、点估计和区间估计一、点估计和区间估计第61页,本讲稿共100页(一一)点估计点估计例例第62页,本讲稿共100页只要在样本代表性大,且对全及指标精确性只要在样本代表性大,且对全及指
26、标精确性要求不高的情况下,可采用点估计法。如能要求不高的情况下,可采用点估计法。如能满足下列三个准则满足下列三个准则:无偏性无偏性一致性一致性有效性有效性就会得到合理的估计就会得到合理的估计第63页,本讲稿共100页(二二)区间估计区间估计是是根据样本指标和抽样误差去推断全及根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程指标的可能范围,它能说清楚估计的准确程度和把握程度。度和把握程度。第64页,本讲稿共100页 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样总体足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以为正态分布,根据正态分布
27、规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率定的区间叫抽样极限误差,也称置信区间,即在概率F(t)F(t)的保证下:的保证下:抽样极限误差抽样极限误差=t=t,(,(t t为概率度)为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。误差范围。第65页,本讲稿共100页当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)
28、=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例例 抽样误差范围的实际意义是要求被估计的抽样误差范围的实际意义是要求被估计的全及指标全及指标 或或P P落在抽样指标一定范围内,即落在抽样指标一定范围内,即落在落在 或或的范围内。的范围内。第66页,本讲稿共100页二、全及平均数和全及成数的推断二、全及平均数和全及成数的推断 第67页,本讲稿共100页 某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:例例1 1第68页,本讲稿共100页 某机
29、械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:例例2 2第69页,本讲稿共100页三、全及总体总量指标的推断三、全及总体总量指标的推断第70页,本讲稿共100页(一一)直接推断法直接推断法抽样平均数抽样平均数(成数成数)总体单位数总体单位数=总体标志总量总体标志总量1.1.如如果采用点估计方法:上例果采用点估计方法:上例1 1中:中:40010000=400(40010000=400(万千克万千克)如果用区间估计方法:上例如
30、果用区间估计方法:上例1 1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为:t=2:(397.62 t=2:(397.62 402.38)10000=397.62 402.38)10000=397.62 402.38(402.38(万千克万千克)t=3:(396.43 t=3:(396.43 403.57)10000=396.43 403.57)10000=396.43 403.57(403.57(万千克万千克)2.2.上上例例2 2中,全部一级品数量的范围为:中,全部一级品数量的范围为:(92.82%(92.82%97.18%)8000=7425.6 97.18%)8000=7425
31、.6 7774.4(7774.4(件件)第71页,本讲稿共100页(二二)修正系数法修正系数法就就是用抽样所得的调查结果同有关资料对比的系是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。数来修正全面统计资料时采用的一种方法。第72页,本讲稿共100页 某村6000农户,2005年年末统计养猪头数,从下往上报的是9000头,现抽10(600户)的农户再复查一下,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。例例1 1第73页,本讲稿共100页某市房地局,年报工资总额3218.1万元。现抽查14个单位:年报:415.03
32、万元 多报:0.44万元 少报:1.47万元抵冲后 1.47-0.44=1.03(万元)例例2 2第74页,本讲稿共100页第五节第五节 必要抽样数目的确定必要抽样数目的确定 一、影响必要抽样数目的因素一、影响必要抽样数目的因素第75页,本讲稿共100页(一一)简单随机抽样简单随机抽样二、必要抽样数目的计算公式二、必要抽样数目的计算公式第76页,本讲稿共100页(二二)类型抽样类型抽样重复抽样重复抽样:不重复抽样不重复抽样:第77页,本讲稿共100页(三三)机械抽样机械抽样 在有总体差异程度和比重的全面资料时,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;可采用类型抽样的公式;没有
33、总体的全面资料时,可采用简单随机没有总体的全面资料时,可采用简单随机抽样的公式。抽样的公式。第78页,本讲稿共100页(四四)整群抽样整群抽样第79页,本讲稿共100页建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料=1.5,求样本数应是多少?例例1 1第80页,本讲稿共100页某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例例2 2第81页,本讲稿共100页例例3 3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样
34、检验,结果知道标准差是18天与20天,试问在抽样误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?已知:解:即至少应抽查即至少应抽查400400双鞋子双鞋子第82页,本讲稿共100页第六节第六节 假设检验假设检验一、假设检验的意义一、假设检验的意义所谓所谓假设检验假设检验,就是对某一总体参数先作出假,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设判断两者差异是否显著,若两者差异很
35、小,则假设的参数是可信的,作出的参数是可信的,作出“接受接受”的结论,若两者的的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出差异很大,则假设的参数准确的可能性很小,作出“拒绝拒绝”的结论。的结论。第83页,本讲稿共100页某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。例例1 1第84页,本讲稿共100页某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年
36、收入为71000元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。例例2 2第85页,本讲稿共100页二、假设检验的程序二、假设检验的程序(一一)提出原假设和替代假设提出原假设和替代假设原假设原假设(又称虚无假设又称虚无假设)是接受检验的假设,记作是接受检验的假设,记作H H0 0;替代假设替代假设(又称备选假设又称备选假设)是当原假设被否定时的另一是当原假设被否定时的另一种可成立的假设,记作种可成立的假设,记作H H1 1;H H0 0与与H H1 1两者是对立的,如两者
37、是对立的,如H H0 0真实,则真实,则H H1 1不真实;不真实;如如H H0 0不真实,则不真实,则H H1 1为真实。为真实。H H0 0和和H H1 1在统计学中称为统计在统计学中称为统计假设。假设。第86页,本讲稿共100页关于总体平均数的假设有三种情况:(1)H0:=0;H1:0 (2)H0:0;H1:0以上三种类型,对第一种类型的检验,称双边检验,因为0,包含0和0。而对第二、三种类型的检验,称单边检验。例例第87页,本讲稿共100页(二二)选择显著性水平选择显著性水平 当当原假设原假设H H0 0为真时,却因为样本指标的差异为真时,却因为样本指标的差异而被否定,这种否定真实的原
38、假设的概率就是而被否定,这种否定真实的原假设的概率就是显著性水平。用显著性水平。用表示。表示。例例=0.05(=0.05(即即5%)5%)或或=0.01(=0.01(即即1%)1%)第88页,本讲稿共100页 在假设检验中,要分析样本数值与参数假在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设值设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实的真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否显可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假设,著,如两者差异是显著的,就要否定原假设,因此,假设
39、检验又称显著性检验。因此,假设检验又称显著性检验。第89页,本讲稿共100页(三三)选定检验统计量及其分布选定检验统计量及其分布例例第90页,本讲稿共100页(四四)计算检验统计量计算检验统计量 在在计算检验统计量时,要注意是双边检验还计算检验统计量时,要注意是双边检验还是单边检验。要根据显著性水平是单边检验。要根据显著性水平的值确定统计的值确定统计量的否定域、接受域及临界值。量的否定域、接受域及临界值。第91页,本讲稿共100页(五五)根据样本指标计算的检验统计量的数值作出决策根据样本指标计算的检验统计量的数值作出决策 如如果检验统计量的数值落在否定域内果检验统计量的数值落在否定域内(包括临
40、包括临界值界值),就说明原假设,就说明原假设H H0 0与样本描述的情况有显著与样本描述的情况有显著差异,应该否定原假设;如果该数值落在接受域差异,应该否定原假设;如果该数值落在接受域内,就说明原假设内,就说明原假设H H0 0与样本描述的情况无显著差异,与样本描述的情况无显著差异,则应接受原假设。则应接受原假设。第92页,本讲稿共100页三、假设检验的基本方法三、假设检验的基本方法 (介绍方差已知的总体平均数的假设检验介绍方差已知的总体平均数的假设检验)第93页,本讲稿共100页(一一)双边检验双边检验H H0 0:=:=0 0;H H1 1:0 0第94页,本讲稿共100页 某种产品的直径
41、为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是否合格。例例第95页,本讲稿共100页 第96页,本讲稿共100页(二二)单边检验单边检验第97页,本讲稿共100页 根据过去学校的记录,学生的统计学考试的平均分数为65分,标准差为16分。现在学校改革了教学方法,经抽取64名学生作调查,得平均分数为69分,问平均分数有无显著提高?(=0.05)例例1 1第98页,本讲稿共100页 某工厂生产瓶装1千克的某饮料,标准差为0.02千克,现随机抽取36瓶进行检验,得平均重量为0.9962千克,问能否相信该厂生产的饮料每瓶重量为1千克。(=0.05)例例2 2第99页,本讲稿共100页End of Chapter 6第100页,本讲稿共100页