《统计学 抽样推断幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学 抽样推断幻灯片.ppt(150页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学 抽样推断第1页,共150页,编辑于2022年,星期二内容提要内容提要第一节第一节第一节第一节 抽样调查的一般问题抽样调查的一般问题第二节第二节 抽样误差抽样误差第三节第三节第三节第三节 总体指标的推断总体指标的推断第四节第四节第四节第四节 必要抽样数目的确定必要抽样数目的确定必要抽样数目的确定必要抽样数目的确定 第2页,共150页,编辑于2022年,星期二第一节第一节 抽样调查的一般问题抽样调查的一般问题一、抽样调查的概念一、抽样调查的概念二、抽样调查的作用二、抽样调查的作用三、抽样调查中的几个基本概念三、抽样调查中的几个基本概念四、抽样调查的组织方式四、抽样调查的组织方式返回提要第3
2、页,共150页,编辑于2022年,星期二(一一)抽样调查的概念抽样调查的概念 抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。征的一种方法。(二二)抽样调查的主要特点:抽样调查的主要特点:(1)(1)按随机原则抽取调查单位。按随机原则抽取调查单位。(2)(2)由部分推断全体。由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。随机原则随机原则统计量统计量总体参数总
3、体参数推断推断抽取抽取一、抽样调查的概念一、抽样调查的概念第一节第4页,共150页,编辑于2022年,星期二(1)(1)用于不可能进行全面调查的无限总体。用于不可能进行全面调查的无限总体。例如:连续大量生产的某种小件产品例如:连续大量生产的某种小件产品(2)(2)用于不可能进行全面调查而又需要了解全面情况用于不可能进行全面调查而又需要了解全面情况的现象。的现象。例如:带有破坏性或消耗性的产品质量检验,灯泡的使例如:带有破坏性或消耗性的产品质量检验,灯泡的使用寿命,烟、酒的检验等。用寿命,烟、酒的检验等。(3)(3)用于不必要进行全面调查的现象。用于不必要进行全面调查的现象。例如:水库中的鱼苗数
4、、森林的木材面积等例如:水库中的鱼苗数、森林的木材面积等(4)(4)用于对全面调查的资料进行评价与修正。用于对全面调查的资料进行评价与修正。例如:人口普查需采用抽查进行复查,计算普查差错率。例如:人口普查需采用抽查进行复查,计算普查差错率。(5)(5)用于工业生产过程的质量控制。用于工业生产过程的质量控制。例如:对于成批或大量连续生产的产品生产过程,可及时提供例如:对于成批或大量连续生产的产品生产过程,可及时提供有关产品的质量信息,分析原因,采取措施,排除故障,保证有关产品的质量信息,分析原因,采取措施,排除故障,保证生产过程正常进行。生产过程正常进行。二、抽样调查的作用二、抽样调查的作用第一
5、节第5页,共150页,编辑于2022年,星期二三、抽样调查中的几个基本概念三、抽样调查中的几个基本概念(一一)全及总体和抽样总体全及总体和抽样总体(二二)总体指标总体指标(三三)样本指标样本指标第一节第6页,共150页,编辑于2022年,星期二1.1.全及总体。全及总体简称总体或母体,它是指所要调全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。查研究对象的全体。总体单位总数用总体单位总数用“N N”表示。对于一次抽样调查,全及总表示。对于一次抽样调查,全及总体是唯一确定的。体是唯一确定的。2.2.抽样总体。抽样总体简称样本或子样,它是指在全及总体抽样总体。抽样总体简称样本或子样
6、,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。中按随机原则抽取的那部分单位所构成的集合体。样本单位样本单位总数用总数用“n n”表示,亦称表示,亦称样本容量样本容量。一个全及总体可能抽出很多个样本总体,从一个全及总体中一个全及总体可能抽出很多个样本总体,从一个全及总体中可能抽取的样本数目称为样本个数。样本的个数和样本的容可能抽取的样本数目称为样本个数。样本的个数和样本的容量有关,也和抽样的方法有关。每次抽到哪个样本是不确定量有关,也和抽样的方法有关。每次抽到哪个样本是不确定的。一般地说,的。一般地说,n30n30为为大样本大样本,n n3030为为小样本小样本。在对社会。在对社
7、会经济现象进行抽样调查时,多数采用大样本。经济现象进行抽样调查时,多数采用大样本。(一一)全及总体和抽样总体全及总体和抽样总体返回三第7页,共150页,编辑于2022年,星期二(二二)总体指标总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。一确定的。平 均 指 标平 均 指 标标志变异指标标志
8、变异指标成数成数成数方差成数方差返回三第8页,共150页,编辑于2022年,星期二(二二)样本指标样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。标的数值也就不同,所以抽样指标的数值不是唯一确定的。平 均 指 标平 均 指 标标志变异指标标
9、志变异指标成数成数成数方差成数方差返回三第9页,共150页,编辑于2022年,星期二四、抽样调查的组织方式四、抽样调查的组织方式要保证抽样估计的准确性和可靠性,遵守要保证抽样估计的准确性和可靠性,遵守随机性原则和实随机性原则和实现最大的抽样效果原则现最大的抽样效果原则,事先必须结合具体研究对象的,事先必须结合具体研究对象的性质和调查工作的目的、条件,选择一定的抽样调查性质和调查工作的目的、条件,选择一定的抽样调查组织方式,做好抽样设计工作。组织方式,做好抽样设计工作。统计实践中主要采用以下抽样调查组织方式:统计实践中主要采用以下抽样调查组织方式:(一)(一)简单随机抽样简单随机抽样:直接抽取:
10、直接抽取(二)(二)类型抽样类型抽样:分类随机抽取样本:分类随机抽取样本(三)(三)等距抽样等距抽样:排列划分间隔抽取样本:排列划分间隔抽取样本(四)(四)整群抽样整群抽样:分群随机抽取样本群:分群随机抽取样本群第一节第10页,共150页,编辑于2022年,星期二 简简单单随随机机抽抽样样也也叫叫纯纯随随机机抽抽样样,它它对对总总体体单单位位不不作作任任何何分分类类排排队队,而而是是直直接接从从总总体体中中随随机机抽抽取取一一部部分分单单位来组成样本的抽样组织方式。位来组成样本的抽样组织方式。简简单单随随机机抽抽样样是是抽抽样样调调查查中中最最基基本本的的,也也是是最最单单纯纯的的方方式式,适
11、适合合于于总总体体各各部部分分都都具具有有相相同同的的分分布布且且单单位位数数较较少少的情况。的情况。简简单单随随机机抽抽样样的的具具体体方方法法有有:直直接接抽抽选选项项法法、抽抽签签法法、随机数字法、随机数字法、使用计算机模拟抽取。使用计算机模拟抽取。抽取调查单位的方法:抽取调查单位的方法:重复抽样重复抽样 不重复抽样不重复抽样(一一)简单随机抽样简单随机抽样返回四第11页,共150页,编辑于2022年,星期二重复(置)抽样重复(置)抽样重复抽样是从重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录后,再放回总体个总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个
12、单位,这样连续抽取中,然后再抽取下一个单位,这样连续抽取n n个单位组成样本的方法。个单位组成样本的方法。特点:每一次抽样时,总体都保持相同的单位数目特点:每一次抽样时,总体都保持相同的单位数目(N)(N)。每个总体单位被抽中的概率都相等每个总体单位被抽中的概率都相等(1/N 1/N)。每一个总体单位有可能被再次抽中,样本中的总每一个总体单位有可能被再次抽中,样本中的总 体单位会出现重复。体单位会出现重复。可能抽取的样本数目(样本个数):可能抽取的样本数目(样本个数):考虑顺序的抽样,是从总体考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,不个单位构成样本,不但要考
13、虑各单位的不同性质,而且还要考虑不同性质各单位的但要考虑各单位的不同性质,而且还要考虑不同性质各单位的中选顺序。相同构成成分的单位,由于顺序不同,也作为不同中选顺序。相同构成成分的单位,由于顺序不同,也作为不同的样本。样本数为:的样本。样本数为:不考虑顺序的抽样,是从总体不考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,只考虑样个单位构成样本,只考虑样本各单位的组成成分如何,而不问各单位的抽选顺序。如果样本的成分本各单位的组成成分如何,而不问各单位的抽选顺序。如果样本的成分相同,不论顺序有多大不同,也作为一种样本。样本数为:相同,不论顺序有多大不同,也作为一种样本。
14、样本数为:返回第12页,共150页,编辑于2022年,星期二不重复(置)抽样不重复(置)抽样不重复抽样是从不重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录后,个总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取n n个单位组成样本的方法。个单位组成样本的方法。特点:每一次抽样时,总体的单位数比上一次少一个。特点:每一次抽样时,总体的单位数比上一次少一个。每一个总体单位被抽中的概率都不相同。每一个总体单位被抽中的概率都不相同。每一个可能样本中的总体单位不会出现重复。每一个可能样本中的总
15、体单位不会出现重复。考虑顺序的抽样样本数为:考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:实际工作中一般采用:实际工作中一般采用:考虑顺序的重复抽样考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑顺序的不重复抽样返回第13页,共150页,编辑于2022年,星期二类类型型抽抽样样又又称称分分类类抽抽样样或或分分层层抽抽样样,它它是是先先将将总总体体按按某某个个主主要要标标志志进进行行分分组组(或或分分类类),再再按按随随机机原原则则从从各各组组中中抽取样本单位的一种抽样方式。抽取样本单位的一种抽样方式。特特点点:分分层层抽抽样样在在层层内内是是抽抽样样调调查查,层层
16、间间是是全全面面调调查查。所所以以分分层层时时应应该该尽尽量量让让每每层层内内的的变变异异程程度度小小,而而层层间间的的变变异异程程度度大大。分分层层抽抽样样的的抽抽样误差较简单随机抽样小,样本具有很好的代表性。样误差较简单随机抽样小,样本具有很好的代表性。样本单位数在各组(层)之间的分配方法:样本单位数在各组(层)之间的分配方法:1 1、等等数数分分配配类类型型抽抽样样法法,适适用用各各组组单单位位数数相相同同或或差差异异不不大的情况。大的情况。2 2、等比例类型抽样法,各组抽样比例为:、等比例类型抽样法,各组抽样比例为:n/N n/N。3 3、不不等等比比例例类类型型抽抽样样法法(最最优优
17、分分配配法法),在在样样本本容容量量一一定定的的条条件件下下,变变异异大大的的或或单单位位数数多多的的组组样样本本容容量量也也大大,变变异异小的或单位数少的组样本容量也小。小的或单位数少的组样本容量也小。返回四(二二)类型抽样类型抽样第14页,共150页,编辑于2022年,星期二3、不等比例类型抽样法、不等比例类型抽样法各组抽样比例的计算:各组抽样比例的计算:i 为第为第i层(组)内的标准差;层(组)内的标准差;i 为第为第i层(组)内的单位数占总体单位数的层(组)内的单位数占总体单位数的比重。比重。i=返回第15页,共150页,编辑于2022年,星期二等等距距抽抽样样也也称称机机械械抽抽样样
18、或或系系统统抽抽样样,它它是是将将总总体体各各单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按固固定定顺顺序序和和相相等等距距离离或或间间隔隔抽抽取取样样本本单单位位的的抽样组织方式。抽样组织方式。顺序排列的标志:无关标志、有关标志。顺序排列的标志:无关标志、有关标志。无无关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小无无关关或或不不起起主主要要影影响响作作用用。如如:时时间间、地地理理位位置置、门门牌牌号号、姓姓氏氏笔画等。笔画等。有有关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小有有密密切切关
19、关系系。如如:农农业业产产量量调调查查按按平平均均亩亩产产量量高高低低排排序序,职职工工生生活水平调查按职工平均工资排队。活水平调查按职工平均工资排队。一一般般来来讲讲,有有关关标标志志排排序序要要比比无无关关标标志志排排序序的的机机械械抽抽样样更更为为优优越。越。第一个样本单位的抽取方法和抽样距离的计算如下:第一个样本单位的抽取方法和抽样距离的计算如下:(三三)等距抽样等距抽样返回四第16页,共150页,编辑于2022年,星期二第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法:第一个样本单位的抽取方法:若按无关标志排队,可以从第一个间隔
20、内的任意一若按无关标志排队,可以从第一个间隔内的任意一个单位开始抽取个单位开始抽取;若按有关标志排队若按有关标志排队,一般是从第一个间隔内居中的单一般是从第一个间隔内居中的单位开始抽取,亦可采用对称等距抽样的办法。位开始抽取,亦可采用对称等距抽样的办法。抽样距离(间隔):抽样距离(间隔):等距抽样示意图如下:等距抽样示意图如下:在排队时,要注意避免抽样间隔与现象本身的周期在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。以减少系统偏差的影响,提高样性节奏相重合。以减少系统偏差的影响,提高样本的代表性。本的代表性。返回第17页,共150页,编辑于2022年,星期二等距抽样示意图等距抽样示
21、意图等距抽样的最大特点是:组织简单、易于实施。当按等距抽样的最大特点是:组织简单、易于实施。当按有关标志排队时,能保证样本单位在总体中均匀地分有关标志排队时,能保证样本单位在总体中均匀地分布,所抽样本对总体的代表性好,有利于降低抽样误布,所抽样本对总体的代表性好,有利于降低抽样误差。差。返回第18页,共150页,编辑于2022年,星期二整整群群抽抽样样也也称称集集团团抽抽样样、区区域域抽抽样样或或分分群群随随机机抽抽样样,它它是是将将总总体体各各单单位位按按时时间间或或空空间间形形式式划划分分成成许许多多群群,然然后后按按纯纯随随机机抽抽样样或或机机械械抽抽样样方方式式从从中中抽抽取取部部分分
22、群群,对对被被选选中群的所有单位进行全面调查的抽样组织方式。中群的所有单位进行全面调查的抽样组织方式。例例如如:某某水水泥泥厂厂大大量量连连续续生生产产100100公公斤斤装装水水泥泥,一一昼昼夜夜产产量量为为1440014400袋袋,平平均均每每分分钟钟产产量量1010袋袋。现现每每隔隔144144分分钟钟抽抽取取一一分分钟钟的的产产量量(10(10袋袋为为一一群群),一一昼昼夜夜共共抽抽取取100100袋袋水泥。水泥。如:如:500500箱某种药品,抽取箱某种药品,抽取1010箱进行检验,箱进行检验,1 1箱即为一群。箱即为一群。整群抽样时群的划分条件整群抽样时群的划分条件:(四四)整群抽
23、样整群抽样返回四第19页,共150页,编辑于2022年,星期二整群抽样时群的划分条件整群抽样时群的划分条件1 1、群与群之间没有单位重叠。、群与群之间没有单位重叠。2 2、总体中每一个单位都必须属于某一个群。、总体中每一个单位都必须属于某一个群。整群抽样在群内是全面调查,在群间是抽样调查。整群抽样在群内是全面调查,在群间是抽样调查。优点:易于组织且较节省调查费用。优点:易于组织且较节省调查费用。缺点:调查的总体单位过于集中在少数样本群中。缺点:调查的总体单位过于集中在少数样本群中。在相同条件下,样本代表性较低。在相同条件下,样本代表性较低。返回第20页,共150页,编辑于2022年,星期二第二
24、节第二节 抽样误差抽样误差一、一、抽样误差的概念抽样误差的概念二、二、影响抽样误差的主要因素影响抽样误差的主要因素三、三、抽样平均误差抽样平均误差返回提要第21页,共150页,编辑于2022年,星期二1 1、统计误差的种类、统计误差的种类统计误差是指统计数据与客观实际数量之间的差距。统计误差是指统计数据与客观实际数量之间的差距。(1 1)登登记记性性误误差差。指指在在调调查查、整整理理过过程程中中,由由于于各各种种主主客客观原因引起的登记性差错所造成的误差。观原因引起的登记性差错所造成的误差。(2 2)代代表表性性误误差差。指指由由于于样样本本单单位位的的结结构构情情况况不不足足以以代代表表总
25、体特征所产生的误差。总体特征所产生的误差。一、抽样误差的概念一、抽样误差的概念调调查查误误差差登记性误差:全面调查、非全面调查登记性误差:全面调查、非全面调查代表性误差代表性误差系统性误差:重点调查、典型调查系统性误差:重点调查、典型调查抽样(随机)误差:抽样调查抽样(随机)误差:抽样调查第二节第22页,共150页,编辑于2022年,星期二代表性误差代表性误差分两种:分两种:系统性误差:系统性误差:由于没有遵守随机原则而产生的误差。由于没有遵守随机原则而产生的误差。抽抽样样(随随机机性性)误误差差:即即使使遵遵守守了了随随机机原原则则,也也会会由由于于被被抽抽取取的的样样本本各各种种各各样样,
26、导导致致样样本本内内部部各各单单位位的的分分布布比比例例结结构构与与总总体体实实际际分分布布状状况况有有偶偶然然性性的的差差异异,从从而而使使不不同同的的随随机机样样本本得得出出不不同同的的估估计计量量,造造成成样样本本指指标标数数值值与与总总体体指指标标数数值值之之间间产生差距产生差距。又分。又分实际误差和平均误差两种:实际误差和平均误差两种:实际误差:某一样本指标与总体指标之间的差异;实际误差:某一样本指标与总体指标之间的差异;如:样本平均数与总体平均数之间的离差如:样本平均数与总体平均数之间的离差 样本成数与总体成数之间的离差样本成数与总体成数之间的离差平均误差:所有可能出现的样本指标与
27、总体指标的平均误差:所有可能出现的样本指标与总体指标的 平均离差。平均离差。返回一第23页,共150页,编辑于2022年,星期二(一一)样本单位数样本单位数(样本容量样本容量n)n)的多少的多少 样本容量越大,误差就越小;样本容量越大,误差就越小;样本容量越小,误差就越大。样本容量越小,误差就越大。(二二)总体被研究标志变异程度总体被研究标志变异程度(总体方差总体方差)的大小的大小 标志变异程度越大,误差就越大;标志变异程度越大,误差就越大;标志变异程度越小,误差就越小。标志变异程度越小,误差就越小。(三三)抽样调查的组织形式抽样调查的组织形式 类型抽样的平均误差较小。类型抽样的平均误差较小。
28、(四四)抽样方法抽样方法重复抽样的平均误差大于不重复抽样的平均误差。重复抽样的平均误差大于不重复抽样的平均误差。二、影响抽样误差的主要因素二、影响抽样误差的主要因素第二节第24页,共150页,编辑于2022年,星期二(一一)抽样平均误差的概念抽样平均误差的概念(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式(三三)抽样平均误差的计算方法抽样平均误差的计算方法(四四)其他抽样组织方式抽样平均误差的计算方法其他抽样组织方式抽样平均误差的计算方法第二节三、抽样平均误差三、抽样平均误差第25页,共150页,编辑于2022年,星期二由由于于样样本本是是按按随随机机原原则则抽抽取取的的,在在同
29、同一一总总体体中中,按按相相同同的的抽抽样样数数目目,可可以以抽抽取取许许多多相相同同和和不不同同的的样样本本,每每次次抽抽取取的的样样本本都都可可以以计计算算出出相相应应的的抽抽样样平平均均数数、抽抽样样成成数数和和抽抽样样误误差差,即即从从理理论论上上可可以以计计算算出出很很多多个个抽抽样样误误差差,它它们们带带有有偶偶然然性性,有有的的可可能能是是正正误误差差,有有的的可可能能是是负负误误差差,为为了了用用样样本本指指标标推推算算总总体体指指标标,需需计计算算这这些些抽抽样样误误差差的的平均数。平均数。抽抽样样平平均均误误差差是是指指以以全全部部可可能能样样本本指指标标为为变变量量,以以
30、总总体体指指标标为为平平均均数数计计算算得得到到的的标标准准差差,以以符符号号 表表示示,通通常常以以 代代表表平平均均数数的的抽抽样样平平均均误误差差,以以 代代表表成成数数的的抽抽样平均误差,以样平均误差,以K K 代表可能组成的样本总数。代表可能组成的样本总数。(一一)抽样平均误差的概念抽样平均误差的概念返回三第26页,共150页,编辑于2022年,星期二根据抽样平均误差的概念可得其一般计算公式:根据抽样平均误差的概念可得其一般计算公式:见例题:见例题:重复抽样重复抽样和和不重复抽样不重复抽样(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式返回三第27页,共150页,编辑于2
31、022年,星期二重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布某班组某班组5 5个工人的日工个工人的日工资为资为3434、3838、4242、4646、5050元。元。现用重置抽样的方法从现用重置抽样的方法从5 5人中随机抽人中随机抽2 2个构成样个构成样本。共有本。共有5 52 2=25=25个样本。个样本。如右图。如右图。第28页,共150页,编辑于2022年,星期二重置抽样平均数的平均误差重置抽样平均数的平均误差返回第29页,共150页,编辑于2022年,星期二不重置抽样平均数的平均误差不重置抽样平均数的平均误差返回第30页,共150页,编辑于2022年,星期二例例假假设设有
32、有10,20,3010,20,30和和4040四四个个数数字字组组成成一一个个总总体体,从从中中随机抽取两个数字作为样本,求抽样平均误差。随机抽取两个数字作为样本,求抽样平均误差。返回第31页,共150页,编辑于2022年,星期二(三三)抽样平均误差的计算方法抽样平均误差的计算方法1.1.平均数的抽样平均误差。平均数的抽样平均误差。2.2.成数的抽样平均误差成数的抽样平均误差(1)(1)重复抽样条件下:重复抽样条件下:(2)(2)不重复抽样条件下:不重复抽样条件下:当当N N很大时,很大时,例例1,1,例例22返回三第32页,共150页,编辑于2022年,星期二 例例1 1 某仪表厂生产某种型
33、号的精密仪表,按正常生产经验,产品合某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为格率为85%85%。今按简单随机抽样方式从。今按简单随机抽样方式从800800只仪表中抽取只仪表中抽取10%10%进行检验,求合进行检验,求合格品比率的抽样平均误差。格品比率的抽样平均误差。在重复条件下:在重复条件下:在不重复条件下:在不重复条件下:返回第33页,共150页,编辑于2022年,星期二例例2 2某大学有某大学有45004500名学生,采用不重复简单随机抽样方名学生,采用不重复简单随机抽样方式从中抽取式从中抽取10%10%的学生,调查其每月生活费用支出情况。抽的学生,调查其每月生活费用支
34、出情况。抽样结果显示,学生平均每人每月生活费支出样结果显示,学生平均每人每月生活费支出350350元,标准差元,标准差8080元,生活费用支出在元,生活费用支出在500500元以上的学生占全部学生的元以上的学生占全部学生的20%20%。试求抽样平均误差。试求抽样平均误差。返回第34页,共150页,编辑于2022年,星期二(四四)其他抽样组织方式抽样平均误差的计算方法其他抽样组织方式抽样平均误差的计算方法1.1.类型(分层)抽样平均误差的计算。类型(分层)抽样平均误差的计算。2.2.等距抽样平均误差的计算。等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。返回三第3
35、5页,共150页,编辑于2022年,星期二1.1.类型(分层)抽样平均误差的计算类型(分层)抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差,(2)(2)成数的抽样平均误差成数的抽样平均误差 重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:其中:其中:和和 的的计算计算 例题例题 返回第36页,共150页,编辑于2022年,星期二其中:其中:和和 第第i组的总体方差组的总体方差第第i组的总体成数组的总体成数第第i组的总体单位数组的总体单位数返回第37页,共150页,编辑于2022年,星期二类型(分层)抽样平均误差的计算类型(分层)抽样平均误差的计算
36、例题例题 某县某种农作物产量的调查见下表:某县某种农作物产量的调查见下表:返回第38页,共150页,编辑于2022年,星期二2.等距抽样平均误差的计算等距抽样平均误差的计算若总体单位按无关标志排队,其抽样误差十分接近简单若总体单位按无关标志排队,其抽样误差十分接近简单随机抽样的误差,可以用随机抽样的误差,可以用简单随机抽样简单随机抽样的平均抽样误的平均抽样误差公式近似计算。差公式近似计算。若总体单位按有关标志排队,其抽样平均误差可以用若总体单位按有关标志排队,其抽样平均误差可以用类类型抽样型抽样的平均抽样误差公式计算其近似值。的平均抽样误差公式计算其近似值。返回第39页,共150页,编辑于20
37、22年,星期二3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差 (2)(2)成数的抽样平均误差成数的抽样平均误差 例题例题 返回其中:其中:为平均数的群间方差为平均数的群间方差 为成数的群间方差为成数的群间方差r r 为样本群数为样本群数R R 为总体群数为总体群数第40页,共150页,编辑于2022年,星期二例题某商店购进例题某商店购进300300箱(箱(5050只只/箱)苹果随机抽取箱)苹果随机抽取1%1%检查其质量。见下表:检查其质量。见下表:返回第41页,共150页,编辑于2022年,星期二计算样本平均数群间方差、成数群间方差
38、:计算样本平均数群间方差、成数群间方差:计算抽样平均误差:计算抽样平均误差:返回第42页,共150页,编辑于2022年,星期二第三节第三节 总体指标的推断总体指标的推断总体指标的推断是指对总体平均数总体指标的推断是指对总体平均数 和总体成数和总体成数P P 的推断估计的问题。抽样调查的直接目的,就是的推断估计的问题。抽样调查的直接目的,就是为了推断为了推断 和和 P P,然后,再结合总体单位数,然后,再结合总体单位数N N去去推算总体的有关标志总量。推算总体的有关标志总量。总体指标的推断方法:总体指标的推断方法:一、点估计一、点估计 二、区间估计二、区间估计 三、总体参数区间估计的方法三、总体
39、参数区间估计的方法返回提要第43页,共150页,编辑于2022年,星期二一、点估计一、点估计点点估估计计也也称称定定值值估估计计,它它是是以以抽抽样样得得到到的的样样本本指指标标作作为为总总体体指指标标的的估估计计量量,并并以以样样本本指指标标的的实实际际值值(,p p)直直接接作作为为总总体体未未知知参参数数 ()的的估估计计值值的的一种推断方法。一种推断方法。即:即:例例:点估计的评判标准点估计的评判标准第三节第44页,共150页,编辑于2022年,星期二例如,对一批某种型号的电子元件例如,对一批某种型号的电子元件2000020000只进行耐只进行耐用时间检查,随机抽取用时间检查,随机抽取
40、100100只,测试的平均耐用时只,测试的平均耐用时间为间为10551055小时小时()(),合格率为,合格率为91%(91%(),我们推断说,我们推断说2000020000只电子元件总体的平均耐用时只电子元件总体的平均耐用时间为间为10551055小时小时(),全部电子元件的),全部电子元件的合格率也是合格率也是91%91%()。点估计方法简单,但不很实用。因为,抽样估计点估计方法简单,但不很实用。因为,抽样估计中抽样指标完全等于全及指标的可能性极小,不中抽样指标完全等于全及指标的可能性极小,不能提供估计误差的信息。能提供估计误差的信息。返回第45页,共150页,编辑于2022年,星期二估计
41、量的评判标准:估计量的评判标准:根据不同样本数据或用不同的方法来估计同一总体参数,根据不同样本数据或用不同的方法来估计同一总体参数,可能会得到不同的估计量。但哪一个估计量更好一些,可能会得到不同的估计量。但哪一个估计量更好一些,其评判通常采用以下标准:其评判通常采用以下标准:1.1.一致性一致性2.2.无偏性无偏性3.3.有效性。有效性。返回第46页,共150页,编辑于2022年,星期二1.1.一致性一致性 设设 为未知参数为未知参数的估计量,当的估计量,当nn时,要求时,要求 按概率收敛于按概率收敛于,即,即则称则称 是是的满足一致性标准要求的估计量。样的满足一致性标准要求的估计量。样本平均
42、数本平均数 和样本成数和样本成数 p 作为总体平均数作为总体平均数 和和总体成数总体成数 的估计量就满足一致性的准则要求,的估计量就满足一致性的准则要求,即随着即随着n越来越大,越来越大,接近接近 的概率越来的概率越来越大。越大。返回第47页,共150页,编辑于2022年,星期二2.2.无偏性无偏性若要求估计量若要求估计量 的数学期望等于未知参的数学期望等于未知参数的真值数的真值,即,即则称则称 是是的无偏估计量的无偏估计量 返回第48页,共150页,编辑于2022年,星期二3.3.有效性有效性无偏性只考虑估计量的平均结果是否等于待估计参无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有
43、效性则要求每个估计值与待估参数真数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。值之间的偏差尽可能地小。设设 ,为为的两个无偏估计量,若的两个无偏估计量,若 的方的方差小于差小于 的方差,即的方差,即 则称则称 是较是较 有效的估计量。有效的估计量。返回第49页,共150页,编辑于2022年,星期二区间估计就是以一定的概率保证估计包含总体参数的一区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标个值域,即根据样本指标和抽样平均误差推断总体指标的的可能范围可能范围。根据数理统计证明,总体单位的标志值如果是正态分布,根据数理统计证明
44、,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只要是大样本标志值不是正态分布的,只要是大样本(即即n30)n30),全部,全部可能样本指标也会接近正态分布。可能样本指标也会接近正态分布。从正态分布图中,可以从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分布总结两个特点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标的概率越大完全是对称的;二是样本指标接近于总体指标的概率越大(小小),出现的可能性也越大,出现的可能性也越大(小小)。第
45、三节二、区间估计二、区间估计第50页,共150页,编辑于2022年,星期二图图8 82 2 正态分布曲线图正态分布曲线图第51页,共150页,编辑于2022年,星期二图图8 83 3 样本指标置信度图样本指标置信度图第52页,共150页,编辑于2022年,星期二 误差范围误差范围 与概率度与概率度(t)(t)和抽样平均误差和抽样平均误差 三者之间的关系为:三者之间的关系为:又称为:极限抽样误差或允许误差又称为:极限抽样误差或允许误差 由此得到平均数和成数的误差范围公式:由此得到平均数和成数的误差范围公式:抽样估计的概率保证程度(可靠程度、置信度)抽样估计的概率保证程度(可靠程度、置信度)与概率
46、度与概率度(t)(t)是函数关系,编有是函数关系,编有“正态分布概率表正态分布概率表”第53页,共150页,编辑于2022年,星期二 进而得到总体平均指标和总体成数指标的区间估计公式进而得到总体平均指标和总体成数指标的区间估计公式为:为:第54页,共150页,编辑于2022年,星期二三、总体参数区间估计的方法三、总体参数区间估计的方法(一)根据给定的抽样误差范围,求概率保证程度(一)根据给定的抽样误差范围,求概率保证程度分析步骤:分析步骤:1 1、抽取样本,计算抽样指标。、抽取样本,计算抽样指标。2 2、根据给定的极限误差范围估计总体、根据给定的极限误差范围估计总体 参数的上限和下限。参数的上
47、限和下限。3 3、计算概率度、计算概率度(t)(t)。4 4、查表求出概率、查表求出概率F F(t t),并对总体),并对总体 参数作出区间估计。参数作出区间估计。【例例3 3】第三节第55页,共150页,编辑于2022年,星期二分析步骤分析步骤:1 1、抽取样本,计算样本指标。、抽取样本,计算样本指标。2 2、根据给定的、根据给定的F F(t t)查表求得概率度)查表求得概率度 t t。3 3、根据概率度和抽样平均误差计算极限误差。、根据概率度和抽样平均误差计算极限误差。4 4、计算被估计值的上、下限,对总体参数作出、计算被估计值的上、下限,对总体参数作出区间估计。区间估计。例一例一例二例二
48、 返回三(二)根据给定的概率(二)根据给定的概率F F(t t),推算抽样极限误差的),推算抽样极限误差的可能范围可能范围第56页,共150页,编辑于2022年,星期二例例 题题 一一某农场进行小麦产量抽样调查,小麦播种总面某农场进行小麦产量抽样调查,小麦播种总面积为积为1 1万亩,采用不重复简单随机抽样,从中抽万亩,采用不重复简单随机抽样,从中抽选了选了100100亩作为样本进行实割实测,测得样本平亩作为样本进行实割实测,测得样本平均亩产均亩产400400斤,方差斤,方差144144斤。斤。以以95.45%95.45%的可靠性推断该农场小麦平均亩产可的可靠性推断该农场小麦平均亩产可能在多少斤
49、之间?能在多少斤之间?已知:已知:N=10000 n=100 t=2第57页,共150页,编辑于2022年,星期二例题一解:1、计算抽样平均误差、计算抽样平均误差2 2、计算抽样极限误差、计算抽样极限误差3 3、计算总体平均数的置信区间、计算总体平均数的置信区间上限:上限:下限:下限:即:以即:以95.45%的可靠性估计该农场小麦平均亩产量在的可靠性估计该农场小麦平均亩产量在397.62斤至斤至402.38斤之间斤之间.返回第58页,共150页,编辑于2022年,星期二 某纱厂某时期内生产了某纱厂某时期内生产了1010万个单位的纱,按纯随机万个单位的纱,按纯随机抽样方式抽取抽样方式抽取2000
50、2000个单位检验,检验结果合格率为个单位检验,检验结果合格率为95%95%,废品率为,废品率为5%5%,试以,试以95%95%的把握程度,估计全部纱合格的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?品率的区间范围及合格品数量的区间范围?已知:已知:区间下限:区间下限:区间上限:区间上限:例例 题题 二:二:返回第59页,共150页,编辑于2022年,星期二返回例三、对某型号的电子元件进行耐用性能检查,抽查的资料例三、对某型号的电子元件进行耐用性能检查,抽查的资料分组列表如下,要求耐用时数的允许误差范围分组列表如下,要求耐用时数的允许误差范围 小时,试小时,试估计该批电子元件