《第八章抽样推断-第章抽样推断.pptx》由会员分享,可在线阅读,更多相关《第八章抽样推断-第章抽样推断.pptx(75页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第 章章 抽样推断抽样推断1 学习目的与要求:学习目的与要求: 抽样推断是统计研究中的一种重要分析方法。抽样推断是统计研究中的一种重要分析方法。学习本章要求掌握能利用统计资料来推断总体学习本章要求掌握能利用统计资料来推断总体数量特征的原理及方法,其具体要求数量特征的原理及方法,其具体要求:理解抽样推断的概念及特点理解抽样推断的概念及特点深刻理解抽样误差产生的原因深刻理解抽样误差产生的原因对抽样误差、抽样平均误差、抽样极限误差加以区对抽样误差、抽样平均误差、抽样极限误差加以区别别重点掌握简单随机抽样组织形式的区间估计方法重点掌握简单随机抽样组织形式的区间估计方法掌握必要样本单位数的确定方法掌握
2、必要样本单位数的确定方法2第八章第八章 抽样推断抽样推断 第一节第一节 抽样推断的一般问题抽样推断的一般问题第二节第二节 抽样误差抽样误差第三节第三节 抽样估计的方法抽样估计的方法第四节第四节 抽样的组织方式抽样的组织方式第五节第五节 必要抽样单位数的确定必要抽样单位数的确定 3第一节第一节 抽样推断的一般问题抽样推断的一般问题一、抽样推断的意义一、抽样推断的意义抽样推断是按照随机原则,从全部研究抽样推断是按照随机原则,从全部研究总体中抽取一部分单位进行调查,并依总体中抽取一部分单位进行调查,并依据所获得的数据对总体的某一数量特征据所获得的数据对总体的某一数量特征做出具有一定可靠程度的估计与推
3、断的做出具有一定可靠程度的估计与推断的一种统计方法。抽样推断的全过程,就一种统计方法。抽样推断的全过程,就是抽样调查。是抽样调查。 4抽样推断基本特点抽样推断基本特点 按照随机原则按照随机原则抽取样本单位抽取样本单位 抽样调查的目的抽样调查的目的在于推断总体在于推断总体 抽样误差可以事先抽样误差可以事先计算并加以控制计算并加以控制 5二、抽样调查的作用二、抽样调查的作用(一)应用抽样法可对某些不可能或不容易进行全(一)应用抽样法可对某些不可能或不容易进行全面调查而又要了解其全面情况的社会经济现象进面调查而又要了解其全面情况的社会经济现象进行数量方面的统计分析。行数量方面的统计分析。 对无限总体
4、不可能进行全面调查。对无限总体不可能进行全面调查。 有些现象总体范围过大,单位分布又过于分散,很难有些现象总体范围过大,单位分布又过于分散,很难或不必要进行全面调查。或不必要进行全面调查。 对于产品或商品具有破坏性的质量检验也不能进行全对于产品或商品具有破坏性的质量检验也不能进行全面调查。面调查。 对那些资料要求紧迫,需以较短时间,迅速了解总体对那些资料要求紧迫,需以较短时间,迅速了解总体全面情况时,也可用抽样法。全面情况时,也可用抽样法。 6(二)应用抽样法可对全面调查的结果加以补充或(二)应用抽样法可对全面调查的结果加以补充或订正订正 许多社会经济现象虽然可以全面调查,但同时开展抽许多社会
5、经济现象虽然可以全面调查,但同时开展抽样调查,把两者结合起来应用也具有重要的意义。样调查,把两者结合起来应用也具有重要的意义。全面调查不论是一次性普查,还是经常性统计报表制全面调查不论是一次性普查,还是经常性统计报表制度,由于范围广、工作量大,参加人员多,就较多地度,由于范围广、工作量大,参加人员多,就较多地存在发生登记性和计算性误差的可能。在全面调查后,存在发生登记性和计算性误差的可能。在全面调查后,随即抽取一部分单位重新再调查一次,将这些单位两随即抽取一部分单位重新再调查一次,将这些单位两次调查的资料进行对照、比较,计算其差错比率,并次调查的资料进行对照、比较,计算其差错比率,并以此为依据
6、对全面调查的资料加以修正,这样就可以以此为依据对全面调查的资料加以修正,这样就可以进一步提高全面调查资料的准确性。进一步提高全面调查资料的准确性。另外,由于抽样调查范围小,可以根据需要增加一些另外,由于抽样调查范围小,可以根据需要增加一些调查项目,以便进行某项更深入的研究,以补充全面调查项目,以便进行某项更深入的研究,以补充全面调查的不足。调查的不足。 7(三)应用抽样法可对生产过程中产品质量进行检(三)应用抽样法可对生产过程中产品质量进行检查和控制查和控制抽样调查不但广泛用于生产结果的核算和估计,而且抽样调查不但广泛用于生产结果的核算和估计,而且也有效地应用于对成批或大量连续生产的工业产品在
7、也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制,观察生产工艺过程是否正生产过程中进行质量控制,观察生产工艺过程是否正常,是否存在某些系统性的偏误,及时提供有关信息,常,是否存在某些系统性的偏误,及时提供有关信息,分析可能的原因,便于采取措施,防止损失。分析可能的原因,便于采取措施,防止损失。(四)应用抽样法可对总体的某种假设进行检验,(四)应用抽样法可对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍来判断这种假设的真伪,决定行动的取舍8抽样推断的几个基本概念抽样推断的几个基本概念 全及总体和样本总体全及总体和样本总体 全及总体全及总体:抽样调查所要认识对象的
8、全体,也叫母体,简称:抽样调查所要认识对象的全体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体。总体,它是具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用全及总体的单位数通常用N来表示,来表示,N总是很大的数。总是很大的数。样本总体样本总体:又叫子样或抽样总体,简称样本。它是从全及总:又叫子样或抽样总体,简称样本。它是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用样本总体的单位数称为样本容量,通常用n表示,相对表示,相对N来说,来说,n是很小的数,它可以是是
9、很小的数,它可以是N的几十分之一、几百分之一、几千的几十分之一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过分之一、几万分之一。(一般来说,样本单位数达到或超过30个称为大样本,而在个称为大样本,而在30个以下称为小样本。社会经济现象个以下称为小样本。社会经济现象的抽样调查多取大样本的抽样调查多取大样本 ) 9全及指标和抽样指标全及指标和抽样指标 全及指标全及指标:根据全及总体各个单位的标志值或标:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种数量特征的综合指志特征计算的,反映总体某种数量特征的综合指标称为全及指标。也叫总体指标或母体参数。由标称为全及指标。
10、也叫总体指标或母体参数。由于全及总体是唯一确定的,所以根据全及总体计于全及总体是唯一确定的,所以根据全及总体计算的全及指标也是唯一确定的。算的全及指标也是唯一确定的。抽样指标抽样指标:由样本总体各单位标志值或标志特征:由样本总体各单位标志值或标志特征计算的,反映样本数量特征的综合指标,它是用计算的,反映样本数量特征的综合指标,它是用来估计全及指标的。来估计全及指标的。 10全及指标和样本指标的相关公式全及指标和样本指标的相关公式 FXFXNXXFFXXNXX22)()(FFXXNXX2222)()(fxfxnxxffxxsnxxs22)()(ffxxsnxxs2222)()(变量总体变量总体总
11、体平均数总体标准差 总体方差全及指标 样本指标 11全及指标和样本指标的相关公式全及指标和样本指标的相关公式属性总体属性总体总体成数总体成数标准差 总体成数方差全及指标 样本指标 PXNNP1)1 (PPP)1 (2PPPpxnnp1)1 (ppsp)1 (2ppsp12四、抽样方法四、抽样方法重复抽样重复抽样也称重置抽样、回置抽样。它是指从总体也称重置抽样、回置抽样。它是指从总体N个单位中随机抽取个单位中随机抽取容量为容量为n的样本时,每次从总体中抽取一个单位,把结果登记的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。下来后,重新返回,再从全
12、及总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。例如例如不重复抽样不重复抽样也称不重置抽样、不回置抽样。它是指从总体也称不重置抽样、不回置抽样。它是指从总体N个单位中随机个单位中随机抽取容量为抽取容量为n的样本时,每次从总体中抽取一个单位,不再放的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本,就是说,每个总体单位只能被抽取一次,复构成一个样本,就是说,每个总体单位只能被抽取一次,所以从总体中每抽
13、取一次,总体就少一个单位,因此,先后所以从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。抽出来的各个单位被抽中机会是不相等的。例如例如13重复抽样重复抽样总体有总体有A、B、C、D四个单位,要从中随四个单位,要从中随机抽取两个单位构成样本。可先从机抽取两个单位构成样本。可先从4个单个单位中取一个,结果登记后放回,然后再从位中取一个,结果登记后放回,然后再从相同的相同的4个中取一个,就构成一个样本。个中取一个,就构成一个样本。全部可能抽取的样本数目为全部可能抽取的样本数目为44=16个。个。它们是:它们是:AA,AB,AC,AD,BA,BB,BC,BD,CA
14、,CB,CC,CD,DA,DB,DC,DD。一般地说,从总体一般地说,从总体N个单位中,随机抽取个单位中,随机抽取n个单位构成样本,则样本可能数目为个单位构成样本,则样本可能数目为 个。个。nN14不重复抽样不重复抽样前例中,用不重复抽样的方法从中抽两个单位构前例中,用不重复抽样的方法从中抽两个单位构成样本,则全部可能抽取得样本共有成样本,则全部可能抽取得样本共有43=12个,个,它们是:它们是: AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。一般地讲,从总体一般地讲,从总体N个单位中,随机不重复抽取个单位中,随机不重复抽取n个单位构成一样本,则样本可能数目为个单位构
15、成一样本,则样本可能数目为N(N1)(N2)(Nn+1) 个。个。由上可知,在相同的样本容量的要求下,不重复由上可知,在相同的样本容量的要求下,不重复抽样的样本可能数目比重复抽样为少。在实际工抽样的样本可能数目比重复抽样为少。在实际工作中,一般多采用不重复抽样,但有些调查如公作中,一般多采用不重复抽样,但有些调查如公交车辆乘客情况的调查,商场顾客流量情况的调交车辆乘客情况的调查,商场顾客流量情况的调查只宜用重复抽样。查只宜用重复抽样。15第二节第二节 抽样误差抽样误差一、抽样误差的概念和影响抽样误差的一、抽样误差的概念和影响抽样误差的主要因素主要因素(一)抽样误差的概念(一)抽样误差的概念抽样
16、误差是指样本指标与总体指标之间抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均数与的离差。具体地讲,就是样本平均数与总体平均数的离差(即总体平均数的离差(即 ),或样),或样本成数与总体成数的离差(即本成数与总体成数的离差(即 )。)。Xx Pp 16在抽样中误差的来源有许多方面。在抽样中误差的来源有许多方面。其中一类是登记性误差,即在调查过程中其中一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所由于观察、测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都引起的误差,这类误差是所有统计调查都可能发生的。可能发生的。另一类是代表性误差,即样本各单位
17、的结另一类是代表性误差,即样本各单位的结构不足以代表总体而引起的误差。构不足以代表总体而引起的误差。 17代表性误差的发生有以下两种情况:代表性误差的发生有以下两种情况:一种是由于违反抽样调查的随机原则,如有意地一种是由于违反抽样调查的随机原则,如有意地多选较好的单位或较坏的单位进行调查。这样做,多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,所据以计算的抽样指标必然出现偏高或偏低现象,造成系统性的误差。系统性误差和登记性误差都造成系统性的误差。系统性误差和登记性误差都是不应当发生的,是可以也应该采取措施避免发是不应当发生的,是可以也应该采取措施避免发生
18、或将其减小到最小限度。生或将其减小到最小限度。另一种情况是,即使遵守随机原则,由于被抽选另一种情况是,即使遵守随机原则,由于被抽选的样本有各种各样,只要被抽中的样本其内部各的样本有各种各样,只要被抽中的样本其内部各单位被研究标志的构成比例和总体有所出入,就单位被研究标志的构成比例和总体有所出入,就会出现或大或小的偶然性代表性误差。会出现或大或小的偶然性代表性误差。 18我们所讲的抽样误差就是指这种偶然性代表性误差。我们所讲的抽样误差就是指这种偶然性代表性误差。即按随机原则抽样时,在没有登记性误差和系统性即按随机原则抽样时,在没有登记性误差和系统性误差的条件下单纯由于不同的随机样本得出不同估误差
19、的条件下单纯由于不同的随机样本得出不同估计量而产生的误差。抽样误差是抽样调查所固有的,计量而产生的误差。抽样误差是抽样调查所固有的,是无法避免与消除的,但可以运用数学方法计算其是无法避免与消除的,但可以运用数学方法计算其数量界限,并通过抽样设计程序控制其范围,所以数量界限,并通过抽样设计程序控制其范围,所以这种抽样误差也称为可控制误差。这种抽样误差也称为可控制误差。需要指出,抽样误差不是固定不变的数,它的数值需要指出,抽样误差不是固定不变的数,它的数值是随样本不同而变化的,所以它也是随机变量。是随样本不同而变化的,所以它也是随机变量。19(二)影响抽样误差大小的因素(二)影响抽样误差大小的因素
20、1、样本单位数的多少、样本单位数的多少2、总体被研究标志的变异程度、总体被研究标志的变异程度3、抽样方法、抽样方法4、抽样调查的组织形式、抽样调查的组织形式20二、抽样平均误差二、抽样平均误差(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差计算平均数的抽样平均误差的理论公式为:计算平均数的抽样平均误差的理论公式为: 表示抽样平均误差表示抽样平均误差 该公式表明了抽样平均误差的意义。但是当总体单该公式表明了抽样平均误差的意义。但是当总体单位数较大,而抽取的样本单位数也较大时,样本位数较大,而抽取的样本单位数也较大时,样本可能数目就非常大。即使求出样本可能数目,上可能数目就非常大。即使
21、求出样本可能数目,上述公式仍然不适用,这是因为,在该公式中出现述公式仍然不适用,这是因为,在该公式中出现了总体平均数。这也正是抽样调查所要推算出的了总体平均数。这也正是抽样调查所要推算出的数值,实践中是不知道的。数值,实践中是不知道的。 样本可能数目2)(Xxxx21 抽样调查实践中用来计算抽样平均误差的基抽样调查实践中用来计算抽样平均误差的基本公式是根据定义公式推导出来的。数理统本公式是根据定义公式推导出来的。数理统计证明,在重复抽样条件下,抽样平均误差计证明,在重复抽样条件下,抽样平均误差与总体标准差成正比,与样本单位数的算术与总体标准差成正比,与样本单位数的算术平方根成反比。即:平方根成
22、反比。即:nnxx2或22 现以现以4个工人的日产量为例来验证两个公式个工人的日产量为例来验证两个公式的计算结果是相同的。的计算结果是相同的。例例1 设设4个工人的日产量分别为个工人的日产量分别为40、42、46、48件。则平均日产量与平均日产量的标准差件。则平均日产量与平均日产量的标准差如表如表81,则:,则:23序号 样本变量( ) 样本平均数( ) 离差( ) 离差平方12345678910111213141516 40 4040 4240 4640 4842 4041 4242 4642 4846 4046 4046 4246 4848 4048 4248 4648 484041434
23、4414244454344464745454748 4310320110230134 169109401104901916 合计 704 80 xxXx 2)(Xx 24如果从总体中随机抽出如果从总体中随机抽出2个单位进行调查,则抽样平均误差:个单位进行调查,则抽样平均误差:抽样平均误差:抽样平均误差: 件)(44448464240NXX件)(1623. 34)4448()4446()4442()4440()(22222NXXx(件)2361. 221623. 3nx(件)样本可能数目2361. 21680)2Xxx25 不重复抽样条件下计算公式为:不重复抽样条件下计算公式为: 通过比较不重复
24、抽样条件下和重复抽样条件下的公式可以通过比较不重复抽样条件下和重复抽样条件下的公式可以看出,根号下相差看出,根号下相差 我们把这个式子叫做修正因子。不难看出当我们把这个式子叫做修正因子。不难看出当N较大时,较大时, 与与 的计算结果是十分接近。因此,当的计算结果是十分接近。因此,当N较大时在不较大时在不重复抽样条件计算抽样平均误差的公式可采用时重复抽样条件计算抽样平均误差的公式可采用时 )1(2NnNnx)1(NnN)1(NnN)1 (Nn)1 (2Nnnx26例例2 从某厂生产从某厂生产的的10000只日光灯管中随机抽取只日光灯管中随机抽取100只进行检只进行检查,假如该产品平均使用寿命的标
25、准差为查,假如该产品平均使用寿命的标准差为100小时,试计算小时,试计算该厂日光灯管平均使用寿命的平均误差该厂日光灯管平均使用寿命的平均误差。解:在重复抽样条件下解:在重复抽样条件下 在不重复抽样条件下在不重复抽样条件下 (小时)10100100nx9 .99)100000101 (100100)1 (22Nnnx27抽样成数的抽样平均误差抽样成数的抽样平均误差如用如用 表示抽样成数的抽样平均误差表示抽样成数的抽样平均误差,其公式为:其公式为:在重复抽样条件下在重复抽样条件下在不重复抽样条件下在不重复抽样条件下 以上所有的公式中,不论是抽样平均数的抽样平均误以上所有的公式中,不论是抽样平均数的
26、抽样平均误差,还是抽样成数的抽样平均误差,所用的标准差都差,还是抽样成数的抽样平均误差,所用的标准差都是全及总体的标准差。但实际上,无论是在抽样之前,是全及总体的标准差。但实际上,无论是在抽样之前,还是在抽样之后,全及总体的标准差都是未知的。所还是在抽样之后,全及总体的标准差都是未知的。所以,一般都用样本总体的相应指标来代替。以,一般都用样本总体的相应指标来代替。pnppp)1 ( )1 ()1 (Nnnppp28例例3 从某厂生产的从某厂生产的10000件产品中,随机抽取件产品中,随机抽取1000件进行调查,测得有件进行调查,测得有85件为不合格。试求产品合格件为不合格。试求产品合格率的抽样
27、平均误差。率的抽样平均误差。解:根据条件可知,合格率解:根据条件可知,合格率P=91.5% 1.在重复抽样条件下在重复抽样条件下 = = 0.88% 2. 在不重复抽样条件下在不重复抽样条件下 =nppp)1 ( 1000)915. 01 (915. 0)1 ()1 (Nnnppp%877. 099. 01000085. 0915. 029三、抽样极限误差三、抽样极限误差(一)抽样极限误差的概念(一)抽样极限误差的概念抽样极限误差是指样本指标和总体指标之抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。由于总体指标是间抽样误差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕着
28、总一个确定的数,而样本指标则是围绕着总体指标左右变动的量,它与总体指标可能体指标左右变动的量,它与总体指标可能产生正离差,也可能产生负离差,样本指产生正离差,也可能产生负离差,样本指标变动的上限或下限与总体指标之差的绝标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。能范围称为抽样极限误差。30抽样极限误差的计算公式抽样极限误差的计算公式 基于概率估计的要求,抽样极限误差通常需要以基于概率估计的要求,抽样极限误差通常需要以抽样平均误差或为标准
29、单位来衡量。把极限误差抽样平均误差或为标准单位来衡量。把极限误差或分别除以或,得相对数或分别除以或,得相对数t,它表示误差范围为抽它表示误差范围为抽样平均误差的若干倍,样平均误差的若干倍,t是测量估计可靠程度的一是测量估计可靠程度的一个参数,称为抽样平均误差的概率度。个参数,称为抽样平均误差的概率度。 xxxxxtXxt或ppppptPpt或31抽样估计的概率度是表明抽样指标和总体指标的误抽样估计的概率度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。由于抽样指标差不超过一定范围的概率保证程度。由于抽样指标值随着样本的变动而变动,它本身是一个随机变量,值随着样本的变动而变动,它本身
30、是一个随机变量,因而抽样指标和总体指标的误差仍然是一个随机变因而抽样指标和总体指标的误差仍然是一个随机变量,并不能保证误差不超过一定范围这个事件是必量,并不能保证误差不超过一定范围这个事件是必然事件,而只能给以一定程度的概率保证。因此,然事件,而只能给以一定程度的概率保证。因此,就有必要来计算抽样指标和总体指标的误差不超过就有必要来计算抽样指标和总体指标的误差不超过一定范围的概率大小,即计算抽样指标落在一定区一定范围的概率大小,即计算抽样指标落在一定区间范围内的概率,这种概率称之为抽样估计的概率间范围内的概率,这种概率称之为抽样估计的概率度。度。 32根据计算极限误差的基本公式根据计算极限误差
31、的基本公式 概率度概率度t的大小根据对推断结果要求的把握程度来确定,即的大小根据对推断结果要求的把握程度来确定,即根据概率保证程度的大小来确定。概率论和数理统根据概率保证程度的大小来确定。概率论和数理统计证明,概率度计证明,概率度t与概率保证程度与概率保证程度F(t)之间存在着之间存在着一定的函数关系,给定不同的一定的函数关系,给定不同的t值,就可以计算出值,就可以计算出F(t)来,相反,给出一定的概率保证程度来,相反,给出一定的概率保证程度F(t),),则可以根据总体的分布,获得对应的则可以根据总体的分布,获得对应的t值。在实际应值。在实际应用中,因为我们所研究的总体大部分为正态总体,用中,
32、因为我们所研究的总体大部分为正态总体,对于正态总体而言,为了应用的方便编有对于正态总体而言,为了应用的方便编有“正态分正态分布概率表布概率表”供使用时查值。根据供使用时查值。根据“正态分布概率正态分布概率表表”,已知概率度,已知概率度t可查得相应的概率保证程度可查得相应的概率保证程度F(t););相反,已知概率保证程度相反,已知概率保证程度F(t)也可查得相也可查得相应的概率度应的概率度t。现将几个常用的对应数值列于下表。现将几个常用的对应数值列于下表。t33常用概率度与概率保证度表常用概率度与概率保证度表 概率度t 概率F(t) (%) 1.002.003.001.641.962.58 68
33、.2795.4599.7390.0095.0099.00 34从抽样极限误差的计算公式看,极限误差从抽样极限误差的计算公式看,极限误差 与概与概率度率度t和抽样平均误差和抽样平均误差 三者之间存在如下关系:三者之间存在如下关系:1、在保持不变的情况下,增大、在保持不变的情况下,增大t值,把握程度相值,把握程度相应增加,误差范围应增加,误差范围 也随之扩大,这时估计的也随之扩大,这时估计的精确度精确度 将降低;反之,要提高估计的精确度,将降低;反之,要提高估计的精确度,就得缩就得缩t值,此时把握程度也会相应降低。值,此时把握程度也会相应降低。2、在、在t保持不变的情况下,抽样平均误差保持不变的情
34、况下,抽样平均误差 小,小,则误差范围就小,估计的精确度则误差范围就小,估计的精确度 就高;反之,就高;反之,抽样平均误差抽样平均误差 大,误差范围就大,估计的精确大,误差范围就大,估计的精确度度 就低。就低。35第三节第三节 抽样估计的方法抽样估计的方法 抽样估计是用抽样资料来估计相应的全及总体指标抽样估计是用抽样资料来估计相应的全及总体指标的数值,而全及指标是表明总体数量特征的参数,的数值,而全及指标是表明总体数量特征的参数,所以这种估计也可以称为参数估计。总体参数的估所以这种估计也可以称为参数估计。总体参数的估计有点估计和区间估计两种方法。计有点估计和区间估计两种方法。点估计和区间估计点
35、估计和区间估计 点估计是以抽样指标数值直接作为总体指标估计点估计是以抽样指标数值直接作为总体指标估计值的一种估计方法值的一种估计方法 。点估计的方法优点是简便易。点估计的方法优点是简便易行,原理直观,常为实际工作采用。但不足之处行,原理直观,常为实际工作采用。但不足之处是没有表明抽样估计的误差,更没有表明误差在是没有表明抽样估计的误差,更没有表明误差在一定范围内的概率保证程度有多大。要了解这个一定范围内的概率保证程度有多大。要了解这个问题,就必须采用区间估计方法。问题,就必须采用区间估计方法。 36区间估计区间估计 区间估计的概念区间估计的概念区间估计区别于点估计有三点:区间估计区别于点估计有
36、三点:区间估计不像点估计那样用一个数值对总体指区间估计不像点估计那样用一个数值对总体指标进行估计,而是用一个范围对总体指标进行标进行估计,而是用一个范围对总体指标进行估计;估计;点估计是一个确切的估计值,而区间估计的是点估计是一个确切的估计值,而区间估计的是区间,根据概率度的要求可宽可窄;区间,根据概率度的要求可宽可窄;点估计无法回答估计值的把握程度,而区间估点估计无法回答估计值的把握程度,而区间估计可以回答估计区间的把握程度。计可以回答估计区间的把握程度。 37区间估计的模式区间估计的模式 1、根据已给定的抽样误差范围,求概率保证程、根据已给定的抽样误差范围,求概率保证程度。具体步骤是:度。
37、具体步骤是:第一步,抽取样本,计算抽样指标,即计算样本平均第一步,抽取样本,计算抽样指标,即计算样本平均数和抽样成数数和抽样成数p,作为总体指标的估计值,并计算样作为总体指标的估计值,并计算样本标准差本标准差s以推算抽样年均差。以推算抽样年均差。第二步,根据给定的抽样极限误差范围,估计总体指第二步,根据给定的抽样极限误差范围,估计总体指标的上限和下限。标的上限和下限。第三步,将抽样极限误差除以抽样平均误差,求出概第三步,将抽样极限误差除以抽样平均误差,求出概率度率度t,再根据再根据t值查值查正态分布概率表正态分布概率表求出相应的求出相应的概率保证程度。概率保证程度。 38例例4 对一批某型号的
38、电子元件进行耐用对一批某型号的电子元件进行耐用性能检查,按重复随机抽样的资料分组列性能检查,按重复随机抽样的资料分组列表如下,要求估计耐用时数的允许误差范表如下,要求估计耐用时数的允许误差范围围=10.5小时,是估计该批电子元件的平小时,是估计该批电子元件的平均耐用时数(见表均耐用时数(见表83)。)。39表表83耐用时数 组中值 抽样检查结果(只) 900以下9009509501000100010501050110011001150115012001200以上 87592597510251075112511751225 1263543931合计 10040第一步,计算,第一步,计算, s,
39、:第二步,根据给定的第二步,根据给定的 =10.5小时,计算总体平均数的上下小时,计算总体平均数的上下限:限:下限下限= =1055.510.5=1045(小时)(小时)上限上限= =1055.5+10.5=1066(小时)(小时)xx5 .1055100105550fxfx91.51)(2ffxxs191. 510091.51nxxxxxx41第三步,根据第三步,根据 ,查正态分布概,查正态分布概率表得概率率表得概率F(t)=95.66%。推断的结论是:以推断的结论是:以95.66%的概率保证程度,的概率保证程度,估计该批电子元件的耐用时数在估计该批电子元件的耐用时数在10451066小时之
40、间。小时之间。02. 2191. 55 .10 xxt42例例5 仍用上例资料,设该厂的产品质量检验仍用上例资料,设该厂的产品质量检验标准规定,元件耐用时数达标准规定,元件耐用时数达1000小时以上为小时以上为合格品,要求合格率估计的误差范围不超过合格品,要求合格率估计的误差范围不超过4%,试估计该批电子元件的合格率。,试估计该批电子元件的合格率。第一步,计算第一步,计算p, , :2psp%86. 21000819. 0)1 (0819. 009. 091. 0)1 (%91100912nppppsppp43第二步,根据该给定的第二步,根据该给定的 =4%,求总体合格率,求总体合格率的上下限
41、:的上下限:下限下限 = = 91%4% = 87%上限上限 = = 91% + 4% = 95%第三步,根据第三步,根据 , 查正态分布概率查正态分布概率表得概率表得概率F(t)= 83.85%。通过计算得出如下估计:即可以通过计算得出如下估计:即可以83.85%的概率的概率保证程度,估计该批电子元件的合格率在保证程度,估计该批电子元件的合格率在87%95%之间。之间。ppppp4 . 1%86. 2%4ppt442、根据已给定的置信度,求抽样极限误差。具、根据已给定的置信度,求抽样极限误差。具体步骤是:体步骤是:第一步,抽取样本,计算抽样指标第一步,抽取样本,计算抽样指标 ,即计算,即计算
42、样本平均数和抽样成数样本平均数和抽样成数p,作为总体指标的估计作为总体指标的估计值,并计算样本标准差值,并计算样本标准差s以推算抽样平均误差。以推算抽样平均误差。第二步,根据给定的置信度第二步,根据给定的置信度F(t)的要求,查正的要求,查正态分布概率表求得概率度态分布概率表求得概率度t值。值。第三步,根据概率度第三步,根据概率度t和抽样平均误差和抽样平均误差 推算抽推算抽样极限误差样极限误差 ,并根据抽样极限误差求出被估,并根据抽样极限误差求出被估计总体指标的上下限。计总体指标的上下限。x45例例6 对我国某城市进行居民家庭人均旅游消对我国某城市进行居民家庭人均旅游消费支出调查,随机抽取费支
43、出调查,随机抽取400户居民家庭,调户居民家庭,调查得知居民家庭人均年旅游消费支出为查得知居民家庭人均年旅游消费支出为350元,标准差为元,标准差为100元,要求以元,要求以95%的概率保的概率保证程度,估计该市人均年旅游消费支出额。证程度,估计该市人均年旅游消费支出额。第一步,根据抽样资料已算得:第一步,根据抽样资料已算得:样本每户年人均消费支出样本每户年人均消费支出 =350(元)(元)样本标准差样本标准差 = 100(元)(元) (元)(元)x5400100nx46第二步,根据给定的概率保证程度第二步,根据给定的概率保证程度F(t)=95%,查得正态分布概率表得查得正态分布概率表得t =
44、 1.96。第三步,计算第三步,计算 (元)则该(元)则该市居民家庭年人均旅游消费支出额:市居民家庭年人均旅游消费支出额:下限下限 = = 3509.80 = 340.20(元)(元)上限上限= = 350+9.80 = 359.80(元)(元)结论:我们可以结论:我们可以95%得概率保证程度,估计该市得概率保证程度,估计该市居民家庭年人均旅游消费支出额在居民家庭年人均旅游消费支出额在340.20元元359.80元之间。元之间。80. 9596. 1xxtxxxx47例例7 某市电视台为了解观众对某电视栏目的某市电视台为了解观众对某电视栏目的喜爱程度,在该市随机对喜爱程度,在该市随机对900名
45、居民进行调名居民进行调查,结果有查,结果有540名喜欢该电视栏目,要求以名喜欢该电视栏目,要求以90%的概率保证程度,估计该市居民喜欢该的概率保证程度,估计该市居民喜欢该电视栏目的比率。电视栏目的比率。第一步,根据抽样资料计算:第一步,根据抽样资料计算:样本喜欢程度比率样本喜欢程度比率%609005401nnp%63. 190024. 0)1 (24. 04 . 06 . 0)1 (2npppppp抽样平均误差样本方差48第二步,根据给定的置信度第二步,根据给定的置信度F(t)= 90% ,查正查正态分布概率表得概率度态分布概率表得概率度t = 1.64。第三步,计算第三步,计算 ,则总体比,
46、则总体比率的上下限为:率的上下限为:下限下限 = = 60% 2.67% = 57.33%上限上限 = = 60% + 2.67% = 62.67%结论:我们可以概率结论:我们可以概率90%的保证程度,估计该市的保证程度,估计该市居民对此电视栏目喜爱的比率在居民对此电视栏目喜爱的比率在57.33%62.67%之间。之间。 %67. 2%63. 164. 1pptpppp49第四节第四节 抽样的组织方式抽样的组织方式抽样调查有四种基本的组织方式,即简单随抽样调查有四种基本的组织方式,即简单随机抽样、等距抽样、分类抽样、整群抽样。机抽样、等距抽样、分类抽样、整群抽样。在具体的抽样调查中,可根据调查
47、对象的特在具体的抽样调查中,可根据调查对象的特点,单独使用其中一种方式,也可以多种方点,单独使用其中一种方式,也可以多种方式结合使用。式结合使用。 一、简单随机抽样一、简单随机抽样 简单随机抽样也叫纯随机抽样。它是指在进简单随机抽样也叫纯随机抽样。它是指在进行抽样时,对全及总体不经过任何形式的整行抽样时,对全及总体不经过任何形式的整理和加工,完全凭借偶然的机会从总体中抽理和加工,完全凭借偶然的机会从总体中抽取样本单位的抽样方式。取样本单位的抽样方式。50简单随机抽样简单随机抽样 直接抽选法直接抽选法 抽签法抽签法 查随机数表法查随机数表法直接抽选法是指直接从调查对象中随机抽选。例如,直接抽选法
48、是指直接从调查对象中随机抽选。例如,从仓库中存放的所有同类产品中随机指定若干件产从仓库中存放的所有同类产品中随机指定若干件产品进行质量检验;从粮食仓库中不同的地点取出若品进行质量检验;从粮食仓库中不同的地点取出若干粮食样本进行含杂量、含水量的检验等。干粮食样本进行含杂量、含水量的检验等。抽签法即先将全及总体各个单位按照某种自然的顺抽签法即先将全及总体各个单位按照某种自然的顺序编上号,并做成号签,再把号签掺合起来,任意序编上号,并做成号签,再把号签掺合起来,任意抽取所需单位数,然后按照抽中的号码取得对应的抽取所需单位数,然后按照抽中的号码取得对应的调查单位加以登记调查。调查单位加以登记调查。 5
49、1随机数表是指含有一系列组别的随机数字的表格。随机数表是指含有一系列组别的随机数字的表格。这种表格的编制,即可以借助电子计算机产生,也这种表格的编制,即可以借助电子计算机产生,也可以采用数码机产生或自己编制。表中数字的出现可以采用数码机产生或自己编制。表中数字的出现及其排列是随机形成的。及其排列是随机形成的。利用随机数表进行抽样的具体步骤是:利用随机数表进行抽样的具体步骤是: 先取得一份调查总体所有元素的名单(即抽样框);先取得一份调查总体所有元素的名单(即抽样框); 将总体中所有元素一一按顺序编号;将总体中所有元素一一按顺序编号; 根据总体规模是几位数来确定从随机数表中选几位数码;根据总体规
50、模是几位数来确定从随机数表中选几位数码;以总体的规模为标准,对随机数表中的数码逐一进行衡量以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;并决定取舍;根据样本规模的要求选择出足够的数码个数;根据样本规模的要求选择出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找出它所对依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。应的元素。 52下表就是对下表就是对3000人的总人的总体进行抽样体进行抽样时,我们采时,我们采用后四位数用后四位数码进行取舍码进行取舍的例子,见的例子,见表表84: 53二、类型抽样二、类型抽样类型抽样也叫分类抽样。它是运用统计分组法,类型抽样