《第6章抽样推断.pptx》由会员分享,可在线阅读,更多相关《第6章抽样推断.pptx(105页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 . . . . (6 6学时学时) ) . . . . . . 一、抽样法的概念和特点一、抽样法的概念和特点 (一)抽样法的概念(一)抽样法的概念 (二)抽样法的特点(二)抽样法的特点 (三)抽样法的作用(三)抽样法的作用 . . 综合综合指标指标总量指标总量指标相对指标相对指标平均指标平均指标变异指标变异指标反映总体反映总体数量特征数量特征 但但在实际工作中,在实际工作中, 许多场合下我们不可能采用许多场合下我们不可能采用全全面调查面调查方法,来计算反映总体数量特征的指标。而方法,来计算反映总体数量特征的指标。而只能采用只能采用抽样调查(即抽样推断)抽样调查(即抽样推断)的方法。的方法。例
2、如,例如,对某厂生产的对某厂生产的1000010000只灯泡进行只灯泡进行平均耐用平均耐用时数的检验,就时数的检验,就只能采用抽样推断的方法。只能采用抽样推断的方法。 又如,又如,我国我国2002005 5年粮食总产量年粮食总产量 45711 45711万吨万吨,城,城镇居民人均可支配收入镇居民人均可支配收入77037703元元等这些指标数值均等这些指标数值均属抽样推断的结果。属抽样推断的结果。. . (一)抽样法的概念(一)抽样法的概念(第(第8181页)页) 抽样法即抽样推断抽样法即抽样推断就是按照就是按照随机抽样的原则,从总随机抽样的原则,从总体中抽出一部分单位作为样本,并利用样本的实际
3、资体中抽出一部分单位作为样本,并利用样本的实际资料计算样本指标值,然后根据样本指标对总体的数量料计算样本指标值,然后根据样本指标对总体的数量特征(总体指标)做出具有一定可靠程度的估计和判特征(总体指标)做出具有一定可靠程度的估计和判断的一种统计分析断的一种统计分析方法。方法。(二)抽样推断的特点(二)抽样推断的特点 ( (1 1) )属于非全面调查,按照随机原则选取调查单位属于非全面调查,按照随机原则选取调查单位; ;( (2 2) )抽样调查的目的在于根据部分单位的实际抽样调查的目的在于根据部分单位的实际资料对总体的数量特征作出估计资料对总体的数量特征作出估计( (3 3) )抽样误差可以事
4、先计算并且加以控制抽样误差可以事先计算并且加以控制; ;(4)(4)它是运用概率估计的方法。它是运用概率估计的方法。(三)抽样调查的作用(三)抽样调查的作用 (1(1) )对于不可能或不必要进行全面调查的场合,对于不可能或不必要进行全面调查的场合,抽样调查具有其独特的作用。抽样调查具有其独特的作用。( (2 2) )抽样调查和全面调查相结合,可以验证和抽样调查和全面调查相结合,可以验证和补充修正全面调查的资料、数据。补充修正全面调查的资料、数据。( (3 3) )利用抽样方法进行生产过程的质量控制。利用抽样方法进行生产过程的质量控制。( (4 4) )抽样方法可以用来检验总体特征的某些假设抽样
5、方法可以用来检验总体特征的某些假设,判断假设的真伪,为行动决策提供依据。判断假设的真伪,为行动决策提供依据。. . . . 抽样推断过程抽样推断过程图例图例 : 样本样本n100随机原则随机原则kXxx2)(nns总体总体N10000推断推断(抽样误差)(抽样误差) nxxn21xxxx,:(总体指标)(总体指标)(样本指标)(样本指标)nxxs2)(NXX2)(标标准准差差:个个样本样本 kxxxx321(抽样实际误差)(抽样实际误差) 抽样平均误差抽样平均误差 (可以计算)(可以计算)抽样推断的结果具有一定抽样推断的结果具有一定的可靠程度(置信度的可靠程度(置信度)XXNx123knnnn
6、12:,NXXXXXxxX 111xX 222xX 333xX kkkxX . . 二、二、有关抽样法的几个基本概念有关抽样法的几个基本概念 (一)(一)总体和样本总体和样本 (二)(二)总体参数和统计量总体参数和统计量 (三)(三)样本容量和样本个数样本容量和样本个数 (四)抽样框和抽样单元(四)抽样框和抽样单元 (五)(五) 重复抽样与不重复抽样重复抽样与不重复抽样 . . (一)(一)总体和样本总体和样本 1. 1.总体(总体(全及总体):全及总体): 即统计所要认识对象的全体。即统计所要认识对象的全体。总体单位数通常般用总体单位数通常般用“N”表示。表示。 2. 2.样本(样本(样本总
7、体):样本总体): 即它是从总体中随机抽取出即它是从总体中随机抽取出来,用来代表总体的那部分单位的组成集合体。来,用来代表总体的那部分单位的组成集合体。样本单位数通常用样本单位数通常用“n”表示。表示。注意注意:总体与样本的不同性质:总体与样本的不同性质:总体总体变量总体变量总体属性总体属性总体 即从一个总体中可以抽即从一个总体中可以抽出许多个样本。出许多个样本。样本样本 不是唯不是唯一确一确定的。定的。总体总体是唯一是唯一确定的。确定的。. . (二)(二)总体参数和统计量总体参数和统计量 总体参数总体参数(总体指标)总体指标) 统计量(样本指标)统计量(样本指标)变变量量总总体体 变变量量
8、样样本本 属属性性总总体体 属属性性样样本本 性性质质性性质质FXFNXXFFXXNXX22)()(PNNXp1)(PPPp1Qn321xxxxx,:ffxxnxxs22)()(fxfnxx)1 (pppqps是唯一确定的是唯一确定的是随机变量,它会随着样是随机变量,它会随着样本的不同而有不同的取值本的不同而有不同的取值pnnxp1总体总体平平均均 数数总体总体标标准准 差差样本样本平平均均 数数样本样本标标准准 差差总体总体平平均均 数数总体总体标标准准 差差样本平样本平均均 数数总体总体成数成数样本标样本标准准 差差样本样本成数成数12:,NXXXX. . (三)(三)样本容量和样本容量和
9、样本个数样本个数 1.1.样本容量:样本容量: 即一个样本中所包含的单位数,一即一个样本中所包含的单位数,一般用般用n表示。表示。n3030为大样本,为大样本,n3030为小样本。为小样本。 2.2.样本个数:样本个数: 是指在一个总体中所有可能被抽取是指在一个总体中所有可能被抽取或可能构成的样本数目。或可能构成的样本数目。 例如:例如:假设总体有假设总体有A、 B、C、D、E五个单位,五个单位, 若按随机重复抽取方法,若按随机重复抽取方法, 从总体中随机抽取两个从总体中随机抽取两个 单位组成样本,则单位组成样本,则其其样样 本容量为本容量为;而所有可能的;而所有可能的样本个数为样本个数为25
10、25个。个。AA AB AC AD AE BA BB BC BD BECA CB CC CD CEDA DB DC DD DE EA EB EC ED EE 注意:注意:在实际统计中我们只是抽取一个样本,但进行抽在实际统计中我们只是抽取一个样本,但进行抽样推断必须要考虑全部的可能样本。样推断必须要考虑全部的可能样本。. . (四)抽样框和抽样单元(四)抽样框和抽样单元 1.1.抽样框:抽样框: 是调查对象的具体表现是调查对象的具体表现,它,它是一份包含所有抽样单元的名单是一份包含所有抽样单元的名单,给每个抽样单元编号后,就可以按照一定的随机化程序进给每个抽样单元编号后,就可以按照一定的随机化程
11、序进行抽样。行抽样。 2.2.抽样单元:抽样单元: 是构成抽样框的基本要素。它可以只包含一个总体单位,是构成抽样框的基本要素。它可以只包含一个总体单位,也可以包含若干个总体单位。也可以包含若干个总体单位。 编制抽样框是抽样设计的一个重要环节,它应该编制抽样框是抽样设计的一个重要环节,它应该包含抽样单包含抽样单元的名称和地理位置元的名称和地理位置等有关信息,以便调查人员能找到被等有关信息,以便调查人员能找到被抽中的单元。抽中的单元。 抽样单元与抽样框是元素与集合的关系抽样单元与抽样框是元素与集合的关系. . (五)重复抽样(五)重复抽样与不重复抽样与不重复抽样 即每次从具有即每次从具有N个单位的
12、总体中随机抽取一个单个单位的总体中随机抽取一个单位(登记其序号和相应的标志值)之后,又将它重位(登记其序号和相应的标志值)之后,又将它重新放回总体,参加下一次抽选。依次连续进行新放回总体,参加下一次抽选。依次连续进行n次次抽选,便构成一个容量为抽选,便构成一个容量为n的样本。的样本。 例例4-14-1:假设总体有假设总体有A、B、C、D、E五个单位,个单位,现纯随机重复抽取现纯随机重复抽取2 2个单位组成样本,求全部的可个单位组成样本,求全部的可能样本个数。能样本个数。第一次抽取:第一次抽取:(抽后放回)(抽后放回)1 15 5 第二次抽取:第二次抽取:1 15 5则则所有可能的所有可能的样本
13、个数样本个数为:为:个个样样本本2 25 55 55 51 11 1kAA AB AC AD AE BA BB BC BD BECA CB CC CD CEDA DB DC DD DE EA EB EC ED EE即:即:(N = 5= 5 n = 2= 2) 1.1.重复抽样重复抽样 个样本,个样本, 每个样本在各次抽每个样本在各次抽样中被抽取的概率都相同。样中被抽取的概率都相同。. . 重复抽样的特点:重复抽样的特点:(1 1)在)在n次抽样中,总体每个单位在各次抽样中被次抽样中,总体每个单位在各次抽样中被抽取的概率都相同;抽取的概率都相同;(2 2)共可组成)共可组成nNk 又例:又例:
14、假设总体有假设总体有A、B、C、D、E五个单个单位,现纯随机重复抽取位,现纯随机重复抽取3 3个单位组成样本,求个单位组成样本,求全部的可能样本个数。全部的可能样本个数。(N = = 5 5 n = 3= 3)第一次抽取:第一次抽取:则则所有可能的所有可能的样本个数样本个数为:为:个个样样本本1 12 25 55 55 55 51 11 11 1k1 15 5(抽后放回)(抽后放回)第二次抽取:第二次抽取:1 15 5(抽后放回)(抽后放回)第三次抽取:第三次抽取:1 15 5. . 2.2.不重复抽样不重复抽样 即每次从具有即每次从具有N个单位的总体中随机抽取一个单个单位的总体中随机抽取一个
15、单位,但在登记其序号和相应的标志值之后,就不再位,但在登记其序号和相应的标志值之后,就不再将它重新放回总体参加下一次的抽选。(从抽样分将它重新放回总体参加下一次的抽选。(从抽样分布角度来看,这种抽样分布实际上等同于一次从总布角度来看,这种抽样分布实际上等同于一次从总体中同时抽取体中同时抽取n个单位组成一个样本。个单位组成一个样本。 例例4-14-1:假设总体有假设总体有A、B、C、D、E五个单位,个单位,现纯随机不重复抽取现纯随机不重复抽取2 2个单位组成样本,求全部的个单位组成样本,求全部的可能样本个数。可能样本个数。(N = 5= 5 n = 2= 2)第一次抽取:第一次抽取: 第二次抽取
16、:第二次抽取:则则所有可能的所有可能的样本个数样本个数为:为:个个样样本本2 20 04 45 51 11 1k AB AC AD AE BA BC BD BECA CB CD CEDA DB DC DE EA EB EC ED 1 15 5(抽后不放回)(抽后不放回)1 11 1) )( (5 5- -第一次抽取:第一次抽取: 个样本,个样本, 每个样本在各次抽样中被抽取的概率都相同。每个样本在各次抽样中被抽取的概率都相同。. . 不重复抽样的特点:不重复抽样的特点:(1 1)在)在n次抽样中,总体每个单位在各次抽样中被次抽样中,总体每个单位在各次抽样中被抽取的概率不相同;抽取的概率不相同;
17、(2 2)可组成)可组成) 1() 2)(1(nNNNNk 又又假设总体有假设总体有A、B、C、D、E五个单位,现纯个单位,现纯随机不重复抽取随机不重复抽取3 3个单位组成样本,求全部的可能个单位组成样本,求全部的可能样本个数。样本个数。第二次抽取:第二次抽取:则则所有可能的所有可能的样本个数样本个数为:为:个个样样本本6 60 02 2) )- -5 51 1) )- -5 55 51 11 11 1(k(抽后不放回)(抽后不放回)1 15 51 11 1) )- -( (5 5(抽后不放回)(抽后不放回)第三次抽取:第三次抽取:1 12 2) )- -( (5 5. . 三、抽样法的内容三
18、、抽样法的内容 抽样推断(统计推断)所面临的问题是对总抽样推断(统计推断)所面临的问题是对总体的数量特征不了解或了解很少,而且需要利体的数量特征不了解或了解很少,而且需要利用有限的样本信息对它进行估计和判断,以达用有限的样本信息对它进行估计和判断,以达到对总体数量特征的认识。抽样推断在由样本到对总体数量特征的认识。抽样推断在由样本资料推断总体资料时,包括以下两个内容:资料推断总体资料时,包括以下两个内容:抽样推断抽样推断的内容的内容 1.1.总体参数的估计总体参数的估计 2.2.总体参数的假设检验总体参数的假设检验 . . 1.1.总体参数的估计总体参数的估计 当我们不知道总体的数量特征时,根
19、据样本当我们不知道总体的数量特征时,根据样本的资料对总体的数量特征进行估计的方法称为的资料对总体的数量特征进行估计的方法称为总体参数的估计。总体参数的估计。 当我们对总体的变化情况不了解时,可先对当我们对总体的变化情况不了解时,可先对总体的状况作出某种假设,然后再根据抽样推总体的状况作出某种假设,然后再根据抽样推断的原理,通过样本资料对所作假设进行检验,断的原理,通过样本资料对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取来判断这种假设的真伪,以决定我们行动的取舍,这种推断方法称为舍,这种推断方法称为总体参数的假设检验。总体参数的假设检验。2.2.总体参数的假设检验总体参数的假设检
20、验 . . (可以计算)(可以计算)(无法计算)(无法计算). . 一、抽样误差的概念一、抽样误差的概念 xxX 抽样误差抽样误差是指由于是指由于随机抽样的偶然因素使随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位样本各单位的结构不足以代表总体各单位的的结构,而引起样本指标与总体指标之间的绝结构,而引起样本指标与总体指标之间的绝对离差。对离差。如,如,抽样抽样误差误差 (一)(一)抽样实际误差抽样实际误差 . .(二)(二)抽样平均误差抽样平均误差 . . ppP . . 即即是指每次抽样所得的样本指是指每次抽样所得的样本指标与总体指标之间的离差,它随着样本的不同而标与总体指标之间的离
21、差,它随着样本的不同而不同,是一个随机变量。不同,是一个随机变量。 即是指即是指所有可能出现的样本指所有可能出现的样本指标与总体指标之间的平均离差,即所有标与总体指标之间的平均离差,即所有可能出现可能出现的样本指标与总体指标的标准差。对于一个特定的样本指标与总体指标的标准差。对于一个特定的总体来说,它的总体来说,它是固定的,而且是可以计算的。是固定的,而且是可以计算的。注意注意抽样误差与调查误差的区别。抽样误差与调查误差的区别。统计调查误统计调查误差的种类差的种类登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机误差随机误差(抽样误差)(抽样误差)(一)(一)抽样实际误差抽样实际
22、误差 :(二)(二)抽样平均误差抽样平均误差 :. . 二、抽样平均误差的计算二、抽样平均误差的计算 (一)(一)抽样平均误差的定义公式抽样平均误差的定义公式 (二)(二)抽样平均误差的计算方法抽样平均误差的计算方法 (三)(三)影响抽样(平均)误差的因素影响抽样(平均)误差的因素 kPpkXxPpp22)()(k =f :全部可能的样本个数全部可能的样本个数k = =f :全部可能的样本个数全部可能的样本个数ffXxkXxx22)()(. . (一)(一)抽样平均误差的定义公式抽样平均误差的定义公式 如前所述,如前所述,抽样平均误差抽样平均误差是反映抽样误差一般是反映抽样误差一般水平的指标水
23、平的指标,即所有可能出现的,即所有可能出现的样本指标样本指标与与总体总体指标指标的的标准差标准差。1.1.样本平均数的样本平均数的抽样平均误差抽样平均误差 2.2.样本成数的抽样本成数的抽样平均误差样平均误差 (二)(二)抽样平均误差的计算方法抽样平均误差的计算方法 1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差 2 2. .样本成数的抽样平均误差样本成数的抽样平均误差 . . . . 1.1.样本平均数的抽样平均误差样本平均数的抽样平均误差 (1 1)重复抽样重复抽样:nnx2总总体体标标准准差差:样样本本容容量量:n(2 2)不)不重复抽样重复抽样:1NnNnx2Nnn1总总体体
24、单单位位数数:N 注意:注意:在实际计算在实际计算抽样平均误差抽样平均误差时,当时,当总体标总体标准差准差未知未知时,可以用时,可以用样本标准差样本标准差s来代替。即:来代替。即:nxffxxnxxs22)()(ns. . 例例4-34-3:假设有五名工人,其每小时工资分别为:假设有五名工人,其每小时工资分别为:1212,1414,1616,1818, 20 20元,若按元,若按重复抽样重复抽样方法从工人方法从工人总体中随机抽取两个工人组成一个样本,用其样本总体中随机抽取两个工人组成一个样本,用其样本平均工资来估计总体平均工资。试计算样本平均工平均工资来估计总体平均工资。试计算样本平均工资的抽
25、样平均误差。(资的抽样平均误差。(N=5 n=2)这一总体的这一总体的平均数平均数和和标准差标准差分别为:分别为:1 16 65 58 80 0NXX8 85 54 40 0NXX2)(样本样本 12 14 16 18 201214161820 12 13 14 15 16 13 14 15 16 17 14 15 16 17 18 15 16 17 18 19 16 17 18 19 20 在重复抽样条件下,在重复抽样条件下,(N=5 n=2)所有可能的样所有可能的样本及样本平均工资如本及样本平均工资如表表5-15-1表表4-14-1 样本平均数分布样本平均数分布. . 表表4-24-2 样
26、本平均数分布样本平均数分布样本样本序号序号样本平均数样本平均数 样本个数样本个数样本平均数离差样本平均数离差 离差平方离差平方 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 201 12 23 34 45 54 43 32 21 1121226264242606080806868545438382020 -4 -4 -3 -3 -2 -2 -1 -1 0 0 1 1 2 2 3 3 4 4161618181212 4 4 0 0 4 4121218181616合计合计
27、 - -2525400400 - - 100100样本平均样本平均数的抽样数的抽样平均误差平均误差()()xxXxXfkf222 22525100100 x fxfXxfXx2)(. . 样本平均样本平均数的抽样数的抽样平均误差平均误差2 22 25 51 10 00 0ffXxXxkx22)()((用定义公(用定义公式计算)式计算)nnx2(用计算(用计算公式计算)公式计算)结论:结论:第一,样本平均数的平均数等于总体平均数,即:第一,样本平均数的平均数等于总体平均数,即: XNXkxx1 16 6NXX 1 16 62 25 54 40 00 0ffxkxx 第二,样本平均数的标准差(抽样
28、平均误差)为第二,样本平均数的标准差(抽样平均误差)为总体标准差总体标准差的的n12 22 28 8. . 在不重复抽样条件下,在不重复抽样条件下,所有可能的样本及样本所有可能的样本及样本平均工资如右平均工资如右表表4-34-3 K = 54 = 20(个)个)样本样本 12 14 16 18 201214161820 13 14 15 16 13 15 16 17 14 15 17 18 15 16 17 19 16 17 18 19 表表4-3 4-3 样本平均数分布样本平均数分布样本样本序号序号样本平均数样本平均数 样本个数样本个数样本平均数离差样本平均数离差 离差平方离差平方1 1 2
29、 23 34 45 56 67 7 13141516171819224442226286064683638-3-2-1 0 1 2 3188404818合计合计2032060 x fxfXxfXx2)(. . 样本平均样本平均数的抽样数的抽样平均误差平均误差3 32 20 06 60 0ffXxx2)((用定义公(用定义公式计算)式计算)3 34 42 23 38 81 15 52 25 52 28 81NnNnx2第一,样本平均数的平均数等于总体平均数,即:第一,样本平均数的平均数等于总体平均数,即:1 16 6NXX XNXkxx 1 16 61 16 63 32 20 0ffxkxx 第
30、二,样本平均数的标准差(抽样平均误差)为第二,样本平均数的标准差(抽样平均误差)为总体标准差总体标准差的的Nnn11(用计算公(用计算公式计算)式计算)故,故,. . 2.2.样本成数的抽样平均误差样本成数的抽样平均误差 由于总体成数可以表现为是非标志(,)由于总体成数可以表现为是非标志(,)分布的平均数,而且它的标准差也可以从总体成分布的平均数,而且它的标准差也可以从总体成数推算出来,数推算出来,因此,可以从样本平均数的抽样平均误差和总因此,可以从样本平均数的抽样平均误差和总体标准差的关系推出样本成数的抽样平均误差的体标准差的关系推出样本成数的抽样平均误差的计算公式。计算公式。PPXPPP1
31、(1 1)重复抽样重复抽样:nPPnPp)1 ((2 2)不)不重复抽样重复抽样:NnnPPp1)1 (. . 注意:注意:在实际计算在实际计算抽样平均误差时抽样平均误差时,当当总体总体成数成数P未知未知时,可用时,可用样本成数样本成数 p 来代替。即来代替。即:nnPPnppPp)1()1 ( 例例4-4:4-4:要估计某高校要估计某高校1000010000名在校生的近视率,名在校生的近视率,现随机从中抽取现随机从中抽取400400名,检查有近视眼的学生名,检查有近视眼的学生320320名,试计算样本近视率的抽样平均误差。名,试计算样本近视率的抽样平均误差。(1 1)在重复抽样条件下,)在重
32、复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为:误差为:解:根据已知条件:解:根据已知条件: %8 80 00 0. .8 84 40 00 03 32 20 0nnp1nnPPppp)1 ()1 (0 0. .0 02 24 40 00 00 0. .2 20 0. .8 8= = 2 2. . (2 2)在不重复抽样条件下,)在不重复抽样条件下,样本近视率样本近视率的抽样平均的抽样平均误差为:误差为:)1 ()1 (Nnnppp) )( (1 10 00 00 00 04 40 00 01 14 40 00 00 0. .2 20 0. .8 8 计算结果表明,用样本的近视率
33、来估计总体计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为的近视率其抽样平均误差为2 2左右(即用样本左右(即用样本的近视率来估计总体的近视率其误差的绝对值的近视率来估计总体的近视率其误差的绝对值平均说来在平均说来在2 2左右)。左右)。= = 1.961.96. . (三)(三)影响抽样(平均)误差的因素影响抽样(平均)误差的因素 nnx2Nnnx11.1.总体标志变异程度的大小(总体标准差总体标志变异程度的大小(总体标准差的的大小)。大小)。它与它与成正比例变化。成正比例变化。2.2.样本容量的大小。样本容量的大小。它与它与成反比例变化。成反比例变化。3.3.抽样方法的不同。
34、抽样方法的不同。重复重复抽样的抽样的总是大于不重总是大于不重复复抽样的抽样的。4.4.抽样的组织形式。抽样的组织形式。抽样的组织形式不同,抽抽样的组织形式不同,抽样误差也不同。样误差也不同。 例如:例如:要使要使抽样误差减少为原来的抽样误差减少为原来的一半一半,则样本容量将为原来的则样本容量将为原来的 4 4倍倍。. . 三、抽样极限误差三、抽样极限误差 抽样极限误差抽样极限误差是从另外一个角度来考虑抽样误是从另外一个角度来考虑抽样误差的问题。差的问题。用样本指标估计总体指标用样本指标估计总体指标的同时,必须要同时考虑抽样误差的大小。的同时,必须要同时考虑抽样误差的大小。)(PpXx 或或即即
35、 抽样极限误差抽样极限误差是指抽样指标与总体指标之间抽是指抽样指标与总体指标之间抽样误差可允许的范围。又称为允许误差或抽样误样误差可允许的范围。又称为允许误差或抽样误差范围。它等于样本指标可允许变动的上差范围。它等于样本指标可允许变动的上下限与下限与总体指标的绝对值。总体指标的绝对值。 样本平均数的抽样极限误差样本平均数的抽样极限误差Xxx 样本成数的抽样极限误差样本成数的抽样极限误差Ppp上面两式可改写成以下两个不等式,即:上面两式可改写成以下两个不等式,即:. . xxxXx)(xxxx,为总体平均数的为总体平均数的估估 计区间(置信区间)计区间(置信区间)ppppP)(pppp,为总体成
36、数的为总体成数的估计估计 区间(置信区间)区间(置信区间) 例如例如, ,要估计某乡粮食亩产量和总产量,从该要估计某乡粮食亩产量和总产量,从该乡乡2 2万亩万亩粮食作物中抽取粮食作物中抽取400400亩亩,求得其平均亩,求得其平均亩产量为产量为400400公斤公斤。如果确定抽样极限误差为。如果确定抽样极限误差为5 5公公斤斤,试估计该乡粮食亩产量和总产量所在的置,试估计该乡粮食亩产量和总产量所在的置信区间。信区间。 即即该乡粮食亩产量的区间落在该乡粮食亩产量的区间落在4004005 5公斤公斤的的范围内,即在范围内,即在395395405405公斤之间。公斤之间。5 5 4 40 00 0 x
37、x. . 又如又如, ,要估计某高校要估计某高校1000010000名名在校生的近视率,在校生的近视率,现随机从中抽取现随机从中抽取400400名名,计算的,计算的近视率为近视率为8080,如果确定允许误差范围为如果确定允许误差范围为4 4,试估计该,试估计该高校高校在校生近视率在校生近视率所在的置信区间。所在的置信区间。 该校学生近视率的区间落在该校学生近视率的区间落在80804 4的范的范围内,即在围内,即在76768484之间。之间。 粮食总产量在粮食总产量在2000020000(4004005 5)公斤,即公斤,即在在790790810810万公斤之间。万公斤之间。 %4 4 8 80
38、 0 xp. . 四、抽样误差的概率度四、抽样误差的概率度 基于基于概率估计概率估计要求,要求,抽样极限误差抽样极限误差x 或或 p 通常需要以通常需要以抽样平均误差抽样平均误差x 或或p 为标准单为标准单位来衡量。位来衡量。 把把抽样极限误差抽样极限误差x 或或 p 分别除以分别除以x 或或p得相对数得相对数t,表示误差范围为抽样平均误差的表示误差范围为抽样平均误差的t倍。倍。 t是测量抽样估计可靠程度的一个参数,是测量抽样估计可靠程度的一个参数,称为称为抽样误差的概率度。抽样误差的概率度。; ;xxtxxt; ;pptppt. . 如在上例,如在上例,已知某乡粮食亩产量的标准差为已知某乡粮
39、食亩产量的标准差为=8080公斤,总体单位数公斤,总体单位数N =2000020000亩,样本单亩,样本单位数位数 n=400400亩,求得其抽样平均误差为亩,求得其抽样平均误差为。 ( (公公斤斤) )4 44 40 00 08 80 0nx 如果确定抽样极限误差为如果确定抽样极限误差为5 5公斤,则,我们公斤,则,我们可以用概率度:可以用概率度:xxt1 1. .2 25 54 45 5 表示抽样极限的误差范围,即用表示抽样极限的误差范围,即用1.251.25x 来来规定误差范围的大小。规定误差范围的大小。. . 五、抽样估计的置信度五、抽样估计的置信度 抽样估计的置信度抽样估计的置信度就
40、是表明就是表明样本指标与总体指标样本指标与总体指标的误差不超过一定范围的概率保证程度,它一般用的误差不超过一定范围的概率保证程度,它一般用 F(t)表示表示。 又称又称抽样估计的抽样估计的概率概率保证程度保证程度。)()(tFtXxxxP)()(tFtxXtxxxP)()(tFtpppPP 总体平均数总体平均数抽样估计的置信度:抽样估计的置信度: 总体成数总体成数抽样估计的置信度:抽样估计的置信度:)()(tFtptpppPP. . 如前所述:如前所述:Xxx 从主观愿望上讲,我们当然希望样本指标的估从主观愿望上讲,我们当然希望样本指标的估计值都能够落在允许的误差范围内,但由于计值都能够落在允
41、许的误差范围内,但由于样本样本指标值随着样本的变动而变动,它本身是个随机指标值随着样本的变动而变动,它本身是个随机变量,因而样本指标与总体指标的误差仍然是个变量,因而样本指标与总体指标的误差仍然是个随机变量,并不能保证误差不超过一定范围这件随机变量,并不能保证误差不超过一定范围这件事是必然的,而只能给以一定程度的概率事是必然的,而只能给以一定程度的概率保证。保证。xxxXxPppppppP)()(tFtXxxxP)()(tFtpppPP68.2768.27 即抽样极限误差越大即抽样极限误差越大 (概率度越大),则抽样估计(概率度越大),则抽样估计 的置信度越大,但是抽样估计的置信度越大,但是抽
42、样估计 的准确性越小。反之亦然。的准确性越小。反之亦然。. . 95.4595.4599.7399.73Xxxxx2 2xx3 3xxxx2 2xx3 3 (置信区间)(置信区间) (置信度)(置信度)F(t)是是t的的函数,是函数,是概率面积。概率面积。 可见可见F(t)与与t是正是正比关系,而与比关系,而与也也是正比关系。是正比关系。当当 t = 1 1xx6 68 8. .2 27 7)(xxxxXP当当 t = 2 2xx2 29 95 5. .4 45 52 22 2)(xxxxXP当当 t = 3 3xx3 39 99 9. .7 73 33 33 3)(xxxxXP)()(tFt
43、xXtxxxP)()(tFtXxxxP. . . . 一、总体参数的点估计一、总体参数的点估计(第(第9090页)页) (一)点估计的概念(一)点估计的概念即用样本统计量直接估计总体参数。即用样本统计量直接估计总体参数。XxPp(二)抽样估计的优良标准(二)抽样估计的优良标准 衡量一个样本统计量是否是总体参数的优良衡量一个样本统计量是否是总体参数的优良的估计量标准有的估计量标准有无偏性、一致性无偏性、一致性 和和有效性有效性 。1.1.无偏性。无偏性。 即如果即如果样本统计量样本统计量的的数学期望值等于数学期望值等于被估计的总体参数本身,则该统计量是被估计被估计的总体参数本身,则该统计量是被估
44、计参数的无偏估计量。参数的无偏估计量。 XNXkxx. . 即当即当样本容量样本容量n充分大时充分大时,若样本统计,若样本统计量充分地靠近被估计的参数本身。则该统计量是量充分地靠近被估计的参数本身。则该统计量是被估计参数的一致估计量。被估计参数的一致估计量。2.2.一致性一致性 。 nsnxnN越越小小x 即若即若一个估计量的方差样本比其它估一个估计量的方差样本比其它估计量的方差小,则该统计量是被估计参数的有效计量的方差小,则该统计量是被估计参数的有效估计量。估计量。3.3.有效性有效性 。NXX22)(nkXxx222)(22xXXxX. . 二、总体参数的区间估计二、总体参数的区间估计(第
45、(第9191页)页) (一)区间估计的概念(一)区间估计的概念 (二)(二)区间估计的要素区间估计的要素 (三)(三)区间估计的方法区间估计的方法 所构成所构成的区间来估计总体参数,并以一定的概率保证总的区间来估计总体参数,并以一定的概率保证总体参数将落在所估计的区间内。体参数将落在所估计的区间内。. . (一)(一)区间估计的概念区间估计的概念 在统计分析中,我们常常在统计分析中,我们常常用一个用一个区间区间及其出现及其出现的的概率概率来估计来估计总体参数总体参数。这种估计总体参数的方。这种估计总体参数的方法称为法称为区间估计区间估计。具体地说,具体地说,区间估计区间估计是用是用估计量估计量
46、px或或 这一概率保证程度这一概率保证程度称为称为置信度置信度,这种估计区间,这种估计区间称为称为置信区间置信区间。例如:例如:)()(tFtXxxxP)()(tFtxXtxxxP即即:. . (二)(二)区间估计的要素区间估计的要素 1.1. 估计值(样本指标)估计值(样本指标)2.2. 抽样极限误差抽样极限误差3.3. 置信度置信度px 或或 ppttxx 或或)(tF(概率保证程度)(概率保证程度)(三)区间估计的方法(三)区间估计的方法 1.1.总体平均数区间估计总体平均数区间估计)()(tFtxXtxxxP2.2.总体成数总体成数区间估计区间估计)()(tFttppppPP. . 例
47、例4-54-5:从某厂生产的从某厂生产的50005000只灯泡中,随机不只灯泡中,随机不重复抽取重复抽取100100只,对其使用寿命进行调查,调查只,对其使用寿命进行调查,调查结果如结果如表表4-54-5。 又该厂质量规又该厂质量规定使用寿命在定使用寿命在30003000小时以下为小时以下为不合格品。不合格品。 表表4-54-5使用寿命使用寿命(小时)(小时)产品数量产品数量(只)(只) 3000 3000以下以下3000 40003000 40004000 50004000 5000 5000 5000以上以上2 2303050501818合合 计计100100(1 1)按不重复抽样方法,以
48、)按不重复抽样方法,以95.4595.45%的概率保证程的概率保证程度估计该批灯泡的平均使用寿命;度估计该批灯泡的平均使用寿命;(2 2)按不重复抽样方法,以)按不重复抽样方法,以68.2768.27%的置信度估计该的置信度估计该批灯泡的合格率。批灯泡的合格率。(1 1)N = 5000 = 5000 n = 100 100 F(t) = 95.45 = 95.45% t = 2 2. . 使用寿命使用寿命 (小时)(小时)组中值组中值产品数量产品数量30003000以下以下3000 40003000 40004000 50004000 500050005000以上以上250025003500
49、35004500450055005500 2 2303050501818 5000 5000105000105000225000225000 99000 99000-1480-1480-840-840 160 16011601160 6771200 67712002116800021168000 1280000 12800002422080024220800合合 计计1001004340004340005344000053440000 x解:解:样本平均数:样本平均数:fxfx( (小小时时) )4 43 34 40 01 10 00 04 43 34 40 00 00 0样本标准差:样本标准
50、差:ffxxs2)( 7 73 31 1. .0 02 26 67 71 10 00 05 53 34 44 40 00 00 00 0fxfxxfxx2)(. . xxt总体平均寿命所在的置信区间为总体平均寿命所在的置信区间为: :上限:上限:xtx) )4 44 48 84 4. .7 74 4( (小小时时1 14 44 4. .7 74 44 43 34 40 01 14 44 4. .7 74 4( (小小时时) )7 72 2. .3 37 72 2下限:下限:xtx)4 41 19 95 5. .2 26 6( (小小时时1 14 44 4. .7 74 44 43 34 40