《统计抽样推断幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计抽样推断幻灯片.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计抽样推断第1页,共102页,编辑于2022年,星期二第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观指样本单位的抽取不受主观因素及其他系统性因素的影因素及其他系统性因素的影响,每个总体单位都有均等响,每个总体单位都有均等的被抽中机会的被抽中机会一一、抽样推断抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一从全部研究对象中抽取一部分单位进行调查,并以调查结果对总部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方计与推断,从而认识总体的一种统计方法。法。第2页,共102页,编辑于202
2、2年,星期二统计推断统计推断总体指标:总体指标:参数参数(未知量)(未知量)样本总体指标:样本总体指标:统计统计量(已知量量(已知量)抽样推断抽样推断第3页,共102页,编辑于2022年,星期二欲了解某湖中鱼的总产量,如果湖中有欲了解某湖中鱼的总产量,如果湖中有N条鱼,条鱼,平均每条鱼的重量为平均每条鱼的重量为 kg,湖中鱼的总产量,湖中鱼的总产量就为就为N kg.但由于不方便在湖中进行全面调查,因此,总产量但由于不方便在湖中进行全面调查,因此,总产量也是未知的,这可以通过抽样来估计。也是未知的,这可以通过抽样来估计。例例1 对湖中鱼产量的估计。对湖中鱼产量的估计。第4页,共102页,编辑于2
3、022年,星期二 首先,为了便于抽样,需要对总体做一下处首先,为了便于抽样,需要对总体做一下处理。在湖面上均匀地打捞出若干网鱼,假设共有理。在湖面上均匀地打捞出若干网鱼,假设共有N1条,将它们做上记号后重新扔回湖中。这样就可以条,将它们做上记号后重新扔回湖中。这样就可以从湖中进行抽样了,重复刚才的做法,再次从湖中均从湖中进行抽样了,重复刚才的做法,再次从湖中均匀地打捞出若干网鱼,假设共有匀地打捞出若干网鱼,假设共有n条,这条,这n条就构成条就构成了一个样本。了一个样本。一般而言,这一般而言,这n条鱼会有一部分有记号,设其为条鱼会有一部分有记号,设其为n1条,条,另外一部分则没有记号,它必然为另
4、外一部分则没有记号,它必然为n-n1条,样本中有记条,样本中有记号的鱼所占的比重号的鱼所占的比重(记作记作p)为为n1/n.第5页,共102页,编辑于2022年,星期二 可以这样去推理:鱼在湖中的游动具有一定的随可以这样去推理:鱼在湖中的游动具有一定的随机性质,如果网是均匀撒出的,则打捞出的鱼应当对机性质,如果网是均匀撒出的,则打捞出的鱼应当对湖中整个的鱼具有较好的代表性。整个湖中有记号的湖中整个的鱼具有较好的代表性。整个湖中有记号的鱼所占的比重鱼所占的比重(记为记为P)N1/N虽然未知,但可以通过有虽然未知,但可以通过有记号的鱼所占的比重记号的鱼所占的比重n1/n去估计,即去估计,即第6页,
5、共102页,编辑于2022年,星期二于是,整个湖中鱼的总数目于是,整个湖中鱼的总数目N的点估计就是的点估计就是同上,如果将样本中同上,如果将样本中n条鱼的平均重量计算出条鱼的平均重量计算出来,记为来,记为 ,它就可以作为湖中全部鱼的平,它就可以作为湖中全部鱼的平均重量均重量 的估计量,则湖中鱼产量的点估计的估计量,则湖中鱼产量的点估计量为量为第7页,共102页,编辑于2022年,星期二例例2 某工厂生产了一批产品,共某工厂生产了一批产品,共10000件,须经检验件,须经检验后方可出厂,按规定次品率不得超过后方可出厂,按规定次品率不得超过3。现从中。现从中抽取抽取100件产品,结果发现有件产品,
6、结果发现有5件次品,问这批产品件次品,问这批产品能否投入市场?能否投入市场?统计假设统计假设 H0:很明显样本很明显样本100件产品的实际次品率高于规定的要求,件产品的实际次品率高于规定的要求,高出高出2。高出的。高出的2是由于什么原因造成的呢?是由于什么原因造成的呢?第8页,共102页,编辑于2022年,星期二深入考察就会发现有两种可能性:一种情况是该批深入考察就会发现有两种可能性:一种情况是该批10000件产品的次品率超过件产品的次品率超过3,高出的,高出的2是由于选是由于选取取100件产品的随机性而造成的;另一种情况是件产品的随机性而造成的;另一种情况是10000件产品的次品率不符合要求
7、,样本的次品率高出原件产品的次品率不符合要求,样本的次品率高出原来的假设不是偶然的或随机的,而是有其内在的、来的假设不是偶然的或随机的,而是有其内在的、必然的系统性原因。必然的系统性原因。第9页,共102页,编辑于2022年,星期二随机原则的实现随机原则的实现抽签法抽签法是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的编号编号编号编号写在外形完全一写在外形完全一写在外形完全一写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,致的签上,将其搅拌均匀,从中任意抽选,致的签上,将其搅拌均匀,从中任意抽选,致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就
8、是样本单位。签上的号码所对应的单位就是样本单位。签上的号码所对应的单位就是样本单位。签上的号码所对应的单位就是样本单位。随机数表法随机数表法将总体中每个单位将总体中每个单位将总体中每个单位将总体中每个单位编上号码编上号码编上号码编上号码,然后使用,然后使用,然后使用,然后使用随机数表,查出所要抽取的调查单位。随机数表,查出所要抽取的调查单位。随机数表,查出所要抽取的调查单位。随机数表,查出所要抽取的调查单位。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机计算机计算机中,需要时将总体中各单位编上
9、号码,中,需要时将总体中各单位编上号码,中,需要时将总体中各单位编上号码,中,需要时将总体中各单位编上号码,启用启用启用启用随机数字发生器随机数字发生器随机数字发生器随机数字发生器输出随机数字,然输出随机数字,然输出随机数字,然输出随机数字,然后从总体中找到相应总体单位形成样本。后从总体中找到相应总体单位形成样本。后从总体中找到相应总体单位形成样本。后从总体中找到相应总体单位形成样本。第10页,共102页,编辑于2022年,星期二二、特点:二、特点:1、样本单位是按随机原则抽取的、样本单位是按随机原则抽取的2、抽样推断是一种从数量上由部分推断总体、抽样推断是一种从数量上由部分推断总体 的研究方
10、法的研究方法3、抽样推断是采用概率估计的方法、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制、抽样推断的误差可以事先计算并加以控制第11页,共102页,编辑于2022年,星期二 与全面调查相比,抽样调查既节省了人力、物与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的力、财力和时间,又达到了认识总体数量特征的目的。目的。我国在我国在19941994年确立了以周期性普查为基础,以年确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以经常性抽样调查为主体,同时辅之以重点调查、科学重点调查、科学核算等综合运用的统计调查方法体系。核算等综
11、合运用的统计调查方法体系。第12页,共102页,编辑于2022年,星期二三、优点:三、优点:1、更科学、更科学2、更经济、更经济3、时效性强、时效性强 4、应用广、应用广第13页,共102页,编辑于2022年,星期二四、抽样推断的应用四、抽样推断的应用(1)调查具有破坏性的场合)调查具有破坏性的场合(2)对无限总体或总体规模非常大的场合)对无限总体或总体规模非常大的场合 进行调查进行调查(3)不必要进行全面调查但又需要知道)不必要进行全面调查但又需要知道 总体的全面情况时总体的全面情况时(4)对全面调查的结果进行核查和修正)对全面调查的结果进行核查和修正(5)对资料时效性要求很强的场合)对资料
12、时效性要求很强的场合 第14页,共102页,编辑于2022年,星期二q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用第15页,共102页,编辑于2022年,星期二抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。的性质。大数定律论证了如果独立随机变量总体存在大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本
13、有限的平均数和方差,则对于充分大的样本可以近乎可以近乎100%100%的概率,期望样本平均数与总的概率,期望样本平均数与总体平均数的绝对离差体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方差,那如果变量总体存在有限的平均数和方差,那么不论这么不论这个总体的分布如何,随着样本容量个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于的增加,样本平均数的分布,便趋近于正态正态分布分布。第16页,共102页,编辑于2022年,星期二 按照总体所包含总体单位个数的多少,可按照总体所包含总体单位个数的多少,可以分为有限总体和无限总体。以分为有限总体和无限总体。第二节第二节
14、 总体和样本总体和样本 按照按照样样本本单单位的来源不同,可将位的来源不同,可将总总体分体分为为目目标总标总体和抽体和抽样总样总体体。(一一)总体总体一、总体和总体指标一、总体和总体指标第17页,共102页,编辑于2022年,星期二目标总体目标总体抽样总体抽样总体是所要认识研究对象的全体,它由具有是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常某种共同性质或特征的单位所组成。常用用N表示全及总体的单位数目。表示全及总体的单位数目。是指从中抽取样本的总体,亦即样本单位实是指从中抽取样本的总体,亦即样本单位实际来源的总体。际来源的总体。第18页,共102页,编辑于2022年,星
15、期二根据总体各个单位的标志值或标志根据总体各个单位的标志值或标志特征所计算的反映总特征所计算的反映总体某种属性的综体某种属性的综合指标合指标,又称,又称总体参数总体参数。总体指标总体指标设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则(二二)主要的总体指标主要的总体指标第19页,共102页,编辑于2022年,星期二 总体平均数(又叫总体均值):总体平均数(又叫总体均值):或记作:或记作:第20页,共102页,编辑于2022年,星期二 总体单
16、位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方差:第21页,共102页,编辑于2022年,星期二 总体成数:总体成数:6.总体是非标志的标准差:总体是非标志的标准差:7.总体是非标志的方差:总体是非标志的方差:5.总体是非标志的平均数:总体是非标志的平均数:第22页,共102页,编辑于2022年,星期二(一一)样本样本二、样本和样本指标二、样本和样本指标又称子样,是指从总体中按照随机原则抽取的那又称子样,是指从总体中按照随机原则抽取的那部分个体的集合。部分个体的集合。样本的单位数称为样本的单位数称为样本容样本容量量,通,通常用常用n表示。表示。1nN。n30称
17、为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家户居民进行家庭收支情况调查,其中的庭收支情况调查,其中的100100万户居万户居民就是总体,而被抽民就是总体,而被抽中的中的1000户居民则构成样本。户居民则构成样本。第23页,共102页,编辑于2022年,星期二(二二)主要的样本指标主要的样本指标指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。样本
18、指标样本指标设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则第24页,共102页,编辑于2022年,星期二 样本平均数(又叫样本均值):样本平均数(又叫样本均值):第25页,共102页,编辑于2022年,星期二 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计第26页,共102页,编辑于2022年,星期二 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差
19、:样本单位是非标志的方差:样本单位是非标志的方差:为为 的的无偏估计无偏估计5.样本单位是非标志的平均数:样本单位是非标志的平均数:第27页,共102页,编辑于2022年,星期二三、抽样方法的分类三、抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果并把结果登记下来,又放回总体中重新参加下一次的登记下来,又放回总体中重新参加下一次的抽选。又称抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再每次从总体中抽选一个单位后就不再将其放回参加下
20、一次的抽选。又称将其放回参加下一次的抽选。又称不放不放回抽样回抽样.总体单位数总体单位数N N不变,同一单位可能多不变,同一单位可能多次被抽中。次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。根据取样方式不同,可分为:根据取样方式不同,可分为:第28页,共102页,编辑于2022年,星期二抽样方法的分类抽样方法的分类根据对样本的要求不同,可分为:根据对样本的要求不同,可分为:考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考
21、虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有四综合起来共有四种抽样方法种抽样方法第29页,共102页,编辑于2022年,星期二样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样第30页,共102页,编辑于2022年,星期二 第三节:点估计和抽样平均误差第三节:点估计和抽样平均误差 人们每时每刻都在做估计。根据婴儿的哭声估计人们每时每刻
22、都在做估计。根据婴儿的哭声估计其冷热和什么时候吃奶、根据望闻问切来估计病人其冷热和什么时候吃奶、根据望闻问切来估计病人的病情、根据外表估计一个人的身高体重、根据前的病情、根据外表估计一个人的身高体重、根据前几天的数据估计今天的股市行情,根据营业数据等几天的数据估计今天的股市行情,根据营业数据等估计一个公司的业绩等等。估计就是根据你拥有的估计一个公司的业绩等等。估计就是根据你拥有的信息来对现实世界进行某种判断。统计中的估计也信息来对现实世界进行某种判断。统计中的估计也不例外,它是完全根据数据做出的。不例外,它是完全根据数据做出的。第31页,共102页,编辑于2022年,星期二点估计点估计从总体中
23、抽取一个随机样本,计算与总体参数从总体中抽取一个随机样本,计算与总体参数相应的样本统计相应的样本统计量,然后把该统计量视为总体量,然后把该统计量视为总体参数的估计值,称为参数的点估计。参数的估计值,称为参数的点估计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况第32页,共102页,编辑于2022年,星期二 的抽样分布的抽样分布点估计的最大好处:给出确定的值点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差点估计的最大问题:无法控制误差第33页,共102页,编辑于
24、2022年,星期二抽样估计量的优良标准抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第34页,共102页,编辑于2022年,星期二若,则称为比更有效的估计量若,则称为比更有效的估计量若越大越小,则称为的一致估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏性作为优良的估计量,除了满足无偏性的要求外,其方差应比较小的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样
25、本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性抽样估计量的优良标准抽样估计量的优良标准第35页,共102页,编辑于2022年,星期二问题:问题:第一,我们为什么以这一个而不是第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优结果是否一致?是否一个统计量要优于另一个?于另一个?估计值的优良
26、标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性第36页,共102页,编辑于2022年,星期二q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计量的优良标准抽样估计量的优良标准第37页,共102页,编辑于2022年,星期二一、抽样误差一、抽样误差统计误差统计误差指统计调查结果所获得的统计数字指统计调查结果所获得的统计数字与客观与客观事物实际数值的差别。事物实际数值的差别。(一)登记性误差(一)登记性误差偶然性登
27、记误差偶然性登记误差系统性登记误差系统性登记误差第38页,共102页,编辑于2022年,星期二 (二)代表性误差(二)代表性误差 指采用非全面调查的方式,利用部分单位资料推断总体资料指采用非全面调查的方式,利用部分单位资料推断总体资料时所产生的误差。时所产生的误差。1、系统性误差、系统性误差 抽取样本单位时,未用、破坏随机原则产生的误差。抽取样本单位时,未用、破坏随机原则产生的误差。2、随机误差、随机误差 遵循随机原则下产生的误差,遵循随机原则下产生的误差,即抽样误差。即抽样误差。第39页,共102页,编辑于2022年,星期二抽样误差的定义:抽样误差的定义:在随机抽样的条件下,在克服了或消灭了
28、登记性误差的在随机抽样的条件下,在克服了或消灭了登记性误差的条件下,样本指标与总体指标之间的误差。如:条件下,样本指标与总体指标之间的误差。如:1、抽样误差是个概念,只能理解无法计算;、抽样误差是个概念,只能理解无法计算;2、抽样误差是个变量,随着样本不同而不同。、抽样误差是个变量,随着样本不同而不同。问:抽样误差是个变量,那么抽样误差有多少个变问:抽样误差是个变量,那么抽样误差有多少个变量值?量值?第40页,共102页,编辑于2022年,星期二平均误差平均误差二、抽样平均误差二、抽样平均误差(一)抽样平均误差的定义公式(一)抽样平均误差的定义公式1 1、平均数的抽样平均误差、平均数的抽样平均
29、误差2 2、成数的抽样平均误差、成数的抽样平均误差第41页,共102页,编辑于2022年,星期二(二)抽样平均误差的计算公式(二)抽样平均误差的计算公式1 1、平均数的抽样平均误差、平均数的抽样平均误差n:样本容量样本容量总体方差总体方差(1)重复抽样时)重复抽样时已知总体标准差:已知总体标准差:第42页,共102页,编辑于2022年,星期二(2)不重复抽样时)不重复抽样时n:样本容量样本容量总体方差总体方差N:总体单位数总体单位数不是成数,是抽样比不是成数,是抽样比例,又叫修正系数例,又叫修正系数第43页,共102页,编辑于2022年,星期二2 2、成数的抽样平均误差、成数的抽样平均误差(1
30、)重复抽样时)重复抽样时n:样本容量样本容量P(1-P):是非标志的方差是非标志的方差(2)不重复抽样时)不重复抽样时n:样本容量样本容量P(1-P):是非标志的方差是非标志的方差N:总体单位数总体单位数第44页,共102页,编辑于2022年,星期二下面举例说明抽样平均误差的计算式和其定义式等价下面举例说明抽样平均误差的计算式和其定义式等价例:例:设有甲、乙、丙、丁四个人,他们的年龄分别是20、21、23、24岁,现从中抽取2人(n=2)调查他们的平均年龄。试计算抽样平均误差。解:解:1、重复条件下:、重复条件下:第45页,共102页,编辑于2022年,星期二序序号号样本样本资料资料(样本(样
31、本平均值)平均值)1 12 23 34 45 56 67 78 89 91010111112121313141415151616甲甲 甲甲甲甲 乙乙甲甲 丙丙甲甲 丁丁乙乙 甲甲乙乙 乙乙乙乙 丙丙乙乙 丁丁丙丙 甲甲丙丙 乙乙丙丙 丙丙丙丙 丁丁丁丁 甲甲丁丁 乙乙丁丁 丙丙丁丁 丁丁 合计合计-甲、乙、丙、丁四个人,他们的年龄分别是20、21、23、24岁20 2020 2120 2320 2421 2021 2121 2321 2423 2023 2123 2323 2424 2024 2124 2324 24 20 20.5 21.5 22 20.5 21 22 22.5 21.5 2
32、2 23 23.5 22 22.5 23.5 24 4 2.25 0.25 0 2.25 1 0 0.25 0.25 0 1 2.25 0 0.25 2.25 4 20第46页,共102页,编辑于2022年,星期二解:解:1、重复条件下:、重复条件下:用定义公式计算用定义公式计算用计算公式计算用计算公式计算第47页,共102页,编辑于2022年,星期二2、不重复条件下:、不重复条件下:用定义公式计算用定义公式计算用计算公式计算用计算公式计算第48页,共102页,编辑于2022年,星期二通过上例还可以得出所有样本平均数的平均数如下:通过上例还可以得出所有样本平均数的平均数如下:可以得出如下结论:
33、无论重复抽样还是不重复可以得出如下结论:无论重复抽样还是不重复抽样,所有样本平均数的平均数等于总体平均数抽样,所有样本平均数的平均数等于总体平均数即:即:第49页,共102页,编辑于2022年,星期二 同理:无论重复抽样还是不重复抽样,所有样本成数的平均数等于总体同理:无论重复抽样还是不重复抽样,所有样本成数的平均数等于总体成数即:成数即:由上述结论可得:由上述结论可得:可见抽样平均误差也是一个标准差的概念。可见抽样平均误差也是一个标准差的概念。平均数的抽样平均误差是所有可能的样本的平均数的标准差;平均数的抽样平均误差是所有可能的样本的平均数的标准差;同理同理,成数的抽样平均误差是所有可能的样
34、本的成数的标准差。成数的抽样平均误差是所有可能的样本的成数的标准差。对抽样平均误差的确切定义:对抽样平均误差的确切定义:概括为:抽样平均误差是所有可能的样本指标的概括为:抽样平均误差是所有可能的样本指标的标准差。标准差。第50页,共102页,编辑于2022年,星期二影响抽样误差的因素影响抽样误差的因素q总体各单位标志值的差异程度(即标准总体各单位标志值的差异程度(即标准差的大小):差的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误差越大,抽样误差越小;越小;q抽样方法:抽样方法:不重复抽样的抽样误差比不重复抽样的抽样误差比重复抽样的抽样误差小
35、;重复抽样的抽样误差小;q抽样组织方式:抽样组织方式:在总体变异程度较大的在总体变异程度较大的情况下,分层抽样的误差较简单随机抽情况下,分层抽样的误差较简单随机抽样的误差小。样的误差小。第51页,共102页,编辑于2022年,星期二关于总体方差的估计方法关于总体方差的估计方法q用过去同类问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;q用样本标准差用样本标准差 代替总体标准差代替总体标准差 ,用,用 代替代替 。抽样平均误差的计算公式抽样平均误差的计算公式第52页,共102页,编辑于2022年,星期二抽样极限抽样极限误差误差指在一定的概率保证程度下,抽样指
36、在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最指标与总体指标之间抽样误差的最大可能范围,也称作大可能范围,也称作抽样允许误差。抽样允许误差。常用常用表示表示。上式表明,样本平均数(成数)是以总体平均数(成数)为中上式表明,样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。心,在相应的区间内变动。第53页,共102页,编辑于2022年,星期二 样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样
37、本统样本统计量计量样本统样本统计量计量样本统样本统计量计量抽样分布抽样分布样本统计量所有可能值的样本统计量所有可能值的概率分布概率分布主要样本主要样本统计量统计量平均数比率(成数)方差平均数比率(成数)方差 第四节:抽样分布和区间估计第四节:抽样分布和区间估计第54页,共102页,编辑于2022年,星期二平均数的抽样分布平均数的抽样分布q全部可能样本平均数的均值等于总体均全部可能样本平均数的均值等于总体均值,即:值,即:q从非正态总体中抽取的样本平均数当从非正态总体中抽取的样本平均数当n n足够大时其分布接近正态分布。足够大时其分布接近正态分布。q从正态总体中抽取的样本平均数不论容从正态总体中
38、抽取的样本平均数不论容量大小其分布均为正态分布。量大小其分布均为正态分布。q样本均值的标准差为总体标准差的样本均值的标准差为总体标准差的 。统计学统计学第七章第七章 抽样推断抽样推断第55页,共102页,编辑于2022年,星期二比率的抽样分布比率的抽样分布q全部可能样本比率的均值等于总体比率,全部可能样本比率的均值等于总体比率,即:即:q从非正态总体中抽取的样本比率,当从非正态总体中抽取的样本比率,当n n足足够大时其分布接近正态分布。够大时其分布接近正态分布。q从正态总体中抽取的样本比率,不论容量大从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。小其分布均为正态分布。q样本比率的
39、标准差为总体标准的样本比率的标准差为总体标准的 。统计学统计学第七章第七章 抽样推断抽样推断第56页,共102页,编辑于2022年,星期二全部可能样本比率的均值等于总体全部可能样本比率的均值等于总体比率,即:比率,即:从非从非正态总体中抽取的样本比率当正态总体中抽取的样本比率当n足够大足够大时其分布接近正态分布。时其分布接近正态分布。从正态总从正态总体中抽取的样本比率不论容量大小其体中抽取的样本比率不论容量大小其分布均为正态分布。样本比率分布均为正态分布。样本比率的标准差为总体标准差的的标准差为总体标准差的 。比率的抽样分布比率的抽样分布统计学统计学第七章第七章 抽样推断抽样推断第57页,共1
40、02页,编辑于2022年,星期二二、区间估计二、区间估计 以一定的把握程度估计总体指标在什么范围内,并给出这个以一定的把握程度估计总体指标在什么范围内,并给出这个范围的概率(可信程度、置信度、把握程度)。范围的概率(可信程度、置信度、把握程度)。1 1、估计总体平均数时、估计总体平均数时 (1)的概率为的概率为0.6827;(2)的概率为的概率为0.9545;(3)的概率为的概率为0.9973;(4)的概率为的概率为 。第58页,共102页,编辑于2022年,星期二抽样估计的置信度抽样估计的置信度抽样指标和总体指标的误差不超过一定范围的抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它
41、称之为概率保概率大小,我们将它称之为概率保证程度,证程度,也叫抽样估计的置信度,一般用也叫抽样估计的置信度,一般用F(z)(或或 )表示。即:表示。即:置信度置信度z值与相应的概率保证程度存在一一对应关,值与相应的概率保证程度存在一一对应关,常用常用z值及相应的概率保证程度为:值及相应的概率保证程度为:z值值 概率保证程度概率保证程度1.00 0.6827 1.96 0.9500 2.00 0.9545 3.00 0.9973在在大大样样本本下下第59页,共102页,编辑于2022年,星期二为为Z的函数:的函数:ZF(Z)11.96230.68270.95000.95450.9973第60页,
42、共102页,编辑于2022年,星期二为概率、置信度、把握程度和可信程度;也为概率、置信度、把握程度和可信程度;也表表示为示为(1-)为为显著性水平。显著性水平。2 2、估计总体成数时、估计总体成数时的概率为 。置信水平(置信水平(%)Z 90959968.2795.4599.730.100.050.011.641.962.58123第61页,共102页,编辑于2022年,星期二以样本统计量为中心,以抽样以样本统计量为中心,以抽样平均误差为距离单位,可以构造一平均误差为距离单位,可以构造一个区间,并可以一定的概率保证待个区间,并可以一定的概率保证待估计的总体参数落在这个区间之中。估计的总体参数落
43、在这个区间之中。区间越大,则概率保证程度越高。区间越大,则概率保证程度越高。区间估计原理区间估计原理第62页,共102页,编辑于2022年,星期二总体平均数的区间估计总体平均数的区间估计表表达达式式其中,其中,为极限误差为极限误差第63页,共102页,编辑于2022年,星期二步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本方差算样本方差 ,即,即总体平均数的区间估计总体平均数的区间估计第64页,共102页,编辑于2022年,星期二步步骤骤 计算抽样平均误差计算抽样平均误差:重复抽样时重复抽样时:不重复抽样时不重复抽样时:总体平均数的区间
44、估计总体平均数的区间估计第65页,共102页,编辑于2022年,星期二步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计第66页,共102页,编辑于2022年,星期二 【例例例例1 1】对对对对一一一一批批批批产产产产品品品品随随随随机机机机抽抽抽抽取取取取100100件件件件,测测测测量量量量其其其其长长长长度度度度的的的的平平平平均均均均长长长长度度度度为为为为10cm10cm,标标标标准准准准差差差差为为为为0.5cm0.5cm,试试试试以以以以95.45%95.45%的的的的概概概概率率率率估估估估
45、计该批产品平均长度的区间范围。计该批产品平均长度的区间范围。计该批产品平均长度的区间范围。计该批产品平均长度的区间范围。解:解:已知已知 ,n=100 =95.45%,可得,可得 z=2 答:该批产品平均长度在答:该批产品平均长度在答:该批产品平均长度在答:该批产品平均长度在9.99.9,10.1 10.1 范围内变动。范围内变动。范围内变动。范围内变动。第67页,共102页,编辑于2022年,星期二 【例例例例2 2】对对对对某某某某工工工工厂厂厂厂工工工工人人人人随随随随机机机机抽抽抽抽取取取取5050人人人人调调调调查查查查他他他他们们们们的的的的月月月月工工工工资资资资资料如下:资料如
46、下:资料如下:资料如下:月工资(元)月工资(元)人数(人)人数(人)550以下以下550650650750750以上以上1015205合合 计计50试以试以试以试以95.45%95.45%的概率估计该厂工人平均工资的区间范围。的概率估计该厂工人平均工资的区间范围。的概率估计该厂工人平均工资的区间范围。的概率估计该厂工人平均工资的区间范围。第68页,共102页,编辑于2022年,星期二月工资月工资(元)(元)人数(人)人数(人)f组中值组中值(元)(元)Xxf550以下以下550650650750750以上以上101520550060070080050009000140004000合合 计计50
47、32000196001600360025600196000240007200012800 420000第69页,共102页,编辑于2022年,星期二 =95.45%,可得,可得 z=2 答:该厂工人的平均工资在答:该厂工人的平均工资在答:该厂工人的平均工资在答:该厂工人的平均工资在613.82613.82,666.18 666.18 范围内变动。范围内变动。范围内变动。范围内变动。第70页,共102页,编辑于2022年,星期二【例例3 3】某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不重复抽样从中随人,某日采用不重复抽样从中随机抽取机抽取100100人调查他
48、们的当日产量,人调查他们的当日产量,要求在要求在9595的概率保证程度下,的概率保证程度下,估计估计该厂全部工人的日平均产量和日总产量。该厂全部工人的日平均产量和日总产量。第71页,共102页,编辑于2022年,星期二按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计1001260041
49、44100100名工人的日产量分组资料名工人的日产量分组资料第72页,共102页,编辑于2022年,星期二解:解:统计学统计学第六章第六章 抽样推断抽样推断第73页,共102页,编辑于2022年,星期二则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件之间,其日总产量在件之间,其日总产量在124797124797至至127303127303件之件之间,估计的可靠程度为间,估计的可靠程度为9595统计学统计学第六章第六章 抽样推断抽样推断第74页,共
50、102页,编辑于2022年,星期二 练练练练习习习习:某某某某厂厂厂厂负负负负责责责责人人人人预预预预估估估估计计计计60006000根根根根某某某某零零零零件件件件的的的的长长长长度度度度,随随随随机机机机抽抽抽抽取取取取350350根根根根,测测测测验验验验得得得得其其其其平平平平均均均均长长长长度度度度为为为为21.4mm21.4mm,样样样样本本本本标标标标准准准准差差差差为为为为0.15mm0.15mm,试求总体均值的置信度为,试求总体均值的置信度为,试求总体均值的置信度为,试求总体均值的置信度为95%95%的置信区间?的置信区间?的置信区间?的置信区间?解:解:已知已知 ,n=35