《抽样推断 优秀PPT.ppt》由会员分享,可在线阅读,更多相关《抽样推断 优秀PPT.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样推断 你现在浏览的是第一页,共73页第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观指样本单位的抽取不受主观因素及其他系统性因素的影因素及其他系统性因素的影响,每个总体单位都有均等响,每个总体单位都有均等的被抽中机会的被抽中机会抽样推断抽样推断按照按照随机原则随机原则 从总体中抽取一部分单位从总体中抽取一部分单位进行观察,并运用数理统计的原例,以进行观察,并运用数理统计的原例,以被抽取的部分单位的数量特征为代表,被抽取的部分单位的数量特征为代表,根据观察结果来推断,对总体作出数量根据观察结果来推断,对总体作出数量上的推断分析。上的推断分析。你现在浏览的是第二页,共73页统计
2、推断统计推断全及总体指标:全及总体指标:参数(未知量)参数(未知量)样本总体指标:样本总体指标:统统计量(已知量计量(已知量)抽样推断抽样推断统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三页,共73页q按按随机原则随机原则抽取样本单位抽取样本单位q与全面推断相比较,抽样推断能与全面推断相比较,抽样推断能节省节省人力、人力、费用和时间,比较费用和时间,比较灵活灵活q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可以事,但抽样误差可以事先先计算并控制计算并控制抽样推断的特点抽样推断的特点 与全面调查相比,抽样调查既节省了人力、物力、财与全面调查相比,抽样调查既节省了人力、物力、
3、财力和时间,又达到了认识总体数量特征的目的。力和时间,又达到了认识总体数量特征的目的。我国在我国在19941994年确立了以周期性普查为基础,以经常性抽样调整年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以为主体,同时辅之以重点调查、科学核算等综合运用重点调查、科学核算等综合运用的统计调查方法体系。的统计调查方法体系。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四页,共73页q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行检验修正检验修正时时q 工业生
4、产过程中的工业生产过程中的质量控制质量控制q 对总体的对总体的假设假设进行进行检验检验,判断真伪,判断真伪抽样推断的作用抽样推断的作用统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五页,共73页抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。的性质。大数定律论证了如果独立随机变量总体存在有限大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎的平均数和方差,则对于充分大的样本可以近乎100%100%的概率,期望样本平均数与总体平均数的的概率,期望样
5、本平均数与总体平均数的绝对离差绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这差,那么不论这个总体的分布如何,随个总体的分布如何,随着样本容量的增加,样本平均数的分布,着样本容量的增加,样本平均数的分布,便趋近于便趋近于正态分布正态分布。你现在浏览的是第六页,共73页抽样推断的基本概念抽样推断的基本概念全及总体全及总体抽样总体抽样总体又称总体或母体,是所要认识研究对象又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的全体,它由具有某种共同性质或特征的单位所组成。常用的单位所组成。常用N表示全及总体的表示全及总体的单位
6、数目。单位数目。又称样本或子样,是指从全及总体中按又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的集合。照随机原则抽取的那部分个体的集合。抽样总体的单位数称为抽样总体的单位数称为样本容样本容量量,通常,通常用用n表示。表示。1nN。例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查,其中的收支情况调查,其中的100100万户居万户居民就是全及总体,而被民就是全及总体,而被抽中的抽中的1000户居民则构成抽样总体。户居民则构成抽样总体。n30称为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比
7、称为抽样比.你现在浏览的是第七页,共73页设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则 总体平均数(又叫总体均值):总体平均数(又叫总体均值):根据全及总体各个单位的标志值或根据全及总体各个单位的标志值或标志特征所计算的反映总标志特征所计算的反映总体某种属体某种属性的综合指标性的综合指标,又称,又称总体参数总体参数。全及指标全及指标统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第八页,共73页 总体单位标志值的标准差:总体单位
8、标志值的标准差:总体单位标志值的方差总体单位标志值的方差:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第九页,共73页 总体成数:总体成数:总体是非标志的标准差:总体是非标志的标准差:总体是非标志的方差:总体是非标志的方差:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第十页,共73页设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则 样本平均数(又叫样本均值):样本平均数(又叫样本均值):指根据抽样总体各个单位的标志值指根据抽
9、样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。抽样指标抽样指标统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第十一页,共73页 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:你现在浏览的是第十二页,共73页 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:统计学第六章统计学第六章 抽样推断抽样推断你现在浏览的是第十三页,共73页抽样方法的分类抽样方法的分类重复抽样重复抽样从总体从总
10、体N N个单位中随机抽取一个样本容量个单位中随机抽取一个样本容量为为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并并把结果登记下来,又放回总体中重新参加下把结果登记下来,又放回总体中重新参加下一次的抽选。又称一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再将每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称其放回参加下一次的抽选。又称不放回不放回抽样抽样.总体单位数总体单位数N N不变,同一单位可能多次不变,同一单位可能多次被抽中。被抽中。总体单位数减少总体单位数减少n n,同一单位只可能被,同一单位只可能被抽中一次。抽中一
11、次。根据取样方式不同,可分为:根据取样方式不同,可分为:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第十四页,共73页抽样框抽样框又称为抽样结构,指对可以选择作为样本的总又称为抽样结构,指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽体单位列出名册或排序编号,以确定总体的抽样范围和结构。抽样框的确定是为了计算样本样范围和结构。抽样框的确定是为了计算样本单位的概率。单位的概率。样本数样本数又称为样本的可能数目。指从总体又称为样本的可能数目。指从总体N N个单位中随机个单位中随机抽取抽取n n个单位构成样本,通常有多种抽选方法,每一个单位构成样本,通常有多种抽选方法,每
12、一种抽选方式就是种抽选方式就是n n个总体单位的一种排列组合,个总体单位的一种排列组合,n n个个总体单位的排列组合总数,称为样本的可能数目。总体单位的排列组合总数,称为样本的可能数目。你现在浏览的是第十五页,共73页问题:问题:第一,我们为什么以这一个而不第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数是那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优结果是否一致?是否一个统计量要优于另一个?于另一个?估计值的优良
13、标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第十六页,共73页第二节第二节 抽样误差抽样误差 抽样误差抽样误差 通常,把抽样指标与所要估计的总体指标通常,把抽样指标与所要估计的总体指标之间的差值称为抽样误差。抽样误差既是一种之间的差值称为抽样误差。抽样误差既是一种随机性误差,也是一种代表性误差。抽样误差随机性误差,也是一种代表性误差。抽样误差的大小能够说明抽样指标估计总体指标是否可的大小能够说明抽样指标估计总体指标是否可行、抽样效果是否理想等推断性问题。行、抽样效果是否理想等推断性问题。你现在浏览的是第十七页,共7
14、3页抽样误差抽样误差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高平均身高=169.8CM平均身高平均身高=174.6CM总平均身高总平均身高=168.6CM统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第十八页,共73页抽样平均抽样平均误差误差指每一个可能样本的指标值与总指每一个可能样本的指标值与总体指标值之间平均离差,即一系体指标值之间平均离差,即一系列样本指标的标准差列样本指标的标准差式中:式中:为样本平均数的抽样平均
15、误差;为样本平均数的抽样平均误差;为为可能的样本数目;可能的样本数目;为第为第 个可能样本的平均个可能样本的平均数;数;为总体平均数为总体平均数注意:不要混淆抽样注意:不要混淆抽样标准差与样本标准差!标准差与样本标准差!你现在浏览的是第十九页,共73页抽样平均误差的计算抽样平均误差的计算 样本平均数的抽样平均误差样本平均数的抽样平均误差当N500时,有重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第二十页,共73页 样本成数的抽样平均误差样本成数的抽样平均误差重复抽样时:重复抽样时:不重复抽样时不重复抽样时:当N500时,有抽样平均
16、误差的计算公式抽样平均误差的计算公式统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第二十一页,共73页关于总体方差的估计方法关于总体方差的估计方法q用过去同类问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;q用样本标准差用样本标准差 代替总体标准差代替总体标准差 ,用,用 代替代替 。抽样平均误差的计算公式抽样平均误差的计算公式统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第二十二页,共73页抽样极限抽样极限误差误差指在一定的概率保证程度下,抽指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差样指标与总体指标之间抽样误差的最大可能
17、范围,也称作的最大可能范围,也称作抽样允许抽样允许误差。误差。常用常用表示表示。上式表明,样本平均数(成数)是以总体平均数(成数)为中上式表明,样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。心,在相应的区间内变动。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第二十三页,共73页由于总体成数和总体平均数是未知的,它要求靠实测由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差的抽样平均数和抽样成数来估计,因而抽样误差的实的实际意义是希望总体平均数(成数)落在某个已知的范际意义是希望总体平均数(成数)落在某个已知的范围内。围内。
18、抽样极限误差抽样极限误差所以前面的不等式应变换为所以前面的不等式应变换为:在一个特定的全及总体中,当抽样方法和样本容量固定时,在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样平均误差的为抽样平均误差的多少倍。多少倍。由于由于t t值与样本估计值落入允许值与样本估计值落入允许误差范围内的概率有关,因此,误差范围内的概率有关,因此,t t也称为也称为概率度概率度。你现在浏览的是第二十四页,共
19、73页置信度置信度抽样指标和总体指标的误差不超过一定范抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保围的概率大小,我们将它称之为概率保证证程度,也叫抽样估计的置信度,一般用程度,也叫抽样估计的置信度,一般用F(t)表示。即:表示。即:置信度置信度t值与相应的概率保证程度存在一一对应关,值与相应的概率保证程度存在一一对应关,常用常用t值及相应的概率保证程度为:值及相应的概率保证程度为:t值值 概率保证程度概率保证程度1.00 0.6827 1.96 0.9500 2.00 0.9545 3.00 0.9973在在大大样样本本下下你现在浏览的是第二十五页,共73页68.27
20、%95.45%99.73%抽样极限误差抽样极限误差统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第二十六页,共73页影响抽样误差的因素影响抽样误差的因素q总体各单位标志值的差异程度(即标总体各单位标志值的差异程度(即标准差的大小):准差的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误差越大,抽样误差越小;越小;q抽样方法:抽样方法:不重复抽样的抽样误差比不重复抽样的抽样误差比重复抽样的抽样误差小;重复抽样的抽样误差小;q抽样组织方式:抽样组织方式:简单随机抽样的误差简单随机抽样的误差最大。最大。统计学第五章统计学第五章 抽样推断抽样
21、推断你现在浏览的是第二十七页,共73页第三节第三节 抽样估计抽样估计 也叫参数估计,就是根据也叫参数估计,就是根据样本指样本指标标数值对数值对总体指标总体指标数值作出估计或数值作出估计或推断。推断。抽样估计抽样估计通常,把用来估计总体特征的样本指标叫通常,把用来估计总体特征的样本指标叫估计量估计量或统计量,或统计量,待估计的总体指标叫待估计的总体指标叫总体参数总体参数。特特点点1、它在逻辑上运用、它在逻辑上运用归纳推理归纳推理而不是演绎推理。而不是演绎推理。2、在方法上运用不确定的、在方法上运用不确定的概率估计方法概率估计方法,而不,而不是运用确定的数学分析方法。是运用确定的数学分析方法。3、
22、抽样估计存在、抽样估计存在抽样误差抽样误差。你现在浏览的是第二十八页,共73页点估计点估计从总体中抽取一个随机样本,计算与总体参从总体中抽取一个随机样本,计算与总体参数相应的样本统计数相应的样本统计量,然后把该统计量视量,然后把该统计量视为总体参数的估计值,称为参数的点估为总体参数的估计值,称为参数的点估计。计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况你现在浏览的是第二十九页,共73页 的抽样分布的抽样分布点估计的最大好处:给出确定的值点点估计的最大好处:给出确定的值
23、点估计的最大问题:无法控制误差估计的最大问题:无法控制误差统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十页,共73页区间估计区间估计给出一个区间给出一个区间(置信区间置信区间)并推断真正的参数以并推断真正的参数以一定的概率存在于这个区间的方法。一定的概率存在于这个区间的方法。区间估计原理区间估计原理以样本统计量为中心,以以样本统计量为中心,以抽样平均误差为距离单位,可抽样平均误差为距离单位,可以构造一个区间,并可以一定以构造一个区间,并可以一定的概率保证待估计的总体参数的概率保证待估计的总体参数落在这个区间之中。区间越大,落在这个区间之中。区间越大,则概率保证程度越高。则概率保
24、证程度越高。你现在浏览的是第三十一页,共73页区间估计原理区间估计原理0.6827落在落在范围内的概率范围内的概率为为68.27%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十二页,共73页区间估计原理区间估计原理0.9545落在落在范围内的概率范围内的概率为为95.45%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十三页,共73页区间估计原理区间估计原理 0.9973落在落在范围内的概率范围内的概率为为99.73%样本抽样分布曲线样本抽样分布
25、曲线总体分布曲线总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十四页,共73页总体平均数的区间估计总体平均数的区间估计表表达达式式其中,其中,为极限误差为极限误差统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十五页,共73页步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本标准差算样本标准差 ,即,即总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十六页,共73页步步骤骤 计算抽样平均误差计算抽样平均误差:重复抽样时重复抽样时:不重复抽样时不重复抽
26、样时:总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十七页,共73页步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十八页,共73页【例【例A A】某企业生产某种产品的工人某企业生产某种产品的工人有有10001000人,某日采用人,某日采用不重复不重复抽样从中抽样从中随机抽取随机抽取100100人调查他们的当日产量,人调查他们的当日产量,要求在要求在9595的概率保证程度下,的概率保证程度下,
27、估估计该厂全部工人的日平均产量和日计该厂全部工人的日平均产量和日总产量。总产量。总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第三十九页,共73页按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144100100名工人
28、的日产量分组资料名工人的日产量分组资料统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十页,共73页解:解:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十一页,共73页则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.802124.802至至127.198127.198件之间,其日总产量在件之间,其日总产量在124802124802至至127198127198件之件之间,估计的可靠程度为间,估计的可靠程度为9595统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四
29、十二页,共73页总体成数的区间估计总体成数的区间估计表表达达式式其中,其中,为极限误差为极限误差统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十三页,共73页步步骤骤 计算样本成数计算样本成数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;计算抽样平均误差:计算抽样平均误差:重复抽样条重复抽样条件下件下不重复抽样不重复抽样条件下条件下总体成数的区间估计总体成数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十四页,共73页步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体成数的置信区间:确定总体成数的置信区间:总体成数的区间估计总体成数的区间估计统计
30、学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十五页,共73页【例【例B B】若例若例A A中工人日产量在中工人日产量在118118件件以上者为完成生产定额任务,要求以上者为完成生产定额任务,要求在在9595的概率保证程度下,估计该的概率保证程度下,估计该厂全部工人中完成定额的工人比重及厂全部工人中完成定额的工人比重及完成定额的工人总数。完成定额的工人总数。总体成数的区间估计总体成数的区间估计统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十六页,共73页按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)1101141141181181
31、22122126126130130134134138138142112116120124128132136140371823211864合计合计100100名工人的日产量分组资料名工人的日产量分组资料完成定额完成定额的人数的人数统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十七页,共73页解:解:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十八页,共73页则该企业全部工人中完成定额的工人比则该企业全部工人中完成定额的工人比重重 及完成定额的工人总数及完成定额的工人总数 的置信的置信区间为:区间为:即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在
32、0.84510.8451至至0.95490.9549之间,完成定额的工人总数之间,完成定额的工人总数在在845.1845.1至至954.9954.9人之间,估计的可靠程度为人之间,估计的可靠程度为9595。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第四十九页,共73页样本容量样本容量调查误差调查误差调查费用调查费用小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量确定样本容量的意义确定样本容量的意义找出在限定费用找出在限定费用范围内的最大样范围
33、内的最大样本容量本容量统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十页,共73页确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。或或 S S通常未知。一般通常未知。一般按以下方法确定其估计值:按以下方法确定其估计值:过去的经验数据;过去的经验数据;试试验调查样本的验调查样本的S S。计算结果通常向上进位计算结果通常向上进位统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十一页,共73页 不重复抽样条件下:不重复抽样
34、条件下:确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十二页,共73页确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据;去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。统计学第五章统计学
35、第五章 抽样推断抽样推断你现在浏览的是第五十三页,共73页 不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十四页,共73页必要样本容量的影响因素必要样本容量的影响因素q总体方差的大小;总体方差的大小;q允许误差范围的大小;允许误差范围的大小;q概率保证程度;概率保证程度;q抽样方法;抽样方法;q抽样的组织方式。抽样的组织方式。重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十五页,共73页第四节第四
36、节 概率抽样组织方式概率抽样组织方式 抽样方案设计的基本原则抽样方案设计的基本原则随机原则随机原则抽取样本单位时,应确保每个总体抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗的资料进行搜集和整理时,不能随意遗漏或更换样本单位漏或更换样本单位 最大抽样效果原则最大抽样效果原则抽样误差最小抽样误差最小在其他条件相同的情况下,在其他条件相同的情况下,选抽样误差最小的方案选抽样误差最小的方案费用最少费用最少在其他条件相同的情况下,在其他条件相同的情况下,选费用最少的方案选费用最少的方案设计抽样方案时,通常是设计抽样方
37、案时,通常是在误差达到一定要求的条在误差达到一定要求的条件下,选择费用最少的方案件下,选择费用最少的方案你现在浏览的是第五十六页,共73页简单随机抽样简单随机抽样对总体未作任何处理的情况下,然后按随机原对总体未作任何处理的情况下,然后按随机原则直接从总体中抽出若干单位构成样本则直接从总体中抽出若干单位构成样本抽取样本的具体方法:抽取样本的具体方法:抽签法抽签法是将总体中每个单位的编号写在外形完全一是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。签上的号码所对应的单位就是样本单位。随机数表法随机
38、数表法将总体中每个单位编上号码,然后使用将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。随机数表,查出所要抽取的调查单位。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十七页,共73页应用应用仅适用于规模不大、内部各单位仅适用于规模不大、内部各单位标志值差异较小的总体标志值差异较小的总体简单随机抽样的特点简单随机抽样的特点1、直接从总体中抽取所要调查的单位,无须、直接从总体中抽取所要调查的单位,无须分组、分类、排队等处理;分组、分类、排队等处理;2、必须事先对总体中的所有单位进行编码和编、必须事先对总体中的所有单位进行编码和编号;号;3、抽取样本时不借助有关标
39、志的辅助信息、抽取样本时不借助有关标志的辅助信息4、当总体各单位村志值之间差异很大时,、当总体各单位村志值之间差异很大时,采用此方法不能保证样本的代表性。采用此方法不能保证样本的代表性。你现在浏览的是第五十八页,共73页 先将总体全部单位按某一标志分类,然后从先将总体全部单位按某一标志分类,然后从各类型中按随机原则抽取样本单位组成样本。各类型中按随机原则抽取样本单位组成样本。总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取类型抽样类型抽样实质上是实质上是分组法分组法与与随机原则随机原则的结合。的结合。例如,在居民生活水平调查中,先按职业分类,然例如,在居民生活水平调查中
40、,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。后每种职业分别随机抽取部分居民进行调查。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第五十九页,共73页类型抽样的优点:类型抽样的优点:q能提高样本的代表性;能提高样本的代表性;q能降低影响抽样平均误差的总方能降低影响抽样平均误差的总方差;差;q组织起来较为方便;组织起来较为方便;类型抽样分组的基本原则:类型抽样分组的基本原则:尽量缩小各组内标志值之间的差异,增大尽量缩小各组内标志值之间的差异,增大组间各标志值之间的差异。组间各标志值之间的差异。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十页,共73页样本在
41、各组间的分配方法:样本在各组间的分配方法:等额分配法等额分配法:每组抽取的单位数一样。:每组抽取的单位数一样。等比例分配法等比例分配法:按各组单位的比例分配样本:按各组单位的比例分配样本单位。单位。最佳分配法最佳分配法:按各组的方差大小分配样本单位。:按各组的方差大小分配样本单位。方差大的组分配较多的样本单位。方差大的组分配较多的样本单位。经济分配法:经济分配法:按各组的方差大小分配样本单位,按各组的方差大小分配样本单位,同时考虑各组抽样调查的费用。同时考虑各组抽样调查的费用。实际工作中比较常用的是实际工作中比较常用的是等比例分等比例分配法。配法。统计学第五章统计学第五章 抽样推断抽样推断你现
42、在浏览的是第六十一页,共73页类型抽样的抽样平均误差类型抽样的抽样平均误差一、抽样平均数一、抽样平均数二、抽样成数二、抽样成数统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十二页,共73页【例】某市有【例】某市有250家商店,分大中小三类,现从中等比家商店,分大中小三类,现从中等比例抽出例抽出50家进行销售额调查,所得资料如下家进行销售额调查,所得资料如下分层分层各层各层商店商店数数Ni层权层权Wi各层各层抽取抽取数数ni各层销售各层销售额样本均额样本均值值(万元万元)样本方样本方差差(万万元元)大型商店大型商店中型商店中型商店小型商店小型商店25751500.10.30.651
43、53017008001202800698510850合计合计2501.050 _ _以以95.45%95.45%的概率保证程度估计该市所有商店的平的概率保证程度估计该市所有商店的平均销售额。均销售额。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十三页,共73页根据题意知:根据题意知:N=250,W1=0.1,W2=0.3,W3=0.6,f1=f2=f3=0.2,1-=95.45%,t=2总体均值的点估计值为:总体均值的点估计值为:抽样标准误差为:抽样标准误差为:总体均值的区间估计为:总体均值的区间估计为:3822*11.9=358.2万元,405.8万元解:解:统计学第五章统计
44、学第五章 抽样推断抽样推断你现在浏览的是第六十四页,共73页首先将总体各单位按某一标志排队,然后按固首先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。又称定的顺序和间隔抽取样本单位。又称机械抽机械抽样样或或系统抽样系统抽样。等距抽样等距抽样等距抽样是不重复抽样,适合于对单位数不多且等距抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。能进行排序的总体抽样。按无关标按无关标志排队志排队按有关标按有关标志排队志排队总体单位的排列顺序和所研究的标志数值大总体单位的排列顺序和所研究的标志数值大小是无关的。如小是无关的。如调查居民生活水平时,按调查居民生活水平时,按姓氏笔划排
45、队姓氏笔划排队。总体单位的排列顺序和所研究的标志数总体单位的排列顺序和所研究的标志数值大小有密切关系。如值大小有密切关系。如居民收入调查,居民收入调查,按银行存款高低排序按银行存款高低排序。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十五页,共73页根据样本抽选的方法不同,可分为:根据样本抽选的方法不同,可分为:随机起点等距抽样随机起点等距抽样半距起点等距抽样半距起点等距抽样对称起点等距抽样对称起点等距抽样(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)统计学第五章统计学
46、第五章 抽样推断抽样推断你现在浏览的是第六十六页,共73页按无关标志排队的等距抽样,可按不重复抽样下的按无关标志排队的等距抽样,可按不重复抽样下的简单随机抽样简单随机抽样来计算;来计算;按有关标志排队的等距抽样,可按按有关标志排队的等距抽样,可按类型抽样类型抽样来来计算。计算。等距抽样的抽样平均误差等距抽样的抽样平均误差等距抽样的抽样平均误差估计比较复杂。等距抽样的抽样平均误差估计比较复杂。一般按以下方法近似计算。一般按以下方法近似计算。统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十七页,共73页将总体全部单位分为若干将总体全部单位分为若干“群群”,然后以群作为,然后以群作为抽
47、样单位,从总体中抽取若干群作为样本,并对抽样单位,从总体中抽取若干群作为样本,并对中选群的所有单位进行全面调查。中选群的所有单位进行全面调查。例:总体群数例:总体群数R=16 样本群数样本群数r=4ABCDEFGHIJKLMNOPIHPD样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差整群抽样整群抽样统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十八页,共73页整群抽样的抽样平均误差整群抽样的抽样平均误差1、抽样平均数的平均误差、抽样平均数的平均误差2、抽样成数的平均误差、抽样成数的平
48、均误差统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第六十九页,共73页例例:对灯泡质量进行抽样检查,每隔:对灯泡质量进行抽样检查,每隔5小时,抽出小时,抽出6分种产品分种产品进行全面检测,共抽取进行全面检测,共抽取25批,测得平均照明时间为批,测得平均照明时间为935小时,小时,样本标准差为样本标准差为50小时,试以小时,试以68.27%的概率保证程度估计全的概率保证程度估计全部灯泡的平均照明时间。部灯泡的平均照明时间。解:由题意知:解:由题意知:抽样标准误差为:抽样标准误差为:全部灯泡的平均照明时间的区间估计为:全部灯泡的平均照明时间的区间估计为:9359.90小时小时统计学第五
49、章统计学第五章 抽样推断抽样推断你现在浏览的是第七十页,共73页先通过抽取若干级中间组全单位,最后再来抽先通过抽取若干级中间组全单位,最后再来抽取基本调查单位的抽样组织形式。取基本调查单位的抽样组织形式。例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查农户调查农户生产性投资情况。户生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100个村中各抽个村中各抽10
50、户户样本样本n=10010=1000(户户)多阶段抽样多阶段抽样统计学第五章统计学第五章 抽样推断抽样推断你现在浏览的是第七十一页,共73页多阶段抽样多阶段抽样多阶段抽样的适用范围多阶段抽样的适用范围多阶段抽样具有整群抽样的优点,同时还多阶段抽样具有整群抽样的优点,同时还可用于:可用于:1、当抽样调查的面积很广或者总体、当抽样调查的面积很广或者总体范围太大无法直接抽取样本时;范围太大无法直接抽取样本时;2、可以相对地节约人力物力;、可以相对地节约人力物力;3、对那些基本单位数多且分散的总体,、对那些基本单位数多且分散的总体,可使抽样工作大大简化。可使抽样工作大大简化。统计学第五章统计学第五章