《抽样推断-课件.ppt》由会员分享,可在线阅读,更多相关《抽样推断-课件.ppt(125页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样估计的现实应用抽样估计的现实应用例例1 一汽车轮胎制造商生产一种被认为一汽车轮胎制造商生产一种被认为寿命更寿命更长的新型轮胎长的新型轮胎。120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占全部选民的比例:160/400=40%例例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制:第七章第七章 抽样推断抽样推
2、断第一节第一节 抽样推断的基础理论抽样推断的基础理论第二节第二节 抽样误差抽样误差第三节第三节 抽样估计抽样估计第四节第四节 样本容量的确定样本容量的确定第一节第一节 抽样估计的意义抽样估计的意义一、抽样估计的定义一、抽样估计的定义二、抽样估计的特点二、抽样估计的特点三、抽样估计的运用三、抽样估计的运用四、抽样估计的一般步骤四、抽样估计的一般步骤指样本单位的抽取不受主指样本单位的抽取不受主观因素及其他系统性因素观因素及其他系统性因素的影响,每个总体单位都的影响,每个总体单位都有均等的被抽中机会有均等的被抽中机会抽样估计抽样估计按照按照随机原则随机原则 从调查对象中抽取一部分从调查对象中抽取一部
3、分单位进行调查,并以调查结果对总体数单位进行调查,并以调查结果对总体数量特征作出量特征作出具有一定可靠程度具有一定可靠程度的估计与的估计与推断,从而推断,从而认识总体认识总体的一种统计方法的一种统计方法统计推断统计推断全及总体指标:全及总体指标:参数(未知量)参数(未知量)样本总体指标:样本总体指标:统统计量(已知量)计量(已知量)抽样估计抽样估计并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样总体总体随机样本随机样本非随机样本非随机样本与总体分布与总体分布特征相同特征相同与总体分布与总体分布特征不同特征不同q按随机原则抽取样本单位按
4、随机原则抽取样本单位q目的是推断总体的数量特征目的是推断总体的数量特征q抽样推断的结果具有一定的可靠程度,抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样估计的特点抽样估计的特点q不可能进行全面调查时不可能进行全面调查时q不必要进行全面调查时不必要进行全面调查时q来不及进行全面调查时来不及进行全面调查时q对全面调查资料进行补充修正时对全面调查资料进行补充修正时抽样估计的适用范围抽样估计的适用范围设设计计抽抽样样方方案案抽抽取取样样本本单单位位收收集集样样本本数数据据计计算算样样本本统统计计量量推推断断总总体体参参数数抽样估计的一般步骤抽样估计的一般步骤
5、第二节第二节 抽样调查的基本概念及抽样调查的基本概念及理论依据理论依据一、全及总体和抽样总体一、全及总体和抽样总体二、全及指标和抽样指标二、全及指标和抽样指标三、抽样方法和样本的可能数目三、抽样方法和样本的可能数目四、四、抽样调查的理论依据抽样调查的理论依据全及总体全及总体研究对象的全体,即第一章中研究对象的全体,即第一章中学过的总体。学过的总体。抽样总体抽样总体 按随机原则从全及总体中抽取一按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样部分单位组成的集合体,又叫抽样总体。总体。样本总体中所包括的单位数叫样本容量,样本总体中所包括的单位数叫样本容量,一般用一般用n n表示表示1 1
6、、大样本(、大样本(n30 2n30 2、小样本、小样本(n30(n30)全及总体中所包括的单位数一般用全及总体中所包括的单位数一般用N表示。表示。1、有限总体有限总体 2、无限总体、无限总体设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则 总体平均数(又叫总体均值):总体平均数(又叫总体均值):指被估计的总体指标,又被指被估计的总体指标,又被称为称为总体参数总体参数全及指标全及指标 总体标准差:总体标准差:总体方差:总体方差:总体成数:总
7、体成数:总体是非标志的标准差:总体是非标志的标准差:总体是非标志的方差:总体是非标志的方差:设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则 样本平均数(又叫样本均值):样本平均数(又叫样本均值):指根据样本单位的标志值计算的用指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合以估计和推断相应总体指标的综合指标,又被称为指标,又被称为估计量或统计量估计量或统计量样本指标样本指标 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志
8、值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计为 的无偏估计 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:为 的无偏估计为 的无偏估计当样本容量很大时,当样本容量很大时,1/n,与与1/(n-1)相差不相差不大,样本方差的分式,可以直接除以大,样本方差的分式,可以直接除以n,与总本的方差计算分式保持一致。与总本的方差计算分式保持一致。例例3:某大公司人事部经理整理其某大公司人事部经理整理其2500个中层干部个中层干部的档案。其中一项内容是考察这些中层干部的的档案。其中一项内容是考察这些中层干部的平均年薪
9、平均年薪及及参加过公司培训计划的比例参加过公司培训计划的比例。总体:总体:2500名中层干部名中层干部 如果:如果:上述情况可由每个人的个人档案中得知,上述情况可由每个人的个人档案中得知,可容易地测出这可容易地测出这2500名中层干部的平均年薪及名中层干部的平均年薪及标准差。标准差。假如假如:1:已经得到了如下的结果:总体均值总体均值:=51800 总体标准差总体标准差:=4000 参数参数是总体的是总体的数值特征数值特征 上述上述总体均值总体均值、总体标准差总体标准差、比例比例均称为总均称为总体的体的参数参数 2、同时,有1500人参加了公司培训,则则参加公司培训计划的参加公司培训计划的比例
10、比例为:为:P=1500/2500=0.60如:如:例3中的中层干部平均年薪平均年薪,年薪标准差年薪标准差及受培训受培训人数所占比例人数所占比例均为该公司中层干部这一总体的参数。抽样估计抽样估计就是要通过样本而非总体来估计总体参数就是要通过样本而非总体来估计总体参数。假如随机抽取了一个容量为30的样本:工资工资 是否参加培训是否参加培训 49094.3 Yes 53263.9 Yes 49643.5 Yes 假如假如根据该样本求得的根据该样本求得的年薪样本年薪样本平均数平均数、标标准差准差及及参加过培训计划人数的参加过培训计划人数的比例比例分别为:分别为:抽样方法抽样方法重复抽样重复抽样又被称
11、作重置抽样、有放回抽样又被称作重置抽样、有放回抽样继续继续抽取抽取抽出抽出个体个体登记登记特征特征放回放回总体总体特点特点同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行而且每次抽取都是独立进行不重复抽样不重复抽样又被称作不重置抽样、不放又被称作不重置抽样、不放回抽样回抽样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体中每个单位被抽中的机会并同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不均等,在连续抽取时,每次抽取都不是独立进行不是独立进行是最为常用的抽样方法,用于无限总是最为常用的抽样方法,用于无限总体和许多有限总体样
12、本单位的抽样。体和许多有限总体样本单位的抽样。抽样方法抽样方法对样本的对样本的要求不同要求不同考虑顺序的抽样考虑顺序的抽样 ABBA不考虑顺序的抽样不考虑顺序的抽样 AB=BA两种分两种分类交叉类交叉考虑顺序的重复抽样考虑顺序的重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样例:从例:从A、B、C、D四个工人中随机抽取四个工人中随机抽取二人组成一样本,可能的样本是:二人组成一样本,可能的样本是:考虑顺序的重复抽样考虑顺序的重复抽样 考虑顺序的不重复抽样考虑顺序的不重复抽样AA AB AC AD AA AB AC
13、 AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD 不考虑顺序的重复抽样不考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑顺序的不重复抽样AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD 第八章第八章 抽样推断抽样推断1.1 抽样方案的设计抽样方案的设计1.2 简单随机抽样的抽样误差的测定简单随机抽样的抽样误差的测定1.3 简单随机抽样的抽样估计简单随机抽样的
14、抽样估计一、抽样误差的概念一、抽样误差的概念二、抽样平均误差二、抽样平均误差三、抽样极限误差三、抽样极限误差第三节 抽样平均误差抽样平均误差说说明明q对于任何一个样本,对于任何一个样本,其抽样误其抽样误差都不可能测量出来差都不可能测量出来q抽样误差的大小可以依据概率抽样误差的大小可以依据概率分布理论加以说明分布理论加以说明指样本估计量与总体参数之间数量指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不抽取样本而产生的代表性误差,不包括登记性误差和系统偏差包括登记性误差和系统偏差抽样误差抽样误差某个样本某个样本容量的抽容量的抽
15、样分布样分布更大样本更大样本容量的抽容量的抽样分布样分布抽样平均抽样平均误差误差根据所有可能样本的样平均数或根据所有可能样本的样平均数或样本成数计算的标准差,即每一样本成数计算的标准差,即每一次抽样的样本指标和总体指标之次抽样的样本指标和总体指标之间的平均差异程度。间的平均差异程度。即样本估计即样本估计量的标准差量的标准差式中:式中:为样本平均数的抽样平均误差;为样本平均数的抽样平均误差;为为可能的样本数目;可能的样本数目;为第为第 个可能样本的平均个可能样本的平均数;数;为总体平均数为总体平均数注意:不要混淆抽样注意:不要混淆抽样平均误差与样本标准差!平均误差与样本标准差!例:有例:有4个工
16、人,月产量分别为个工人,月产量分别为40,50,70,80,这一总体平均数和标准差为:,这一总体平均数和标准差为:总体平均数总体平均数标标准准差差现用重复抽样的方法从现用重复抽样的方法从4 4人中抽取人中抽取2 2人构成样本,求样本的平均数,用以代表人构成样本,求样本的平均数,用以代表4 4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:人总体的平均水平,所有可能的样本及样本的平均工资列表如下:序号序号样本变量样本变量样本平均数样本平均数平均数离差平均数离差离差平方离差平方(1)(2)1404040-204002405045-152253407055-5254408060005504
17、045-152256505050-1010075070600085080655259704055-52510705060001170707010100127080751522513804060001480506552515807075152251680808020400合计合计-960-2000样本平均数的平均数:样本平均数的平均数:抽样平均误差抽样平均误差抽样平均误差的计算公式抽样平均误差的计算公式 样本平均数的抽样平均误差样本平均数的抽样平均误差当N500时,有重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:样本成数的抽样平均误差样本成数的抽样平均误差重复抽样时:重复抽样时:不重复抽样
18、时:不重复抽样时:当N500时,有抽样平均误差的计算公式抽样平均误差的计算公式关于总体方差的估计方法关于总体方差的估计方法q用过去同类问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;q用样本标准差用样本标准差 代替总体标准差代替总体标准差 ,用,用 代替代替 。抽样平均误差的计算公式抽样平均误差的计算公式影响抽样误差的因素影响抽样误差的因素q总体各单位的差异程度(即标准差总体各单位的差异程度(即标准差的大小):的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误越大,抽样误差越小;差越小;q抽样方法:抽样方法
19、:不重复抽样的抽样误差不重复抽样的抽样误差比重复抽样的抽样误差小;比重复抽样的抽样误差小;q抽样组织方式:抽样组织方式:简单随机抽样的误简单随机抽样的误差最大。差最大。练习练习1、对某乡进行简单重复抽样调查,抽出、对某乡进行简单重复抽样调查,抽出100个农户,个农户,户均年收入户均年收入2000元,年收入标准差元,年收入标准差100元,求抽样平元,求抽样平均误差。若抽取的是均误差。若抽取的是200户,则抽样平均误差以是多户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应少。若要使抽样平均误差降低为原来的一半,则应抽多少户。抽多少户。2、对某县人口用不重复抽样方法按、对某县人口
20、用不重复抽样方法按1/10比例抽出比例抽出1万人进行调查,得知样本平均年龄万人进行调查,得知样本平均年龄40岁,年龄标准岁,年龄标准差差20岁,求抽样平均误差。岁,求抽样平均误差。3、某县人口、某县人口10万人,用简单随机不重复抽样方法抽万人,用简单随机不重复抽样方法抽取取1/10的人口进行调查,得知男性人口比重为的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平均误差。,求男性人口比重的抽样平均误差。4、对某乡进行简单随机重复抽样调查,抽出、对某乡进行简单随机重复抽样调查,抽出100个个农户进行调查,得知年收入在农户进行调查,得知年收入在1800元以上的占元以上的占95%,求农
21、户年收入在,求农户年收入在1800元以上比重的抽样平均误差。元以上比重的抽样平均误差。抽样极限抽样极限误差误差指在一定的概率保证程度下,指在一定的概率保证程度下,抽样误差不允许超过的某一抽样误差不允许超过的某一给定范围,也称作给定范围,也称作允许误差、允许误差、误差范围、误差置信限误差范围、误差置信限等等注意:注意:1、统计学上往往用、统计学上往往用抽样极限误差抽样极限误差来测度抽样误差来测度抽样误差的大小或者说测度点估计的精度。的大小或者说测度点估计的精度。原因:原因:总体参数值往往并不知道,因此,总体参数值往往并不知道,因此,实际抽实际抽样误差样误差与与抽样平均误差抽样平均误差也往往无法求
22、出,但在抽样分也往往无法求出,但在抽样分布大体知道的情况下,布大体知道的情况下,抽样极限误差抽样极限误差是可以估计出来是可以估计出来的。的。2、抽样极限误差的估计总是要和一定的概率保、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。证程度联系在一起的。原因:原因:样本统计量往往是一随机变量,它与总体样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。事件,而只能给予一定的概率保证。因此,因此,在
23、进行抽样估计时,既需要考虑抽样误在进行抽样估计时,既需要考虑抽样误差的差的可能范围可能范围,同时还需考虑落到这一范围的,同时还需考虑落到这一范围的概率概率大小大小。前者是前者是估计的准确度估计的准确度问题,后者是问题,后者是估计的可靠估计的可靠性性问题,两者紧密联系不可分开。这也正是区间估问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。计所关心的主要问题。平均产量的分布如下:平均产量的分布如下:样本平均数样本平均数404550556065707580频数频数121242121频率频率1/162/161/162/164/162/161/162/161/16 实际计算中一般不直接计算
24、概率保证程度,实际计算中一般不直接计算概率保证程度,由于由于 ,样本平均数的样本平均数的极限误差:极限误差:样本成数的极样本成数的极限误差:限误差:所以抽样极限误差是概率度所以抽样极限误差是概率度t的函数的函数t t为概率度,是给定概率保证程度下样本均值为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。偏离总体均值的抽样平均误差的倍数。据中心极限定理,当总体为正态或总体非据中心极限定理,当总体为正态或总体非正态但正态但n30时,样本均值的分布趋近于正态分时,样本均值的分布趋近于正态分布;布;当当n足够大时,样本成数的分布近似为正态足够大时,样本成数的分布近似为正态分布。分
25、布。令令平均数的抽样分布平均数的抽样分布q全部可能样本平均数的均值等于总体均值,全部可能样本平均数的均值等于总体均值,即:即:q从非正态总体中抽取的样本平均数当从非正态总体中抽取的样本平均数当n n足够足够大时其分布接近正态分布。大时其分布接近正态分布。q从正态总体中抽取的样本平均数不论容量从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。大小其分布均为正态分布。q样本均值的标准差为总体标准差的样本均值的标准差为总体标准差的 成数的抽样分布成数的抽样分布q全部可能样本成数的均值等于总体比率,全部可能样本成数的均值等于总体比率,即:即:q从非正态总体中抽取的样本成数,当从非正态总体中抽
26、取的样本成数,当n n足足够大时其分布接近正态分布。够大时其分布接近正态分布。q从正态总体中抽取的样本成数,不论容量从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。大小其分布均为正态分布。q样本成数的标准差为总体标准差的样本成数的标准差为总体标准差的样本抽样分布样本抽样分布原总体分布原总体分布t与相应的概率保证程度存在一一对应关系,与相应的概率保证程度存在一一对应关系,常用常用t值及相应的概率保证程度为:值及相应的概率保证程度为:t值值 概率保证程度概率保证程度1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3
27、.00 0.9973在实际中,一般将这种对应函数关系在实际中,一般将这种对应函数关系编成编成正态概率表正态概率表供直接查用供直接查用(大样本条件下)(大样本条件下)68.27%95.45%99.73%估计的准确度估计的准确度和估计的可靠性估计的可靠性问题 由于提高把握程度,会增大允许误差,由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,使估计精度降低,而缩小允许误差,提提高估计的精度,又会降低估计的把握程高估计的精度,又会降低估计的把握程度,度,所以在实际中应根据具体情况,先所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允确定一个合理的把握程度再求相应的允许误
28、差或先确定一个允许误差范围再求许误差或先确定一个允许误差范围再求相应的把握程度。相应的把握程度。抽样估计量的优良标准抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第四节第四节 全及指标的推断全及指标的推断若,则称为比更有效的估计量若,则称为比更有效的估计量作为优良的估计量,除了满足无偏作为优良的估计量,除了满足无偏性的要求外,其方差应比较小性的要求外,其方差应比较小有效性有效性指随着样本
29、单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性抽样估计量的优良标准抽样估计量的优良标准 若对于任意若对于任意0,有,有q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计量的优良标准抽样估计量的优良标准点估计点估计指直接以样本指标来估计总指直接以样本指标来估计总体指标,也叫体指标,也叫定值估计定值估计简单,具体明确简单,具体明确优点优点
30、缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况区间估计区间估计指根据样本指标和抽样极限误差以一指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限围;其中,被推断的总体指标的下限与上限所包括的区间称为与上限所包括的区间称为置信区间置信区间,估计的可靠程度也称为估计的可靠程度也称为置信度。置信度。(这里只讨论常用的大样本的情况)(这里只讨论常用的大样本的情况)区间估计原理区间估计原理0.6827落在落在范围内的概率范围内的概率为为68.
31、27%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线区间估计原理区间估计原理0.9545落在落在范围内的概率范围内的概率为为95.45%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线区间估计原理区间估计原理 0.9973落在落在范围内的概率范围内的概率为为99.73%样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线总体分布曲线总体分布曲线总体分布曲线总体分布曲线总体平均数的区间估计总体平均数的区间估计表表达达式式其中,其中,为极限误差为极限误差步步骤骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本标
32、准差算样本标准差 ,总体平均数的区间估计总体平均数的区间估计 计算抽样平均误差:计算抽样平均误差:重复抽样时重复抽样时不重复抽样时:不重复抽样时:步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计总体成数的区间估计总体成数的区间估计表表达达式式其中,其中,为极限误差为极限误差步步骤骤 计算样本成数计算样本成数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;计算抽样平均误差:计算抽样平均误差:重复抽样条重复抽样条件下件下不重复抽不重复抽样条件下样条件下总体成数的区间估计总体成数的区间估计步步骤骤 计算抽样
33、极限误差:计算抽样极限误差:确定总体成数的置信区间:确定总体成数的置信区间:总体成数的区间估计总体成数的区间估计1、按照质量要求,灯、按照质量要求,灯泡使用寿命在泡使用寿命在1000小时小时以上为合格品试,以以上为合格品试,以95.45%的概率保证度估的概率保证度估计该批灯泡的耐用时数计该批灯泡的耐用时数和合格率;和合格率;2、试以、试以99%的概率保的概率保证程度估计计该批灯泡证程度估计计该批灯泡的而用时数和合格率。的而用时数和合格率。使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-110084110
34、0-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机不重复抽取机不重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)时)组中值组中值 灯泡数灯泡数(个)(个)900以下以下8758752 2175017506624866248900-9509259254 4370037006969669696950-10009759751111107251072573964739641000-1050102510257171727757277572704
35、727041050-1100107510758484903009030027216272161100-1150112511251818202502025083232832321150-1200117511757 78225822597468974681200以上以上122512253 3367536758467284672合计合计200200211400211400575200575200 因此,该批灯泡的使用寿命在因此,该批灯泡的使用寿命在1049.49-1064.51之间,其概率保证之间,其概率保证度为度为95.45%使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下
36、2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-12007 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在87.6%-95.4%之间,其之间,其概率保证度为概率保证度为95.45%1、若允许的误差范围若允许的误差范围为为10小时小时,试估计该批,试估计该批灯泡的耐用时数;灯泡的耐用时数;2、按照质量要求,灯、按照质量要求,灯泡使用寿命在泡使用寿命在1000小时小时以上为合格品,以上为合格品,要求合要求合格率误差不超过格率误差不超过3%,试估计该批灯泡的合格试估
37、计该批灯泡的合格率。率。使用时间(小使用时间(小时)时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机重复抽取机重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)时)组中值组中值 灯泡数灯泡数 (个)(个)900以下以下8758752 2175017506624866248900-9509259254 437
38、0037006969669696950-10009759751111107251072573964739641000-1050102510257171727757277572704727041050-1100107510758484903009030027216272161100-1150112511251818202502025083232832321150-1200117511757 78225822597468974681200以上以上122512253 3367536758467284672合计合计200200211400211400575200575200因此,该批灯泡的使用寿命在因
39、此,该批灯泡的使用寿命在1047-1067之之间,其概率保证度为间,其概率保证度为99.17%使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-12007 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在88.5%-94.5%之间,其之间,其概率保证度为概率保证度为87.15%作业:作业:某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不重复抽样从中随机抽取人,
40、某日采用不重复抽样从中随机抽取100100人调查他们的当日产量,要求:人调查他们的当日产量,要求:1 1、在、在9595的概率保证程度下,的概率保证程度下,估计该厂全估计该厂全部工人的日平均产量和日总产量部工人的日平均产量和日总产量。2 2、若工人日产量在、若工人日产量在118118件以上者为完成生件以上者为完成生产定额任务,要求在产定额任务,要求在9595的概率保证程度的概率保证程度下,下,估计该厂全部工人中完成定额的工人估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。比重及完成定额的工人总数。按按 日产量分组(件)日产量分组(件)组中值(件)组中值(件)工人数(人)工人数(人)1
41、10114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100100100名工人的日产量分组资料名工人的日产量分组资料按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计1
42、00126004144100100名工人的日产量分组资料名工人的日产量分组资料解:解:则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件之间,其日总产量在件之间,其日总产量在124797124797至至127303127303件之间,估计的可靠程度为件之间,估计的可靠程度为9595。按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)11011411411811812212212612613013013413413
43、8138142112116120124128132136140371823211864合计合计100100名工人的日产量分组资料名工人的日产量分组资料完成定额完成定额的人数的人数解:解:则该企业全部工人中完成定额的工人比则该企业全部工人中完成定额的工人比重重 及完成定额的工人总数及完成定额的工人总数 的置信的置信区间为:区间为:即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在0.84320.8432至至0.95680.9568之间,完成定额的工人之间,完成定额的工人总数在总数在843.2843.2至至956.8956.8人之间,估计的可人之间,估计的可靠程度为靠程度为959
44、5。样本容量样本容量调查误差调查误差调查费用调查费用小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量确定样本容量的意义确定样本容量的意义找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。或或 S S通常未知。一般通常未知。一般按以下方法确定
45、其估计按以下方法确定其估计值:值:过去的经验数据;过去的经验数据;试验调查样本的试验调查样本的S S。计算结果通常向上进位计算结果通常向上进位 不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量【例例A A】某食品厂要检验本月生产某食品厂要检验本月生产的的1000010000袋某产品的重量,根据上袋某产品的重量,根据上月资料,这种产品每袋重量的标准月资料,这种产品每袋重量的标准差为差为2525克。要求在克。要求在95.4595.45的概率的概率保证程度下,平均每袋重量的误差保证程度下,平均每袋重量的误差范围不超过范围不超过5 5克,应抽
46、查多少袋产克,应抽查多少袋产品?品?解:解:确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据;去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量【例例B】某企业对一批总数
47、为某企业对一批总数为5000件的件的产品进行质量检查,过去几次同类调查产品进行质量检查,过去几次同类调查所得的产品合格率为所得的产品合格率为93、95、96,为了使合格率的允许误差不超过为了使合格率的允许误差不超过3,在,在99.73 的概率保证程度下,应抽查多少的概率保证程度下,应抽查多少件产品?件产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。解:解:必要样本容量的影响因素必要样本容量的影响因素q总体方差的大小;总体方差的大小;q允许误差范围的大小;允许误差范
48、围的大小;q概率保证程度;概率保证程度;q抽样方法;抽样方法;q抽样的组织方式。抽样的组织方式。重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:抽样复查的方法抽样复查的方法其全面调查时的登记其全面调查时的登记其全面调查时的登记其全面调查时的登记结果为结果为结果为结果为2.28612.2861亿元亿元亿元亿元其抽样复查的结果为其抽样复查的结果为其抽样复查的结果为其抽样复查的结果为2.17342.1734亿元亿元亿元亿元随机抽取随机抽取随机抽取随机抽取五个下属单位五个下属单位五个下属单位五个下属单位修正系数为 则:则:该企业集团所拥有的固定资产原值应为16.8510.9507=
49、16.020(亿元)(亿元)所拥有固定资产所拥有固定资产原值的普查结果为原值的普查结果为16.851亿元亿元某企业集团某企业集团总体总体第五节 抽样方案的设计抽样方案的设计一、抽样方案设计的基本准则一、抽样方案设计的基本准则二、抽样方案设计的主要内容二、抽样方案设计的主要内容 随机原则随机原则抽取样本单位时,应确保每个总体单位都抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位集和整理时,不能随意遗漏或更换样本单位 抽样误差最小抽样误差最小在其他条件相同的情况下,选抽样误差在其他条件相同的情
50、况下,选抽样误差最小的方案最小的方案 费用最少费用最少在其他条件相同的情况下,选费用最少在其他条件相同的情况下,选费用最少的方案的方案设计抽样方案时,通常是设计抽样方案时,通常是在误差达到一定要求的条在误差达到一定要求的条件下,选择费用最少的方案件下,选择费用最少的方案抽样方案设计的基本准则抽样方案设计的基本准则第五节 抽样方案的设计抽样方案的设计一、抽样方案设计的基本准则一、抽样方案设计的基本准则二、抽样方案设计的主要内容二、抽样方案设计的主要内容抽样框抽样框指包括全部抽样单位的名单框架,指包括全部抽样单位的名单框架,仅对有限总体而言仅对有限总体而言主主要要形形式式名单抽样框名单抽样框区域抽