《第四章抽样及抽样分布精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章抽样及抽样分布精选PPT.ppt(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章抽样及抽样分布1 1第1页,此课件共43页哦学习目标n n抽样推断n n抽样调查的组织方式和抽样方法n n抽样误差n n抽样估计n n样本容量的确定2 2第2页,此课件共43页哦第一节 抽样推断概述n n抽样调查按照随机性原则,从全部研究对象中抽取一部分单位进行观察的一种非全面性调查n n抽样推断在抽样调查的基础上,依据所获得的数据对全部研究对象的数量特征作出具有一定可靠性的估计和判断,从而达到对研究整体认识的一种统计分析方法3 3第3页,此课件共43页哦抽样推断的特点n n目的是由部分来估计和判断整体n n抽样推断是建立在随机抽样的基础之上的n n运用概率估计的方法,其误差不仅可以事先
2、计算,而且可以控制4 4第4页,此课件共43页哦抽样推断的作用n n在无法进行全面调查或进行全面调查有困难的时候,可以运用抽样调查来推断总体n n采用抽样调查,可以节省费用和时间,提高调查的时效性和经济效果n n可以用来对全面资料做检验和修正n n可以用于工业生产过程的质量控制n n可以对某种总体的假设进行检验,来判断这种假设是否正确以决定行动的取舍5 5第5页,此课件共43页哦几个基本的概念n n总体中国计量学院所有学生的身高总体,杭州所有居民的收入总体,金融资产收益总体n n样本从中国计量学院随机抽取的200个学生的身高随机抽取的1000个杭州居民的收入观察到的金融资产的收益6 6第6页,
3、此课件共43页哦总体指标和样本指标7 7第7页,此课件共43页哦样本容量和样本个数n n样本容量一个样本中所包含的单位数nn n样本个数从总体中可能抽取或可能构成的样本的数目8 8第8页,此课件共43页哦第二节 抽样中常用的分布及定理9 9第9页,此课件共43页哦第二节 抽样调查的组织方式和方法1010第10页,此课件共43页哦1111第11页,此课件共43页哦1212第12页,此课件共43页哦1313第13页,此课件共43页哦1414第14页,此课件共43页哦1515第15页,此课件共43页哦抽样方法和样本可能数目n n考虑顺序的不重复抽样数目n n考虑顺序的重复抽样数目n n不考虑顺序的不
4、重复抽样数目n n不考虑顺序的重复抽样数目1616第16页,此课件共43页哦统计学的分析思路统计学的分析思路 总体总体population样本样本samplesamplinginferring1717第17页,此课件共43页哦变 异“世界上没有两片完全相同的叶子世界上没有两片完全相同的叶子”-植物学家植物学家 “世界的丰富多彩来源于其多样性世界的丰富多彩来源于其多样性”-哲学家哲学家“个体差异是生物医学领域里普遍存在的现象个体差异是生物医学领域里普遍存在的现象”-医学家医学家统计学就是研究统计学就是研究变异(变异(variation)的科学。的科学。1818第18页,此课件共43页哦抽样误差
5、变变 异异 -抽样误差抽样误差 (variation)-(sampling error)联系联系?1919第19页,此课件共43页哦抽样实验例例1 1:假定某地正常成年男子的红细胞计数服从正假定某地正常成年男子的红细胞计数服从正态分布态分布N N(5.00(5.00,0.500.502 2)的总体,单位的总体,单位10101212/L L。用计。用计算机模拟从该总体中随机抽样,每次抽算机模拟从该总体中随机抽样,每次抽1010例组成例组成一个样本,重复一个样本,重复100100次抽样。结果见表次抽样。结果见表1 1。2020第20页,此课件共43页哦抽样实验表表1 1 正常成年男子红细胞计数抽样
6、实验结果正常成年男子红细胞计数抽样实验结果样本样本样本样本号号号号红细胞计数红细胞计数红细胞计数红细胞计数S S1 15.595.595.115.114.264.265.115.114.744.74 5.555.555.045.040.440.442 24.654.654.654.655.595.595.705.704.464.46 5.325.325.035.030.520.523 34.564.564.874.875.215.214.534.534.534.53 4.234.234.714.710.330.334 44.084.084.734.734.844.844.884.884.654
7、.65 5.335.334.664.660.460.46 :1001005.165.164.494.495.265.265.025.024.644.64 4.564.564.904.900.290.292121第21页,此课件共43页哦抽样实验总体总体2222第22页,此课件共43页哦抽样误差由于事物间普遍存在着由于事物间普遍存在着变异变异,由此产生,由此产生了这么一个现象:了这么一个现象:由于抽样而引起的误差由于抽样而引起的误差 抽样误差抽样误差2323第23页,此课件共43页哦抽样误差 定义:定义:抽样误差(抽样误差(sampling errorsampling error):):是指由于
8、是指由于样样本的随机性本的随机性引起的统计量与参数的差别,或同一引起的统计量与参数的差别,或同一总体的相同统计量之间的差别。总体的相同统计量之间的差别。2424第24页,此课件共43页哦了解抽样误差规律的重要性总体同质个体、个体变异同质个体、个体变异总体参数未知样本代表性、抽样误差代表性、抽样误差随机随机抽样抽样样本统计量已知统计推统计推断断风风 险险2525第25页,此课件共43页哦均值的模拟试验n n考察:样本均值的均值与总体均值有何关系?样本均值的标准差与总体标准差有何关系?样本均值的分布形状如何?不同的样本含量对上述性质的影响如何?2626第26页,此课件共43页哦正态分布样本均值的分
9、布样样本本编编号号n n=4=4样样本本均均值值样样本本标标准差准差最小最小值值最大最大值值抽抽样样误误差差1 198989898104104979799.499.42.92.99797104104-0.6-0.62 299999898100100959597.897.81.71.79595100100-2.2-2.23 31031031091091091099595104.1104.16.16.195951091094.14.14 493939494999910010096.496.43.13.19393100100-3.6-3.65 51041041051059090106106101.2
10、101.26.46.490901061061.21.26 61041049292103103838395.695.68.68.68383104104-4.4-4.47 799991071079494979799.499.44.94.99494107107-0.6-0.68 81001001031039696929297.997.94.14.19292103103-2.1-2.19 9929297979494949494.394.31.91.992929797-5.7-5.710101001001021029595979798.298.22.82.89595102102-1.8-1.8从从从从N
11、 N(100,6(100,62 2)中随机抽样,样本含量为中随机抽样,样本含量为中随机抽样,样本含量为中随机抽样,样本含量为4 4的的的的 10 10份独立样本的份独立样本的份独立样本的份独立样本的均值、标准差、抽样误差均值、标准差、抽样误差均值、标准差、抽样误差均值、标准差、抽样误差2727第27页,此课件共43页哦样本均值的均值和标准差2828第28页,此课件共43页哦从从N N(100,6(100,62 2)中随机抽样,样本含量为中随机抽样,样本含量为4 4的的10001000个样本均值的频数分布图个样本均值的频数分布图0 0.05.05.1.1.15.1580.080.090.090.
12、0100.0100.0110.0110.0120.0120.0Sample MeanSample Mean正态总体分布正态总体分布样本均值服从正态分布样本均值服从正态分布2929第29页,此课件共43页哦 Sampling Sampling DistributionDistributionof sample meansof sample meansSampling Sampling DistributionDistributionof sample meansof sample means Sampling DistributionSampling Distributionof sample
13、meansof sample meansPopulation BPopulation BX X X XPopulation CPopulation C X XPopulation DPopulation DX XPopulation APopulation An n=10=10n n=4=4n n=25=25n n=2=2Sampling DistributionSampling Distributionof sample meansof sample meansSampling distribution for means 3030第30页,此课件共43页哦均值的抽样误差之特点n n各样本均
14、值未必等于总体均值;n n样本均值间存在差异;n n样本均值的分布很有规律,围绕总体均值,中间多两边少,左右基本对称;n n样本均值的变异范围较之原变量的变异范围大大缩小;n n随着样本含量的增加,样本均值的变异范围逐渐缩小。3131第31页,此课件共43页哦抽样误差在实际工作中在实际工作中,由于各种条件所限由于各种条件所限,一般不一般不可能也没有必要观察总体中的每一个个体可能也没有必要观察总体中的每一个个体,常常常常是通过是通过抽样抽样来进行研究的。虽然来进行研究的。虽然抽样误差抽样误差是不可避是不可避免的免的,但其大小是可以度量的。但其大小是可以度量的。问题:问题:如何度量抽样误差的大小?
15、如何度量抽样误差的大小?3232第32页,此课件共43页哦标准误标准误(Standard Error,SE)统计学上将样本均数统计学上将样本均数 X X、样本率、样本率P等等统计量的统计量的标准差标准差称为称为标准误标准误,它可用于说明抽样误差的大小。,它可用于说明抽样误差的大小。抽样误差3333第33页,此课件共43页哦标准误(standard error)n n样本统计量的标准差称为标准误。样本统计量的标准差称为标准误。n n样本均值的标准差称为均值的标准误。n n均值的标准误表示样本均值的变异度。n n当总体标准差未知时,用样本标准差代替,当总体标准差未知时,用样本标准差代替,n n前者
16、称为理论标准误,后者称为样本标准误。前者称为理论标准误,后者称为样本标准误。3434第34页,此课件共43页哦抽样误差的计算n n样本平均值的标准误差样本平均值的标准误差n n在重复抽样下n n在不重复抽样下3535第35页,此课件共43页哦n n样本成数的的标准误差样本成数的的标准误差n n在重复抽样下n n在不重复抽样下3636第36页,此课件共43页哦 综合练习 1 某电子元件厂对10000个元件使用寿命抽取1%进行检验,结果如表所示。3737第37页,此课件共43页哦表表表表1 1%1 1%1 1%1 1%样品测试数据样品测试数据样品测试数据样品测试数据 1.1.样本平均数样本平均数
17、=105550/100=1055.5(=105550/100=1055.5(小时小时)使用寿命(小时)使用寿命(小时)抽检数抽检数f f组中值组中值x xx xf f900900以下以下1 18758758758759009009509502 292592518501850950950100010006 697597558505850100010001050105035351025102535875358751050105011001100434310751075462254622511001100115011509 911251125101251012511501150120012003 3
18、117511753525352512001200以上以上1 11225122512251225合合 计计1001001055501055503838第38页,此课件共43页哦 将表将表1 1整理为表整理为表2 2表表表表2 1%2 1%2 1%2 1%样品标准差计算表样品标准差计算表样品标准差计算表样品标准差计算表 x xx-x-(x-)(x-)2 2f f(x-)(x-)2 2f f875875-180.5-180.532580.2532580.251 132580.2532580.25925925-130.5-130.517030.2517030.252 234060.534060.597
19、5975-80.5-80.56480.256480.256 638881.538881.510251025-30.5-30.5930.25930.25353532558.7532558.751075107519.519.5380.25380.25434316350.7516350.751125112569.569.54820.254820.259 943472.2543472.2511751175199.5199.514280.2514280.253 342840.7542840.7512251225169.5169.528730.2528730.251 128730.2528730.25合计
20、合计1001002694752694753939第39页,此课件共43页哦 重复抽样:不重复抽样:2.质量标准规定使用寿命不足1000小时为不合格品,试分别计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。如表3所示。4040第40页,此课件共43页哦表表表表3 3 3 3 成数抽样误差计算表成数抽样误差计算表成数抽样误差计算表成数抽样误差计算表使用寿命使用寿命(小时)(小时)元件质量元件质量抽检数抽检数(个)(个)比重(成数)比重(成数)(%)900900以下以下90090095095095095010001000不合格不合格不合格不合格不合格不合格1 12 26 6 9.0 9.01
21、0001000105010501050105011001100110011001150115011501150120012001200 1200 以上以上合格合格合格合格合格合格合格合格合格合格353543439 93 31 191.091.0合合 计计100100100.0100.04141第41页,此课件共43页哦 重复抽样:不重复抽样:4242第42页,此课件共43页哦 影响抽样误差的因素影响抽样误差的因素 抽样理论研究和实践证明影响抽样误差大小的因素主要有:(一)总体各变量值X 间差异的大小 如果其他条件不变,离散程度(X或P)越大,抽样误差x或p越大;反之,则越小。(二)样本单位数(样本容量)的多少 其他条件不变,样本单位数n 越少,抽样误差越大;反之,则越小。(三)抽样方法 重复抽样误差大于不重复抽样误差。(四)抽样调查组织形式 不同的抽样组织形式会产生不同的抽样误差。4343第43页,此课件共43页哦