《第一讲抽样和抽样分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第一讲抽样和抽样分布优秀PPT.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一讲抽样和抽样分布现在学习的是第1页,共85页第第 7 章章 抽样与抽样分布抽样与抽样分布o7.1 抽样的基本概念抽样的基本概念o7.2 抽样分布抽样分布现在学习的是第2页,共85页学习目标学习目标1.了解抽样中的概率抽样方法了解抽样中的概率抽样方法2.理解抽样分布的意义理解抽样分布的意义3.了解抽样分布的形成过程了解抽样分布的形成过程4.理解中心极限定理理解中心极限定理5.理解抽样分布的性质理解抽样分布的性质现在学习的是第3页,共85页 从研究现象总体的所有单位中,按照随机原从研究现象总体的所有单位中,按照随机原则抽取部分单位作为样本,然后以样本的观则抽取部分单位作为样本,然后以样本的观测
2、结果对总体的数量特征作出具有一定可靠测结果对总体的数量特征作出具有一定可靠程度和精度的估计或推断的一种统计调查方程度和精度的估计或推断的一种统计调查方法。法。抽样推断的含义抽样推断的含义总体总体随机样本随机样本随机样本随机样本 现在学习的是第4页,共85页1.在调查单位的抽取上遵循随机原则在调查单位的抽取上遵循随机原则抽样推断方法的抽样推断方法的特点特点2.以样本的数量特征去推断总体的数量特征以样本的数量特征去推断总体的数量特征3.存在抽样误差,可计算并加以控制存在抽样误差,可计算并加以控制现在学习的是第5页,共85页o一、了解不能或难以采用全面调查的总体的一、了解不能或难以采用全面调查的总体
3、的数量特征数量特征o二、与全面调查相结合,修正和补充全面调二、与全面调查相结合,修正和补充全面调查查o三、在生产过程中进行质量控制三、在生产过程中进行质量控制o四、可以对总体的某种假设进行检验四、可以对总体的某种假设进行检验抽样推断的抽样推断的作用作用现在学习的是第6页,共85页o(一)参数估计o(二)假设检验抽样推断的抽样推断的内容内容现在学习的是第7页,共85页7.1 抽样的基本概念抽样的基本概念 7.1.1 抽样推断抽样推断7.1.2 抽样的方法抽样的方法 7.1.3 样本容量和样本个数样本容量和样本个数 7.1.4 参数和样本统计量参数和样本统计量 7.15 抽样框抽样框 7.1.6
4、抽样的组织形式抽样的组织形式 7.1.7 抽样误差抽样误差现在学习的是第8页,共85页7.1.2 抽样的方法抽样的方法抽样的方法抽样的方法重复抽样重复抽样不重复抽样不重复抽样现在学习的是第9页,共85页o重复抽样:也叫回置抽样。特点:每个单位在每次抽中机会一样。o不重复抽样:也叫不回置抽样。o特点:每个单位在每次抽中机会不一样;每个单位最多只能被抽中一次。o不重复抽样的抽样平均误差小于重复抽样的抽样平均误差。现在学习的是第10页,共85页7.1.3 样本容量和样本个数样本容量和样本个数样本容量:样本中的单位数,通常用字母样本容量:样本中的单位数,通常用字母n表示。表示。通常,通常,n30的样本
5、称为大样本,的样本称为大样本,n30的样的样本称为小样本。本称为小样本。样本个数:从总体中可能抽得的样本的数目样本个数:从总体中可能抽得的样本的数目现在学习的是第11页,共85页样本的可能数目样本的可能数目从总体N中随机抽取n个样本单位共有多少种可能的抽选结果与抽样方法和是否考虑顺序有关。有以下四种组合:重复抽样考虑顺序重复抽样考虑顺序 不重复抽样考虑顺序不重复抽样考虑顺序3.不重复抽样不考虑顺序不重复抽样不考虑顺序4 重复抽样不考虑顺序(不常用)重复抽样不考虑顺序(不常用)现在学习的是第12页,共85页 重复抽样考虑顺序的可能样本数目:重复抽样考虑顺序的可能样本数目:不重复抽样考虑顺序的可能
6、样本数目:不重复抽样考虑顺序的可能样本数目:共共n个个3 不重复抽样不考虑顺序的可能样本数目:不重复抽样不考虑顺序的可能样本数目:现在学习的是第13页,共85页7.1.4 参数和统计量参数和统计量o参数参数(parameter)(parameter)n来描述总体数量特征的指标,又称总体指标。即对总体特征的数量描述。参数已知,总体的分布特征就已知。n所关心的参数主要有总体均值()、标准差()、总体比例(P/)等n用 表示n参数的特点:参数的数值是客观存在的,总体一定,参数就唯一确定,但却是未知的。现在学习的是第14页,共85页o统计量统计量(statistic)(statistic)n又称样本指
7、标或估计量,是根据样本数据计算出来的一些量,用以推断总体参数(总体指标)的综合指标。n特点:是随样本不同而不同的随机变量,不含未知参数。随机变量,不含未知参数。n所关心的样本统计量有:样本均值(x)、样本标准差(s)、样本比例(p)等n用 表示现在学习的是第15页,共85页平均数平均数标准差标准差比例比例参数参数 统计量统计量 xsp 总体总体总体总体 样本样本样本样本现在学习的是第16页,共85页7.15抽样框o抽样框:全部抽样单位的名单框架。抽样框的好坏通常会直接影响到抽样调查的随机性和调查效果。有如下几种抽样框形式:o名单抽样框:列出全部总体单位的名录一览表。如职工名单,企业名单。o区域
8、抽样框:按地理位置将总体范围划分为若干小区,以小区为单位进行抽样。如市住房调查划分为街道、区片。o时间抽样框:将总体全部单位按时间顺序排列,每隔一定时间抽样。如流水线抽样进行产品质检。现在学习的是第17页,共85页7.1.6 抽样的组织形式抽样的组织形式一、简单随机抽样一、简单随机抽样二、分层抽样二、分层抽样三、系统抽样三、系统抽样四、整群抽样四、整群抽样五、多阶段抽样五、多阶段抽样五、多阶段抽样五、多阶段抽样现在学习的是第18页,共85页对总体单位逐一编号,然后按随机原对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本则直接从总体中抽出若干单位构成样本应用应用仅适用于规模不大
9、、内部各单位仅适用于规模不大、内部各单位标志值差异较小的总体标志值差异较小的总体是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式简单随机抽样简单随机抽样(simple random sampling)抽签、随机数字表法抽签、随机数字表法现在学习的是第19页,共85页59079 46755 72348 69595 53408 92708 67110 68260 79820 91123 48391 76486 60421 69414 37271 89276 07577 43880 08133 0989867
10、072 33693 81976 68018 89363 39340 93294 82290 95922 9632986050 07331 89994 36265 62934 47361 25352 61467 51683 4383384426 40439 57595 37715 16639 06343 00144 98294 64512 19201 注意注意:必须先对总体中的每一个单位进行编码或编号,确定抽样框。简单随机抽样适合于调查标志在各单位分布较均匀的总体,一般情况下,简单随机抽样的效果相对差些。现在学习的是第20页,共85页将总体全部单位分类,形成若干个类型组,将总体全部单位分类,形成
11、若干个类型组,然后从各类型中分别抽取样本单位组成样本。然后从各类型中分别抽取样本单位组成样本。总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标分层抽样分层抽样(stratified sampling)现在学习的是第21页,共85页注意注意:1、随机性、随机性2、分层抽样要求事先对总体有较多的了解。、分层抽样要求事先对总体有较多的了解。3、分层抽样对层而言是全面调查,对层内单位而言、分层抽样对层而言是全面调查,
12、对层内单位而言是非全面调查。是非全面调查。4、能避免明显的偏高或偏低情况。、能避免明显的偏高或偏低情况。5、适合于调查标志在各单位间的分布差异大的总体。、适合于调查标志在各单位间的分布差异大的总体。现在学习的是第22页,共85页等距抽样等距抽样/机械抽样机械抽样将总体单位按某一标志排序,而后按一将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。定的间隔抽取样本单位。随机起点随机起点半距起点半距起点半距起点半距起点对称起点对称起点对称起点对称起点(总体单位按某一标志排序)(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当
13、于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样简单随机抽样简单随机抽样;按有关;按有关标志排队,其抽样效果相当于标志排队,其抽样效果相当于类型抽样类型抽样。系统抽样系统抽样(systematic sampling)现在学习的是第23页,共85页 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后然后随机抽取一部分随机抽取一部分“群群”,被抽中群体的所有被抽中群体的所有单位构成样本单位构成样本例:总体群数例:总体群数R=16 样本群数样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,
14、但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差整群抽样整群抽样(cluster sampling)现在学习的是第24页,共85页 指分两个或两个以上的阶段来完成抽取指分两个或两个以上的阶段来完成抽取样本单位的过程样本单位的过程例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查农户户调查农户生产性投资情况。生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的20个乡中各
15、抽个乡中各抽5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)多阶段抽样多阶段抽样现在学习的是第25页,共85页q调查对象的性质特点调查对象的性质特点q对调查对象的了解程度对调查对象的了解程度q抽样误差的大小抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织方在实际工作中,选择适当的抽样组织方式主要应考虑:式主要应考虑:抽样组织方式的选择抽样组织方式的选择现在学习的是第26页,共85页抽抽抽抽样样样样中中中中的的的的误误误误差差差差登登登登记记记记性性性性误误误误差
16、差差差,也叫调查误差也叫调查误差也叫调查误差也叫调查误差代表性误差代表性误差代表性误差代表性误差系统性误差系统性误差系统性误差系统性误差偶然性误差偶然性误差偶然性误差偶然性误差偏差偏差偏差偏差抽样误差抽样误差抽样误差抽样误差抽样中的误差抽样中的误差(抽样误差的计算在后边讲)(抽样误差的计算在后边讲)现在学习的是第27页,共85页7.2 抽样分布抽样分布7.2.1 三种不同性质的分布三种不同性质的分布 7.2.2 样本均值的抽样分布样本均值的抽样分布 7.2.3 样本比例的抽样分布样本比例的抽样分布 7.2.4 抽样平均误差的计算抽样平均误差的计算 7.2.5 样本方差的抽样分布样本方差的抽样分
17、布 7.2.6 两个样本统计量的抽样分布两个样本统计量的抽样分布现在学习的是第28页,共85页总体分布总体中各元素的观察值所形成的分布 分布通常是未知的可以假定它服从某种分布 7.2.1 三种不同性质的分布三种不同性质的分布总体总体现在学习的是第29页,共85页1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布样样本本现在学习的是第30页,共85页1.抽样分布是来自容量相同容量相同的所有所有可能样本的概率分布,是一种理论分布n抽取容量为 n n 的样本时,由该统计量的所有可能取值形成的概率分布 2.样本统计量(如样本统计量(
18、如样本均值,样本比例,样本方差等)是随机变量,样本不同,样本统计量的计算值是不同的。3.抽样分布反映样本统计量的分布特征,是进行推断的理论基础,揭示样本统计量和总体参数之间的关系,估计抽样误差,是抽样推断科学性的重要依据 抽样分布抽样分布现在学习的是第31页,共85页抽样分布的形成过程抽样分布的形成过程总体总体计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本现在学习的是第32页,共85页1.在选取容量为n的样本时,由样本均值的所有可能取值形成的概率分布2.推断总体均值 的理论基础
19、7.2.2 样本均值的抽样分布样本均值的抽样分布现在学习的是第33页,共85页(例题分析)【例例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差现在学习的是第34页,共85页(例题分析)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,
20、11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)现在学习的是第35页,共85页x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的
21、均值(个样本的均值(x)现在学习的是第36页,共85页样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 =2.5 2=1.25=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x现在学习的是第37页,共85页样本均值的抽样分布(数学期望与方差)比较及结论:比较及结论:1.样本均值的均值(数学期望)等于总体均值 2.样本均值的方差等于总体方差的1/n现在学习的是第38页,共85页样本抽样分布
22、特征的证明现在学习的是第39页,共85页1.样本均值的数学期望2.样本均值的方差n重复抽样n不重复抽样样本均值的抽样分布特征样本均值的抽样分布特征(数学期望与方差数学期望与方差)现在学习的是第40页,共85页样本均值的抽样分布正态分布的再生定理 =50=50=50 =10=10X X X总体分布总体分布总体分布总体分布n=4抽样分布抽样分布抽样分布抽样分布xn n=16=16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)现在学习的是第41页,共85页中心极限定理中心极限定理中中中中心心心心极极极极限限限限
23、定定定定理理理理:设从均值为,方差为 2的一个任意总体中采取重复抽样抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大,就趋于正态分布该定理为均值的抽样推断奠定了理论基础。现在学习的是第42页,共85页中心极限定理当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布一个任意一个任意分布的总分布的总体体x x现在学习的是第43页,共85页中心极限定理 x x 的的的的分分分分布布布布趋趋趋趋于于于于正正
24、正正态态态态分分分分布布布布的的的的过过过过程程程程现在学习的是第44页,共85页抽样分布与总体分布的关系抽样分布与总体分布的关系总体布总体布总体布总体布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布现在学习的是第45页,共85页1.总体服从正态分布N(,)时时2.总体分布未知,当n充分大时重复抽样时重复抽样时 不重复抽样时不重复抽样时 重复抽样时重复抽样时 不重复抽样时不重复抽样时 近似近似近似近似现在学习的是第46页,共85页例题分析 例例某酒店电梯中质量标志注明最大载重为某酒店电梯中质量标志注明最大载重为18人,人,135
25、0kg。假定已知该酒店旅客及其携带行李的平均重量为假定已知该酒店旅客及其携带行李的平均重量为70kg,标准差,标准差为为6kg。试问随机进入电梯。试问随机进入电梯18人,总重量超重的概率是多少人,总重量超重的概率是多少?现在学习的是第47页,共85页1.比例:比例:总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为 7.2.3 样本比例的抽样分布样本比例的抽样分布现在学习的是第48页,共85页1.在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布2.当样本容量很大时,
26、样本比例的抽样分布可用正态分布近似 3.推断总体比例的理论基础样本比例的抽样分布样本比例的抽样分布中心极限定中心极限定理理现在学习的是第49页,共85页1.样本比例的数学期望2.样本比例的方差n重复抽样n不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)现在学习的是第50页,共85页7.2 抽样分布抽样分布o 7.2.1 三种不同性质的分布三种不同性质的分布o 7.2.2 样本均值的抽样分布样本均值的抽样分布o 7.2.3 样本比例的抽样分布样本比例的抽样分布o 7.2.4 样本方差的抽样分布样本方差的抽样分布o 7.2.5 两个样本统计量的抽样分布两个样本统计量的
27、抽样分布o 7.2.6 抽样平均误差的计算抽样平均误差的计算现在学习的是第51页,共85页 7.2.4 样本方差的抽样分布样本方差的抽样分布o对总体为正态总体:分布的形状见课本页分布的形状见课本页用样本方差推断总体方差,必须知道总体方差的抽样分用样本方差推断总体方差,必须知道总体方差的抽样分布。布。样本方差的抽样分布在重复选取容量为样本方差的抽样分布在重复选取容量为n的样本时,由的样本时,由样本方差的所有可能取值形成的相对频数分布。样本方差的所有可能取值形成的相对频数分布。现在学习的是第52页,共85页两个样本统计量的抽样分布两个样本统计量的抽样分布一一.两个样本均值之差的抽样分布两个样本均值
28、之差的抽样分布二二.两个样本比例之差的抽样分布两个样本比例之差的抽样分布三三.两个样本方差比的抽样分布两个样本方差比的抽样分布现在学习的是第53页,共85页1.两个总体都为正态分布,即两个总体都为正态分布,即 ,2.两两个个样样本本均均值值之之差差 的的抽抽样样分分布布服服从从正正态态分分布布,其分布的数学期望为两个总体均值之差其分布的数学期望为两个总体均值之差o 方差为各自的方差之和方差为各自的方差之和 一、两个样本均值之差的抽样分布一、两个样本均值之差的抽样分布现在学习的是第54页,共85页现在学习的是第55页,共85页1.从从两两个个服服从从二二项项分分布布的的总总体体中中,分分别别独独
29、立立抽抽取取两两个个样样本本,由由两两个样本比例之差的所有可能取值形成的相对频数分布。个样本比例之差的所有可能取值形成的相对频数分布。2.分分别别从从两两个个服服从从二二项项分分布布总总体体中中抽抽取取容容量量为为n1和和n2的的独独立立样样本本,当当两两个个样样本本都都为为大大样样本本时时,两两个个样样本本比比例例之之差差的的抽抽样样分分布布近近似似服服从从正正态分布。态分布。3.分布的数学期望为分布的数学期望为o方差为各自的方差之和方差为各自的方差之和 二、两个样本比例之差的抽样分布二、两个样本比例之差的抽样分布现在学习的是第56页,共85页现在学习的是第57页,共85页三、两个样本方差比
30、的抽样分布三、两个样本方差比的抽样分布1.1.两两个个样样本本方方差差比比的的抽抽样样分分布布:若若两两个个个个总总总总体体体体都都都都为为为为正正正正态态态态分分分分布布布布,即即即即X X1 1N N(1 1,1 12 2),X2 2 N N(2,22 2),从从从从两两两两个个总总体体中中分分别别抽抽取取容容量量为为n1 1和和n2 2的的的的独独独独立立立立样样样样本本本本,由由由由两两两两个个个个样样样样本本本本方方方方差差差差比的所有可能取值形成的相对频数分布。比的所有可能取值形成的相对频数分布。比的所有可能取值形成的相对频数分布。比的所有可能取值形成的相对频数分布。2.2.两两两
31、两个个个个样样样样本本本本方方方方差差差差比比比比的的的的抽抽抽抽样样样样分分分分布布布布,服服服服从从从从分分分分子子子子自自自自由由由由度度度度为为为为(n1-1),分母自由度为,分母自由度为,分母自由度为,分母自由度为(n n2 2-1)-1)的的的的F F分布,即分布,即 现在学习的是第58页,共85页1.由由统统计计学学家家费费舍舍(R.A.Fisher)提提出出的的,以以其其姓姓氏氏的的第第一一个个字字母母来来命名则命名则2.设设若若U为为服服从从自自由由度度为为n1的的 2分分布布,即即U 2(n1),V为为服服从从自由度为自由度为n2的的 2分布,即分布,即V 2(n2),且且
32、U和和V相互独立,则相互独立,则 称称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为F分布 现在学习的是第59页,共85页F分布图示 不同自由度的不同自由度的F分布分布F F F(1,20)1,20)(5,20)(5,20)(10,20)(10,20)现在学习的是第60页,共85页抽样误差抽样误差实际抽样误差实际抽样误差抽样平均误差抽样平均误差抽样极限误差抽样极限误差现在学习的是第61页,共85页实实际际抽抽样样误误差差,指指样样本本统统计计量量与与总总体参数之间的绝对离差。体参数之间的绝对离差。实际抽样误差实际抽样误差 现在学习的是第62页,共85页抽样平均误差是样本统计量
33、与总体参数的平均离差,也即样本统计量的标准差。1.抽样平均误差的概念抽样平均误差的概念现在学习的是第63页,共85页一、总体内部的差异程度(用标准差衡量)一、总体内部的差异程度(用标准差衡量)二、样本容量二、样本容量 三、抽样方法三、抽样方法(重复与不重复)(重复与不重复)四四、抽抽样样组组织织形形式式(分分层层抽抽样样和和系系统统抽抽样样要要小小,简单随机抽样和整群抽样相对要大)简单随机抽样和整群抽样相对要大)2.影响抽样平均误差的因素影响抽样平均误差的因素现在学习的是第64页,共85页以均值的抽样平均误差为例1.测度所有样本均值对其中心值的离散程度,所有可能的样本均值的标准差2.所有样本均
34、值分布在总体均值的周围,抽样平均误差反映了样本估计值与相应总体参数的平均差异程度3.抽样平均误差越小,样本估计值的分布越集中在总体参数的附近,样本估计值对总体的代表性越高现在学习的是第65页,共85页(1)理论公式理论公式 3.抽样平均误差的计算抽样平均误差的计算现在学习的是第66页,共85页抽样平均误差计算式推导抽样平均误差计算式推导现在学习的是第67页,共85页例例3现现有有A、B、C、D四四名名工工人人构构成成的的总总体体,他他们们的的日日产产量量分分别别为为22、24、26、28件件。从从四四名名工工人人中中任任取取两两名名构构成成一一个个样样本本,请请利利用用重重复复抽抽样样和和不不
35、重重复复抽抽样样的的方方法法计计算算抽抽样样平平均误差。均误差。【分析分析】先计算出三类数值:先计算出三类数值:根据抽样平均误差的计算公式,我们必须根据抽样平均误差的计算公式,我们必须本题要求我们计算抽样平均误差本题要求我们计算抽样平均误差。可能样本个数。可能样本个数。总体平均日产量、总体平均日产量、样本平均日产量样本平均日产量、现在学习的是第68页,共85页解解:但但由由于于本本题题计计算算抽抽样样平平均均误误差差要要分分别别采采用用重重复复抽抽样样和和不不重重复复抽抽样样两两种种方方法法,因因此此,除除总总体体平平均均日日产产量量计计算算结结果果相相同同外外,样样本本平平均均日日产产量量、
36、可可能能样样本本总总数数均均不不完完全全相相同同。为为了了准准确确计计算算有有关关数数据据,我我们们将将所所有有可可能能的的样样本本及及其其平平均均数数列列举举出出来来,然然后后,根根据据列列举举结结果果就就可可以以计计算算出出抽抽样平均误差。样平均误差。列举过程见表列举过程见表4-11.采用重复抽样采用重复抽样现在学习的是第69页,共85页22222424262628282222(22,22)(22,22)(22)(22)(22,24)(22,24)(23)(23)(22,26)(22,26)(24)(24)(22,28)(22,28)(25)(25)2424(24,22)(24,22)(2
37、3)(23)(24,24)(24,24)(24)(24)(24,26)(24,26)(25)(25)(24,28)(24,28)(26)(26)2626(26,22)(26,22)(24)(24)(26,24)(26,24)(25)(25)(26,26)(26,26)(26)(26)(26,28)(26,28)(27)(27)2828(28,22)(28,22)(25)(25)(28,24)(28,24)(26)(26)(28,26)(28,26)(27)(27)(28,28)(28,28)(28)(28)现在学习的是第70页,共85页22222424262628282222(22,24)(2
38、2,24)(23)(23)(22,26)(22,26)(24)(24)(22,28)(22,28)(25)(25)2424(24,22)(24,22)(23)(23)(24,26)(24,26)(25)(25)(24,28)(24,28)(26)(26)2626(26,22)(26,22)(24)(24)(26,24)(26,24)(25)(25)(26,28)(26,28)(27)(27)2828(28,22)(28,22)(25)(25)(28,24)(28,24)(26)(26)(28,26)(28,26)(27)(27)现在学习的是第71页,共85页应应当当指指出出的的是是,上上面面计
39、计算算抽抽样样平平均均误误差差的的这这个理论公式,在实际应用上会存在两个困难:个理论公式,在实际应用上会存在两个困难:列举过程见表列举过程见表4-22.采用不重复抽样采用不重复抽样运运用用这这个个公公式式要要求求把把所所有有的的样样本本都都抽抽选选出出来来,然然后后计计算算它它们们的的指指标标数数值值。这这在在实实际际应应用用过过程程中中几几乎是不可能的。乎是不可能的。运运用用上上面面公公式式要要求求总总体体平平均均数数的的数数值值是是已已知知的的。但但实实际际上上,总总体体平平均均数数的的数数值值是是未未知知的的,它它正正是是抽抽样调查要推断的。样调查要推断的。现在学习的是第72页,共85页
40、因此,根据上面这个理论公式计算样本平均数因此,根据上面这个理论公式计算样本平均数的抽样平均误差是行不通的。必须选用其他计算的抽样平均误差是行不通的。必须选用其他计算公式。公式。数理统计已经证明,在随机抽样方式下,数理统计已经证明,在随机抽样方式下,样本平均数(成数)的抽样平均误差可以按下述样本平均数(成数)的抽样平均误差可以按下述公式来计算。公式来计算。在重复抽样条件在重复抽样条件下:下:样本平均数的抽样样本平均数的抽样平均误差平均误差样本成数的抽样平样本成数的抽样平均误差均误差现在学习的是第73页,共85页在不重复抽样条件下:在不重复抽样条件下:样本平均数的抽样平均误差样本平均数的抽样平均误
41、差在总体单位数很大的情况下,样本平均数的在总体单位数很大的情况下,样本平均数的抽样误差抽样误差现在学习的是第74页,共85页样本成数的抽样平均误差样本成数的抽样平均误差在在总体单位数很大总体单位数很大的情况下,样本成数的抽样误的情况下,样本成数的抽样误差差现在学习的是第75页,共85页例例现有现有A、B、C、D四名工人构成的总体,他们四名工人构成的总体,他们的日产量的标准差为的日产量的标准差为2.236。从四名工人中任取两名。从四名工人中任取两名构成一个样本,请利用重复抽样和不重复抽样的方法构成一个样本,请利用重复抽样和不重复抽样的方法计算抽样平均误差。计算抽样平均误差。由题意知,总体标准差由
42、题意知,总体标准差解:解:=4,样本单位数样本单位数 n总体单位数总体单位数N=2.236,=2在重复抽样条件下:在重复抽样条件下:样本平均数的抽样平均误差样本平均数的抽样平均误差现在学习的是第76页,共85页在不重复抽样条件下:在不重复抽样条件下:样本平均数的抽样平均误差样本平均数的抽样平均误差现在学习的是第77页,共85页例题分析 例例某班组有某班组有5个工人,他们的单位工时分别是个工人,他们的单位工时分别是4,6,8,10,12元,现用重复抽样方式从元,现用重复抽样方式从5个工人中随机抽出个工人中随机抽出2人,计算样本的人,计算样本的平均工时工资及其抽样平均误差。平均工时工资及其抽样平均
43、误差。现在学习的是第78页,共85页例例5某厂从某厂从10001000名工人中采用不重复抽样随机抽取名工人中采用不重复抽样随机抽取100100名工名工人登记每人日产量,对获得资料进行整理,见表人登记每人日产量,对获得资料进行整理,见表(1)利用表中数据计算样本平均数的抽样平均误差。()利用表中数据计算样本平均数的抽样平均误差。(2)如果工人日产量在如果工人日产量在118件及以上者为完成生产定额,试计算完件及以上者为完成生产定额,试计算完成生产定额日产量成数的抽样平均误差。成生产定额日产量成数的抽样平均误差。现在学习的是第79页,共85页由题意知,由题意知,解:解:=1000,样本单位数样本单位
44、数 n总体单位数总体单位数 N=6.4374=100在不重复抽样条件下,在不重复抽样条件下,样本平均数的抽样平均误差样本平均数的抽样平均误差利用表中数据,计算得样本标准差利用表中数据,计算得样本标准差s在不重复抽样条件下,在不重复抽样条件下,样本成数的抽样平均误差样本成数的抽样平均误差现在学习的是第80页,共85页练习题练习题练习练习1、某企业生产一批灯泡共某企业生产一批灯泡共10,000只,随机只,随机抽取抽取500只作耐用时间只作耐用时间试验。测算结果,平均寿命为试验。测算结果,平均寿命为5,000小时,标准差为小时,标准差为300小时,小时,500只中不合格品有只中不合格品有10只,求平
45、均数和成数的抽样平均误差。只,求平均数和成数的抽样平均误差。已知某纺纱厂在一定时期内生产了已知某纺纱厂在一定时期内生产了100,000个单位的纱,按个单位的纱,按简单随机抽样的方式,抽取了简单随机抽样的方式,抽取了2,000个单位来检验,合格个单位来检验,合格率为率为95%,试求抽样平均误差。,试求抽样平均误差。练习练习2、现在学习的是第81页,共85页练习题练习题 某工厂从生产的一批某工厂从生产的一批零件中随机抽取零件中随机抽取1%查其质量,调查资料见表查其质量,调查资料见表练习练习3、根据质量标准,使用寿命在根据质量标准,使用寿命在800小时及以上者为合格品。试求平均使用寿命和合小时及以上
46、者为合格品。试求平均使用寿命和合格品率的抽样平均误差。格品率的抽样平均误差。现在学习的是第82页,共85页抽样误差抽样误差实际抽样误差实际抽样误差抽样平均误差抽样平均误差抽样极限误差抽样极限误差现在学习的是第83页,共85页抽样极限误差抽样极限误差 对于某一项调查来说,根据客观要求,一般应有一个允许对于某一项调查来说,根据客观要求,一般应有一个允许的误差限度,也就是说若抽样误差在这个限度之内,就认的误差限度,也就是说若抽样误差在这个限度之内,就认为是可允许的,这一允许的误差限度就称为极限误差。为是可允许的,这一允许的误差限度就称为极限误差。抽样极限误差的概念抽样极限误差的概念 现在学习的是第8
47、4页,共85页本章小结本章小结 抽样与抽样分布抽样与抽样分布7.1 抽样的抽样的 基本概念基本概念7.2 抽样分布抽样分布o 4.1.1 抽样推断抽样推断4.1.2 抽样的方法抽样的方法 4.1.3 本容量和样本个数本容量和样本个数4.1.4 参数和样本统计量参数和样本统计量4.1.5 抽样的组织形式抽样的组织形式4.1.6 抽样误差抽样误差 4.2.1 三种不同性质的分布三种不同性质的分布4.2.2 样本均值的抽样分布样本均值的抽样分布4.2.3 样本比例的抽样分布样本比例的抽样分布4.2.4 样本方差的抽样分布样本方差的抽样分布4.2.5 两个样本统计量的抽样分布两个样本统计量的抽样分布4.2.6 抽样平均误差的计算抽样平均误差的计算现在学习的是第85页,共85页