统计学抽样推断分析法38804.pptx

上传人:muj****520 文档编号:83279987 上传时间:2023-03-29 格式:PPTX 页数:120 大小:883.15KB
返回 下载 相关 举报
统计学抽样推断分析法38804.pptx_第1页
第1页 / 共120页
统计学抽样推断分析法38804.pptx_第2页
第2页 / 共120页
点击查看更多>>
资源描述

《统计学抽样推断分析法38804.pptx》由会员分享,可在线阅读,更多相关《统计学抽样推断分析法38804.pptx(120页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第八章第八章 抽样推断分析法抽样推断分析法 第八章第八章 抽样推断分析法抽样推断分析法8.1 8.1 抽样方法概述抽样方法概述8.2 8.2 概率与概率分布概率与概率分布8.3 8.3 抽样分布抽样分布8.4 8.4 抽样估计的方法与应用抽样估计的方法与应用8.5 8.5 抽样推断误差的控制抽样推断误差的控制第一节第一节 抽样方法概述抽样方法概述 一、抽样的概念和特点一、抽样的概念和特点抽样抽样抽样抽样 根据随机原则从总体中抽取一部分单位作根据随机原则从总体中抽取一部分单位作根据随机原则从总体中抽取一部分单位作根据随机原则从总体中抽取一部分单位作为样本,并根据样本数量特征对总体数量特为样本,并

2、根据样本数量特征对总体数量特为样本,并根据样本数量特征对总体数量特为样本,并根据样本数量特征对总体数量特征做出具有一定可靠程度的估计与推断。征做出具有一定可靠程度的估计与推断。征做出具有一定可靠程度的估计与推断。征做出具有一定可靠程度的估计与推断。特点特点特点特点 按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位按随机原则抽取样本单位 用部分信息推断总体数量特征用部分信息推断总体数量特征用部分信息推断总体数量特征用部分信息推断总体数量特征 抽样推断具有一定的概率保证程度抽样推断具有一定的概率保证程度抽样推断具有一定的概率保证程度抽样推断具有一定的概率保证程度 抽样误差可以事先

3、计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制抽样误差可以事先计算并控制n抽样的应用抽样的应用对不可能进行全面调查的社会现象对不可能进行全面调查的社会现象对不必要进行全面调查的社会现象对不必要进行全面调查的社会现象对普查资料进行必要的修正对普查资料进行必要的修正二、有关抽样的几个基本概念二、有关抽样的几个基本概念样本样本 从总体抽取出的、用以代表和推断总从总体抽取出的、用以代表和推断总体的部分单位的集合体。体的部分单位的集合体。注意注意 1样本的单位必须取自总体;样本的单位必须取自总体;2由一个总体可以抽取许多样本;由一个总体可以抽取许多样本;3样样本本的的抽抽取取必必须须排排

4、除除主主观观因因素素的的影响,以确保其客观性与代表性。影响,以确保其客观性与代表性。样本容量和样本个数qq样本容量:一一个个样样本本中中所所包包含含的的个个体体单位数单位数,一般用一般用n表示。表示。qq样本个数:一一个个抽抽样样方方案案中中所所有有的的可可能能被被抽抽取取的的样样本本的的总总数数量量,即即可可能能的的样本个数样本个数。第二节第二节 概率与概率分布概率与概率分布 一、样本空间及简单随机抽样方式一、样本空间及简单随机抽样方式试试验验 从从总总体体中中随随机机抽抽取取一一个个单单位位并并把把结果记录下来称为一次试验。结果记录下来称为一次试验。样样本本(点点)连连续续n次次试试验验的

5、的结结果果构构成成一个样本(点)一个样本(点)。样样本本空空间间 以以全全部部样样本本点点为为元元素素组组成成的的集合称为样本空间。集合称为样本空间。简单随机抽样的两种方式简单随机抽样的两种方式重复抽样重复抽样每次从每次从N个单位的总体中随机抽取个单位的总体中随机抽取1个单位,登记后放回总体参加下一个单位,登记后放回总体参加下一次的抽取,连续进行次的抽取,连续进行n次。次。1、n个单位的样本由个单位的样本由n次连续试验构成。次连续试验构成。2、每次试验的结果相互独立。每次试验的结果相互独立。3、每次试验都在相同条件下进行,每个单位被每次试验都在相同条件下进行,每个单位被选中的机会选中的机会(概

6、率概率)在各次是相同的。在各次是相同的。特点:特点:简单随机抽样的两种方式简单随机抽样的两种方式不重复抽样不重复抽样每次从每次从N个单位的总体中随机抽取个单位的总体中随机抽取1个单位,登记后不放回原总体,个单位,登记后不放回原总体,下次从总体中余下的单位里抽取,下次从总体中余下的单位里抽取,连续进行连续进行n次。次。1、n个单位的样本由个单位的样本由n次连续试验构成,由于次连续试验构成,由于每次抽出后不放回,所以相当于从总体中同时每次抽出后不放回,所以相当于从总体中同时抽取抽取n个样本单位。个样本单位。2、每次试验的结果不独立。每次试验的结果不独立。3、每抽一次总体的单位数少一个,每个单位被每

7、抽一次总体的单位数少一个,每个单位被选中的机会选中的机会(概率概率)在各次是不等的。在各次是不等的。特点:特点:简单随机抽样的样本个数简单随机抽样的样本个数重复抽样重复抽样如果考虑顺序,可能的样本个如果考虑顺序,可能的样本个数是数是 。不重复抽样不重复抽样如果考虑顺序,可能的样本个数为如果考虑顺序,可能的样本个数为 ;如果不考虑顺序,可能的样本如果不考虑顺序,可能的样本个数为个数为 。二、事件及其概率二、事件及其概率事件事件样本空间中满足给定性质的样本点样本空间中满足给定性质的样本点组成事件。组成事件。简单事件简单事件复合事件复合事件对应样本空间中一个样本点的事件,对应样本空间中一个样本点的事

8、件,是不可再分事件是不可再分事件(基本事件基本事件)。由若干个简单事件结合成的事件。由若干个简单事件结合成的事件。必然事件必然事件不可能事件不可能事件每次实验中必定发生,是样本空间每次实验中必定发生,是样本空间本身。本身。在任何实验中都不发生,是空集。在任何实验中都不发生,是空集。实验中发生该事件的可能实验中发生该事件的可能性大小。性大小。若样本空间中各样本点出现的可能性大小相同,可若样本空间中各样本点出现的可能性大小相同,可用样本空间中属于该事件的样本点个数与样本空间用样本空间中属于该事件的样本点个数与样本空间中全部样本点个数之比来计算。中全部样本点个数之比来计算。事件事件A、B之和之和A+

9、B表示事件表示事件A或事件或事件B发生。发生。A+B=AB 事件发生的概率事件发生的概率事件的和事件的和事件的积事件的积复合事件的概率是简单事件的概率通复合事件的概率是简单事件的概率通过代数运算得到的。过代数运算得到的。事件事件A、B之积之积AB表示事件表示事件A和和事件事件B同时发生。同时发生。AB=AB 两种常用的复合事件的概率两种常用的复合事件的概率互不相容事件互不相容事件的和的概率的和的概率A、B互不相容表示互不相容表示AB=若若事事件件A与与事事件件B互互不不相相容容,则则:P(A+B)=P(A)+P(B)。概率的加法定理:概率的加法定理:几个几个互不相容事件中至互不相容事件中至少一

10、个发生的概率等于这几个事件各自发生少一个发生的概率等于这几个事件各自发生的概率之和。的概率之和。推论推论 设设 表示表示A的对立事件,则:的对立事件,则:P()=1-P(A)两种常用的复合事件的概率两种常用的复合事件的概率互相独立事件互相独立事件的积的概率的积的概率A、B互相独立表示事件互相独立表示事件B发生发生与否对事件与否对事件A没有影响。没有影响。若若事事件件A与与事事件件B互互相相独独立立,则则:P(AB)=P(A)P(B)。概率的乘法定理:概率的乘法定理:几个几个互相独立事件同时互相独立事件同时发生的概率等于这几个事件各自发生的概率发生的概率等于这几个事件各自发生的概率之积。之积。推

11、论推论 设设A、B互相独立,则:互相独立,则:P(A+B)=P(A)+P(B)-P(A)P(B)随机变量随机变量离散型随机变量离散型随机变量连续型随机变量连续型随机变量三、离散型随机变量的概率分布三、离散型随机变量的概率分布概率分布表概率分布表将离散型随机变量的所有可能取将离散型随机变量的所有可能取值及相应的概率按顺序列成表。值及相应的概率按顺序列成表。XX x1 x2 xn x1 x2 PP p(x1)p(x2)p(xn)p(x1)p(x2)(i=1,2,)离散型随机变量的概率分布也可以离散型随机变量的概率分布也可以用等式表述为:用等式表述为:离散型随机变量的概率分布的性质:离散型随机变量的

12、概率分布的性质:(i=1,2,);例:例:连续抛两次硬币,正面向上的次数的概连续抛两次硬币,正面向上的次数的概率分布为:率分布为:离散型随机变量的概率分布还可以离散型随机变量的概率分布还可以用用概率分布函数概率分布函数来表示。来表示。例:例:连续抛两次硬币,正面向上的次数的概连续抛两次硬币,正面向上的次数的概率分布用率分布用分布函数分布函数表示为:表示为:一次试验只有两种结果:一次试验只有两种结果:事件事件A发生或发生或 A不发生不发生 贝努里试验贝努里试验n重重贝贝努努里里试试验验中中事事件件A出出现现的的次次数数k服服从从二项分布。二项分布。k 0 1 2 n 0 1 2 n P k 四、

13、连续型随机变量的概率分布四、连续型随机变量的概率分布连续型随机变量的概率分布只能用连续型随机变量的概率分布只能用概率分布函数概率分布函数来表示。来表示。其中其中f(x)是分布函数是分布函数F(x)的导数,称为的导数,称为密度函数密度函数。连续型随机变量的密度函数连续型随机变量的密度函数的性质:的性质:1、f(x)02、3、a bxP(a Xb)f(x)五、随机变量的数值特征五、随机变量的数值特征常用的有:常用的有:数学期望、方差数学期望、方差离散型随机变离散型随机变量的数学期望量的数学期望(一)随机变量的数学期望(一)随机变量的数学期望连续型随机变连续型随机变量的数学期望量的数学期望数学期望的

14、两个重要性质:数学期望的两个重要性质:连续型随机连续型随机变量的方差变量的方差(二)随机变量的方差(二)随机变量的方差离散型随机离散型随机变量的方差变量的方差方差的两个重要性质:方差的两个重要性质:六、正态分布六、正态分布 最重要的连续型随机变量分布最重要的连续型随机变量分布正态分布的正态分布的密度函数密度函数称随机变量称随机变量X服从服从均值均值为为,方差方差为为2 的的正态分布,记为正态分布,记为XN(,2 )。f(x)xf(x)正态分布的密度函数曲线正态分布的密度函数曲线 是该分布的中心,是该分布的中心,是标准差,反映分布的离散是标准差,反映分布的离散程度,程度,越大,分布曲线越平缓,离

15、散程度越大;越大,分布曲线越平缓,离散程度越大;越小,分布曲线越陡峭,分布越集中。越小,分布曲线越陡峭,分布越集中。正态分布的正态分布的分布函数分布函数利用正态分布函数可计算正态分布随机变量利用正态分布函数可计算正态分布随机变量X落在任意区间的概率:落在任意区间的概率:对于不同的对于不同的和和2都要计算上述积分很麻烦。都要计算上述积分很麻烦。标准正态标准正态分布分布=0,=1的正态分布称为标准正的正态分布称为标准正态分布,相应的随机变量称为标态分布,相应的随机变量称为标准正态随机变量,用准正态随机变量,用Z表示,即表示,即ZN(0,1)。标准正态分布标准正态分布的的密度函数密度函数标准正态分布

16、标准正态分布的的分布函数分布函数书中把书中把z在在03.49的取值及其相应的概率编成的取值及其相应的概率编成正态分布面积表正态分布面积表,通过查表可求出,通过查表可求出Z落在任落在任意区间的概率。意区间的概率。正态分布函数的标准化正态分布函数的标准化设设XN(,2 ),令,令Z=即:即:ZN(0,1)。把一般正态分布化成标准正态分布后,通过查把一般正态分布化成标准正态分布后,通过查正态分布概率表即可求出正态分布概率表即可求出一般正态分布一般正态分布随机变随机变量落在量落在任意区间任意区间的概率。的概率。例例1:设设XN(,2),求,求X落在区间落在区间(-a,+a)的概率。的概率。解:解:令令

17、Z=,X落在区间落在区间(-a,+a),等价于,等价于Z落在落在区间区间 。查正态分布表可得其概率为查正态分布表可得其概率为 ,此即为此即为X落在区间落在区间(-a,+a)的概率。的概率。例例2:设部队战士的身高服从正态分布设部队战士的身高服从正态分布XN(175,42),军服厂要制,军服厂要制100000套军套军服,问身高在服,问身高在171179的应制多少套?的应制多少套?解:解:令令Z=,X落在区间落在区间(171,179)等价于等价于Z落在区落在区间间(-1,1)。查正态分布表可得查正态分布表可得1-21-F(1)=0.6827,所以军服厂应制所以军服厂应制68270套身高在套身高在1

18、71179的军服。的军服。第三节第三节 抽样分布抽样分布 一、基本概念总体参数总体参数总体分布的数量特征。总体分布的数量特征。样本统计量样本统计量定义在样本空间上的一个函数,定义在样本空间上的一个函数,也称也称样本指标样本指标。本身也是随机。本身也是随机变量。变量。抽样分布抽样分布样本统计量的概率分布。样本统计量的概率分布。本节主要讨论简单随机抽样的抽样分布。本节主要讨论简单随机抽样的抽样分布。抽样分布的形成过程总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、成数、方差成数、方差成数、方差样样本本二、重复抽样

19、分布样本平均数的分布样本平均数的分布例:例:某班组有某班组有5个工人,他们的单位工时工个工人,他们的单位工时工资分别是资分别是4、6、8、10、12元,现用重复抽元,现用重复抽样方式从样方式从5个工人中抽出个工人中抽出2人,求样本平均工人,求样本平均工时工资的抽样分布。时工资的抽样分布。解:解:先计算总体工时工资的平均数和方差:先计算总体工时工资的平均数和方差:样本变样本变量量468101244567865678986789101078910111289101112 样本工时平均工资样本工时平均工资 (单位:元单位:元)样本工时平均工资样本工时平均工资(元元)频数频数频率频率411/25522

20、/25633/25744/25855/25944/251033/251122/251211/25合计合计251样本工时平均工资分布样本工时平均工资分布计算样本平均工时工资的平均数和标准差:计算样本平均工时工资的平均数和标准差:从理论上推导样本平均数的分布:从理论上推导样本平均数的分布:结论:结论:在重复抽样的情况下,在重复抽样的情况下,q样本平均数的平均数等于总体平均数。样本平均数的平均数等于总体平均数。q样本平均数的标准差反映样本平均数样本平均数的标准差反映样本平均数与总体平均数的平均误差程度,等于与总体平均数的平均误差程度,等于总总体标准差的体标准差的 ,称为抽样平均(标准)误称为抽样平均

21、(标准)误差。记为差。记为 。样本成数的分布样本成数的分布成数是成数是01分布的变量的平均数,设总分布的变量的平均数,设总体成数为体成数为 ,总体方差为,总体方差为结论:结论:在重复抽样的情况下,在重复抽样的情况下,q样本成数样本成数p的平均数等于总体成数的平均数等于总体成数P,即即 。q样本成数的标准差即抽样平均误差为样本成数的标准差即抽样平均误差为 。例:例:某产品的一级品率为某产品的一级品率为80%,现采用重,现采用重复抽样方式从中抽取复抽样方式从中抽取100件,求样本一级品件,求样本一级品率的抽样平均误差。率的抽样平均误差。解:解:样本一级品率的抽样平均误差为:样本一级品率的抽样平均误

22、差为:三、不重复抽样分布样本平均数的分布样本平均数的分布例:例:某班组有某班组有5个工人,他们的单位工时工个工人,他们的单位工时工资分别是资分别是4、6、8、10、12元,现用不重复元,现用不重复抽样方式从抽样方式从5个工人中抽出个工人中抽出2人,求样本平均人,求样本平均工时工资的抽样分布。工时工资的抽样分布。解:解:先计算总体工时工资的平均数和方差:先计算总体工时工资的平均数和方差:样本变样本变量量46810124-567865-789867-91010789-1112891011-样本工时平均工资样本工时平均工资 (单位:元单位:元)样本工时平均工资样本工时平均工资 (元元)频数频数频率频

23、率522/20622/20744/20844/20944/201022/201122/20合计合计201样本工时平均工资分布样本工时平均工资分布计算样本平均工时工资的平均数和标准差:计算样本平均工时工资的平均数和标准差:结论:结论:在不重复抽样的情况下,在不重复抽样的情况下,qq样本平均数的平均数等于总体平均数。样本平均数的平均数等于总体平均数。qq样本平均数的标准差反映样本平均数与总样本平均数的标准差反映样本平均数与总体平均数的平均误差程度,称为抽样平均体平均数的平均误差程度,称为抽样平均(标准)误差。记为(标准)误差。记为注意:注意:当当N较大时,较大时,这个系数称为,这个系数称为不重复抽

24、样的修正系数不重复抽样的修正系数,当,当N远大于远大于n时,时,修正系数近似于修正系数近似于1,即可用重复抽样的误差,即可用重复抽样的误差公式代替不重复抽样的误差公式。公式代替不重复抽样的误差公式。样本成数的分布样本成数的分布结论:结论:在不重复抽样的情况下,在不重复抽样的情况下,q样本成数样本成数p的平均数等于总体成数的平均数等于总体成数P,即即 。q样本成数的标准差即抽样平均误差为样本成数的标准差即抽样平均误差为 。注意:注意:当总体成数当总体成数P未知时,可用样本成数未知时,可用样本成数p 代替总体成数代替总体成数P计算抽样平均误差计算抽样平均误差。例:例:要估计某地区要估计某地区100

25、00名适龄儿童的入学名适龄儿童的入学率,现采用不重复抽样方式从中抽取率,现采用不重复抽样方式从中抽取400名名儿童,儿童,检查有检查有320名儿童入学,求样本入学名儿童入学,求样本入学率的抽样平均误差。率的抽样平均误差。解:解:样本入学率的抽样平均误差为:样本入学率的抽样平均误差为:四、大数定理与中心极限定理大数定理大数定理独立同分布的随机变量:独立同分布的随机变量:,设它们的平均数为设它们的平均数为 ,方差为,方差为 ,即,即 ,(i=1,2,)。则则对对任任意意的的正正数数,有:,有:设设m是是n次试验中事件次试验中事件A发生的次数,发生的次数,p是事件是事件A发生的概率,则对于任意小的正

26、数发生的概率,则对于任意小的正数,有,有大数定理应用于成数指标:大数定理应用于成数指标:中心极限定理中心极限定理正态分布的再生定理:正态分布的再生定理:从服从正态分布的总体中抽出一个容量是从服从正态分布的总体中抽出一个容量是n 的的样本,则样本平均数样本,则样本平均数 也服从正态分布。如果也服从正态分布。如果总体的平均数是总体的平均数是 ,标准差是,标准差是 ,则样本平均,则样本平均数所服从的正态分布的中心仍是数所服从的正态分布的中心仍是 ,标准差是,标准差是抽样平均误差抽样平均误差 。独立同分布的随机变量:独立同分布的随机变量:,设它们的平均数为设它们的平均数为 ,方差为,方差为 ,即,即

27、,(i=1,2,)。则则当当n趋趋于于无无穷穷大大时时,算算术术平平均均数数 的的分分布布趋趋近近于于正正态态分分布布 。中心极限定理:中心极限定理:如果总体变量如果总体变量X的期望和方差有限:的期望和方差有限:,(i=1,2,)。从该总体中抽出一。从该总体中抽出一个容量是个容量是n 的样本,则样本平均数的样本,则样本平均数 的分布随的分布随着着n的增大而趋近于平均数是的增大而趋近于平均数是 ,标准差是抽,标准差是抽样平均误差样平均误差 的正态分布。的正态分布。由中心极限定理得:由中心极限定理得:中心极限定理应用于成数:中心极限定理应用于成数:从任一总体成数为从任一总体成数为P,方差为,方差为

28、P(1-P)的的(0,1)分布总体中,抽取容量为分布总体中,抽取容量为n 的样本,其样本的样本,其样本成数成数p的分布随着的分布随着n的增大而趋近于正态分的增大而趋近于正态分布布 。注意:注意:一般认为,样本单位数不少于一般认为,样本单位数不少于30的样的样本为大样本本为大样本,抽样分布就接近于正态分布。,抽样分布就接近于正态分布。例例1:某高校考生入学成绩平均分为某高校考生入学成绩平均分为550分,标分,标准差为准差为250分。从考生中随机抽分。从考生中随机抽100名,问这名,问这100名考生平均成绩在名考生平均成绩在540580分之间的概率。分之间的概率。解:解:这这100名考生平均成绩名

29、考生平均成绩 近似服从近似服从即:这即:这100名考生平均成绩在名考生平均成绩在540580分之间分之间的概率为的概率为54.04%。例例2:某县粮食平均亩产为某县粮食平均亩产为760公斤,标准差为公斤,标准差为380公斤。从中随机抽公斤。从中随机抽400亩,求样本平均亩产亩,求样本平均亩产在在800公斤以上的概率。公斤以上的概率。解:解:样本平均亩产样本平均亩产 近似服从近似服从即:样本平均亩产在即:样本平均亩产在800公斤以上的概率为公斤以上的概率为1.785%。比较:比较:上例中,如果该县粮食亩产服从正态上例中,如果该县粮食亩产服从正态分布,求亩产在分布,求亩产在800公斤以上所占的比例

30、。公斤以上所占的比例。解:解:该县粮食亩产该县粮食亩产X服从服从因此,亩产在因此,亩产在800公斤以上的概率为:公斤以上的概率为:即:该县粮食亩产在即:该县粮食亩产在800公斤以上所占的比公斤以上所占的比例为例为46%。例例3:某厂零件加工的不合格品率为某厂零件加工的不合格品率为6%,现,现从加工件中随机抽取从加工件中随机抽取100件,求样本不合格品件,求样本不合格品率在率在4%以下的概率。以下的概率。样本不合格品率样本不合格品率p近似服从近似服从即:样本不合格品率在即:样本不合格品率在4%以下的概率为以下的概率为20.3%。解:解:总体成数为总体成数为P=6%,方差为,方差为P(1-P)=0

31、.0564第四节第四节 抽样估计的方法与应用抽样估计的方法与应用 一、总体参数估计概述总体参数总体参数估计估计用样本统计量来估计总体参数,用样本统计量来估计总体参数,有有点估计点估计和和区间估计区间估计两种。两种。qq要有合适的统计量作为估计量。要有合适的统计量作为估计量。qq要有合理的允许误差范围。要有合理的允许误差范围。(估计的准确度估计的准确度)qq要有一个可接受的置信度。要有一个可接受的置信度。(估计的可靠性估计的可靠性)科学的抽样估计方法应具备的三个基本条件科学的抽样估计方法应具备的三个基本条件:二、总体参数的点估计点估计点估计直接以样本统计量的取值作为相直接以样本统计量的取值作为相

32、应总体参数的估计值,又称应总体参数的估计值,又称定值定值估计估计。优点优点:能提供总体参数的具体估计值,可作能提供总体参数的具体估计值,可作为决策的数量依据。为决策的数量依据。缺点缺点:不能提供估计的准确度和可靠性信息。不能提供估计的准确度和可靠性信息。评价估计量优良性的三个标准:评价估计量优良性的三个标准:1、无偏性:、无偏性:样本统计量的期望值等于被估计样本统计量的期望值等于被估计的总体参数。的总体参数。设设 表示总体的待估参数,表示总体的待估参数,是估计是估计 的样本的样本统计量,无偏估计指的是统计量,无偏估计指的是 满足:满足:如:如:由于由于 ,所以样本平均数是总体平,所以样本平均数

33、是总体平均数的无偏估计量。均数的无偏估计量。2、一致性:、一致性:当样本的单位数充分大时,样本当样本的单位数充分大时,样本统计量也充分靠近总体参数。统计量也充分靠近总体参数。所以样本平均数是总体平均数的一致估计量。所以样本平均数是总体平均数的一致估计量。如:如:3、有效性:、有效性:作为优良估计量,其方差应比其作为优良估计量,其方差应比其它无偏估计量的方差小。它无偏估计量的方差小。如:如:设设 和和 都是总体参数都是总体参数 的无偏估计量,的无偏估计量,如果如果 ,则说明估计量,则说明估计量 比比 更更有效。有效。总体方差的估计:总体方差的估计:以样本方差以样本方差 作为总体方差作为总体方差

34、的估计量。的估计量。原因:原因:重复抽样的情况下,样本方差重复抽样的情况下,样本方差 是总体方差的无偏估计量。是总体方差的无偏估计量。证明如下:证明如下:注意:注意:虽然样本方差虽然样本方差 是总体方差的无偏是总体方差的无偏估计量,但样本标准差估计量,但样本标准差 并不是并不是总体标准差总体标准差 的无偏估计量,只的无偏估计量,只是总体标准差的渐近无偏估计量。是总体标准差的渐近无偏估计量。证明如下:证明如下:三、总体参数的区间估计区间估计区间估计根据给定的置信度要求,指出总根据给定的置信度要求,指出总体参数被估计的上限和下限。体参数被估计的上限和下限。方法方法:对总体被估计参数对总体被估计参数

35、 ,找出样本的两个估,找出样本的两个估计量计量 和和 ,要求满足:,要求满足:式中式中(01)是区间估是区间估计的计的显著性水平显著性水平,1-称为称为置信度置信度。特点特点:能提供估计的准确度和可靠性信息。能提供估计的准确度和可靠性信息。置信度的意义:置信度的意义:设以样本平均数设以样本平均数 估计总体平均数估计总体平均数 ,表示表示极限误差,则:极限误差,则:样本估计区间样本估计区间 是可变的,如果反复是可变的,如果反复抽样的结果,有抽样的结果,有1-(如如:90%)的估计区间的估计区间 包含包含 ,其余,其余(10%)的估计区间不包含的估计区间不包含 ,则认为则认为 落在落在 区间内的判

36、断只有区间内的判断只有1-(90%)的可信度。的可信度。设以样本平均数设以样本平均数 估计总体平均数估计总体平均数 ,表示表示极限误差,极限误差,1-表示置信度,当样本为大样表示置信度,当样本为大样本时,本时,的分布接近于正态分布的分布接近于正态分布 置信度与允许极限误差的关系:置信度与允许极限误差的关系:称称称 为概率度,则有:为概率度,则有:总体平均数的估计总体平均数的估计1、总体方差已知时:、总体方差已知时:如果总体服从正态分布,则根据正态分布再生如果总体服从正态分布,则根据正态分布再生定理样本平均数定理样本平均数 ;如果总体正态性;如果总体正态性不成立,但是样本容量不成立,但是样本容量

37、n充分大时,根据中心充分大时,根据中心极限定理,近似地也有极限定理,近似地也有 。因此,可。因此,可根据置信度与允许极限误差的关系,知道其中根据置信度与允许极限误差的关系,知道其中一个就可求另一个,并进行区间估计。一个就可求另一个,并进行区间估计。已知置信度已知置信度1-的区间估计步骤:的区间估计步骤:抽取样本,计算样本平均数抽取样本,计算样本平均数 ,根据总体方,根据总体方差计算抽样平均误差差计算抽样平均误差 ;根据给定的置信度根据给定的置信度1-(即(即F(z)=1-/2),查,查表求概率度表求概率度z;根据根据z和和 求抽样极限误差求抽样极限误差,并据此得出,并据此得出估计区间估计区间

38、。已知允许极限误差已知允许极限误差的区间估计步骤:的区间估计步骤:抽取样本,计算样本平均数抽取样本,计算样本平均数 ,根据总体方,根据总体方差计算抽样平均误差差计算抽样平均误差 ;根据已知的允许极限误差根据已知的允许极限误差,求出估计区间,求出估计区间 ;根据根据 和和 求概率度求概率度z,再根据,再根据z值查表求出值查表求出F(z),可得置信度,可得置信度(即(即1-=1-21-F(z))。例:例:某乡水稻某乡水稻20000亩,亩产标准差为亩,亩产标准差为72.6公公斤,随机抽斤,随机抽400亩,平均亩产为亩,平均亩产为645公斤,公斤,(1)试以试以95%的概率保证程度估计该乡亩产量的概率

39、保证程度估计该乡亩产量和总产量和总产量;(2)给定极限误差给定极限误差7.2公斤,试对该乡亩产量和公斤,试对该乡亩产量和总产量进行区间估计。总产量进行区间估计。解:解:样本平均亩产样本平均亩产 ,抽样平均误差抽样平均误差 (1)由由1-=0.95(F(z)=0.975),查表得,查表得z=1.96,根据根据 z 和和 求抽样极限误差求抽样极限误差:据此可得出亩产量的估计区间据此可得出亩产量的估计区间(637.9,652.1)公斤。公斤。因此总产量的估计区间为因此总产量的估计区间为(1275.8,1304.2)万公斤。万公斤。(2)根据根据=7.2 和和 求概率度求概率度z:再根据再根据z=2查

40、表得查表得F(z)=0.9772,置信度为置信度为0.9544。因此,以因此,以95.44%的概率保证程度估计该乡亩产的概率保证程度估计该乡亩产量的估计区间为量的估计区间为(637.8,652.2)公斤,总产量的公斤,总产量的估计区间为估计区间为(1275.6,1304.4)万公斤。万公斤。总体平均数的估计总体平均数的估计2、总体方差未知时:、总体方差未知时:如果总体服从正态分布,则可用样本的标准差如果总体服从正态分布,则可用样本的标准差s代替总体标准差。这时的统计量为:代替总体标准差。这时的统计量为:t 服从的不是标准正态分布,而是自由度为服从的不是标准正态分布,而是自由度为n-1的的t-分

41、布分布。估计时要查估计时要查t-分布分布表表(自由度为自由度为n-1,双侧,双侧值值)大样本时,大样本时,t-分布分布接近标准正态分布,可查标准接近标准正态分布,可查标准正态分布表正态分布表(这时对总体没有正态性的限制这时对总体没有正态性的限制)。例例1:设钢珠的直径服从正态分布,现从一批设钢珠的直径服从正态分布,现从一批钢珠中随机抽出钢珠中随机抽出9个,测量它们的直径,并求个,测量它们的直径,并求得其样本的平均值是得其样本的平均值是31.06毫米,样本标准差毫米,样本标准差是是0.25毫米。试以毫米。试以95%的概率保证,估计钢珠的概率保证,估计钢珠直径的置信区间。直径的置信区间。解:解:依

42、题意有:依题意有:由由1-=0.95,查自由度为,查自由度为8的的 t-分布分布表得:表得:据此可得出置信度为据此可得出置信度为95%的钢珠直径的估计的钢珠直径的估计区间为(区间为(30.868,31.252)毫米。)毫米。例例2:灯具厂要估计一批灯泡的平均寿命。现随灯具厂要估计一批灯泡的平均寿命。现随机地抽取机地抽取50只灯泡进行测试,其平均寿命是只灯泡进行测试,其平均寿命是1600小时,样本方差是小时,样本方差是2500小时平方。试给出小时平方。试给出这批灯泡平均寿命这批灯泡平均寿命95%的置信度区间估计。的置信度区间估计。解:解:由于由于n大于大于30,是大样本,依题意有:,是大样本,依

43、题意有:由由1-=0.95,查正态分布表得:,查正态分布表得:据此可得出置信度为据此可得出置信度为95%的灯泡平均寿命的的灯泡平均寿命的估计区间为(估计区间为(1586.14,1613.86)小时)小时。总体成数的估计总体成数的估计已知置信度已知置信度1-的区间估计步骤:的区间估计步骤:抽取样本,计算样本成数抽取样本,计算样本成数p,以,以 p代替总体成数代替总体成数P计算总体方差并推算抽样平均误差计算总体方差并推算抽样平均误差 ;根据给定的置信度根据给定的置信度1-(即(即F(z)=1-/2),查表,查表求概率度求概率度z;根据根据z和和 求抽样极限误差求抽样极限误差 ,并据此,并据此得出总

44、体成数的估计区间得出总体成数的估计区间 。设总体成数是设总体成数是P,样本成数是,样本成数是p,则当样本容,则当样本容量充分大时,量充分大时,p近似服从近似服从 。例例1:在一项广告活动调查中,随机调查在一项广告活动调查中,随机调查400人有人有240人能记起广告语,求能记起广告语比人能记起广告语,求能记起广告语比率的置信度率的置信度95%的估计区间。的估计区间。解:解:样本成数样本成数p=60%,总体标准差为,总体标准差为抽样平均误差抽样平均误差由由1-=0.95(F(z)=0.975),查表得查表得z=1.96,根据,根据 z 和和 求抽样极限误差求抽样极限误差据此得出总体成数的估计区间据

45、此得出总体成数的估计区间(55.2%,64.8%)。总体成数的估计总体成数的估计抽取样本,计算样本成数抽取样本,计算样本成数p,以,以 p代替总体成数代替总体成数P计算总体方差并推算抽样平均误差计算总体方差并推算抽样平均误差 ;根据已知的允许极限误差根据已知的允许极限误差 ,求出估计区间,求出估计区间 ;根据根据 和和 求概率度求概率度z,再根据,再根据z值查表求出值查表求出F(z),可得置信度,可得置信度(即(即1-=1-21-F(z))。已知允许极限误差已知允许极限误差的区间估计步骤:的区间估计步骤:例例2:为估计某市居民户拥有空调的普及率,随为估计某市居民户拥有空调的普及率,随机抽取机抽

46、取900居民户,有居民户,有675户有空调。要求抽样户有空调。要求抽样极限误差不超过极限误差不超过2.8%,试对该市居民户空调的,试对该市居民户空调的普及率进行估计。普及率进行估计。解:解:样本成数样本成数p=75%,总体标准差为,总体标准差为抽样平均误差抽样平均误差因此,以因此,以95.44%的概率保证程度估计该市居民户的概率保证程度估计该市居民户空调普及率的区间为空调普及率的区间为(72.2%,77.8%)。根据根据 和和 求概率度求概率度z:根据根据z值查表得值查表得F(z)=0.9772,置信度置信度1-=0.9544。第五节第五节 抽样推断误差的控制抽样推断误差的控制 一、必要样本单

47、位数的确定必要的样本单位数必要的样本单位数:在一定的概率保证程度下,要使抽样误在一定的概率保证程度下,要使抽样误差不超过某一给定范围所必需的样本单差不超过某一给定范围所必需的样本单位数。位数。q总体的标志变异程度总体的标志变异程度q抽样极限误差抽样极限误差 q抽样推断的概率保证程度抽样推断的概率保证程度q抽样方法和抽样组织方式抽样方法和抽样组织方式 影响必要样本单位数大小的因素影响必要样本单位数大小的因素:必要样本单位数的确定:必要样本单位数的确定:根据给定的抽样极限根据给定的抽样极限误差和概率保证程度计算必要的样本单位数。误差和概率保证程度计算必要的样本单位数。1、估计总体平均数时:、估计总

48、体平均数时:重复抽样下重复抽样下不重复抽样下不重复抽样下2、估计总体成数时:、估计总体成数时:重复抽样下重复抽样下不重复抽样下不重复抽样下注意:注意:在多主题抽样情况下,一个样本要调查在多主题抽样情况下,一个样本要调查多项指标,此时要采用样本单位数较大的设计多项指标,此时要采用样本单位数较大的设计方案。方案。例:例:例:例:某市要进行职工家计调查,由历史资料知该市职某市要进行职工家计调查,由历史资料知该市职某市要进行职工家计调查,由历史资料知该市职某市要进行职工家计调查,由历史资料知该市职工家庭年收入与消费支出的标准差分别为工家庭年收入与消费支出的标准差分别为工家庭年收入与消费支出的标准差分别

49、为工家庭年收入与消费支出的标准差分别为24002400元和元和元和元和15001500元。现采用重复抽样方法,要求在元。现采用重复抽样方法,要求在元。现采用重复抽样方法,要求在元。现采用重复抽样方法,要求在95.44%95.44%的置信的置信的置信的置信度下,平均年收入与消费支出的极限误差分别不超过度下,平均年收入与消费支出的极限误差分别不超过度下,平均年收入与消费支出的极限误差分别不超过度下,平均年收入与消费支出的极限误差分别不超过200200元和元和元和元和120120元,求样本必要的单位数。元,求样本必要的单位数。元,求样本必要的单位数。元,求样本必要的单位数。解:解:由由由由1-=0.

50、9544得得得得F(z)=0.9772,查表得概率度,查表得概率度,查表得概率度,查表得概率度z=2,根据重复抽样的样本必要单位数公式:,根据重复抽样的样本必要单位数公式:,根据重复抽样的样本必要单位数公式:,根据重复抽样的样本必要单位数公式:因此,样本必要的单位数为因此,样本必要的单位数为因此,样本必要的单位数为因此,样本必要的单位数为625625户。户。户。户。抽样设计的基本原则抽样设计的基本原则qq保证随机原则的实现(要有合适的抽样框,保证随机原则的实现(要有合适的抽样框,保证随机取样的实现)。保证随机取样的实现)。qq要考虑样本容量和结构,以及调查费用。要考虑样本容量和结构,以及调查费

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 考试试题 > 一级建造

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁