《统计学原理第5章.ppt》由会员分享,可在线阅读,更多相关《统计学原理第5章.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 某商场出售某种商品的价格和销售资料如下表:等级等级 单价(元单价(元/公斤)公斤)销售额(万元)销售额(万元)一级一级 20 216 二级二级 16 115.2 三级三级 12 72 试求该商品的平均销售价格。平均商品销售价值平均商品销售价值:(元/公斤)两两种种不不同同水水稻稻品品种种,分分别别在在5 5个个田田块块上上试试种种,其其产产量如下:量如下:甲品种甲品种 乙品种乙品种 田块面积田块面积 产产 量量 田块面积田块面积 产产 量量 (亩)(亩)(公斤)(公斤)(亩)(亩)(公斤公斤)1.2 600 1.5 840 1.1 495 1.4 770 1.0 445 1.2 540 0.
2、9 540 1.0 520 0.8 420 0.9 450 要求:要求:分别计算两品种的单位面积产量。分别计算两品种的单位面积产量。计计算算两两品品种种亩亩产产量量的的标标准准差差和和标标准差系数。准差系数。假假定定生生产产条条件件相相同同,确确定定哪哪一一品品种具有较大稳定性,宜于推广。种具有较大稳定性,宜于推广。因因V V乙乙VV甲甲故乙品种具有较大稳定性,宜于推广。故乙品种具有较大稳定性,宜于推广。第五章第五章 抽抽 样样 估估 计计教学目的与要求教学目的与要求 抽样估计是抽样调查的继续,它提供抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征了一套利用抽样资料来估计总
3、体数量特征的方法。通过本章的学习,要理解和掌握的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估参数的方法,能结合实际资料进行抽样估计。计。本本 章章 主主 要要 内内 容容抽样推断的一般问题抽样推断的一般问题抽样误差抽样误差抽样估计的方法抽样估计的方法抽样组织设计抽样组织设计一、抽样推断的概念和特点一、抽样推断的概念和特点 概概 念念 抽样推断是按随机原则从全部研抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,究对
4、象中抽取部分单位进行观察,并根据样本的实际数据对总体的数并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估量特征作出具有一定可靠程度的估计和判断计和判断。特特 点点 它是由部分推断整体的一种认识方法它是由部分推断整体的一种认识方法。抽样推断建立在随机取样的基础上抽样推断建立在随机取样的基础上。抽样推断运用概率估计的方法抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。抽样推断的误差可以事先计算并加以控制。第一节第一节 抽样推断的一般问题抽样推断的一般问题二、抽样推断的内容二、抽样推断的内容参数估计参数估计 参数估计是依据所获参数估计是依据所获得的样本观察资料,对所研究
5、现得的样本观察资料,对所研究现象总体的水平、结构、规模等数象总体的水平、结构、规模等数量特征进行估计。量特征进行估计。假设检验假设检验 假设检验是利用样本假设检验是利用样本的实际资料来检验事先对总体某的实际资料来检验事先对总体某些数量特征所作的假设是否可信些数量特征所作的假设是否可信的一种统计分析方法。的一种统计分析方法。三、有关抽样的基本概念三、有关抽样的基本概念(一)(一)总总 体体 和和 样样 本本总体总体:又称全及总体。指所要认识的又称全及总体。指所要认识的研究对象全体。总体单位总数用研究对象全体。总体单位总数用“N”“N”表示。表示。样本样本:又称子样。是从全及总体中随又称子样。是从
6、全及总体中随机抽取出来,作为代表这一总体的机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单那部分单位组成的集合体。样本单位总数用位总数用“n”“n”表示。表示。(二)(二)参参 数数 和和 统统 计计 量量 参参 数数 反映总体数量特征的全及指标。反映总体数量特征的全及指标。参数参数研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体方差总体方差X=X NX=XF F(X-X)N2=2(X-X)F F2=2研究总体中研究总体中的品质标志的品质标志总体成数总体成数成数方差成数方差2=P(1-P)P=N1N(只有两种表现)统统 计计 量量根据样本数据计算的综合指标根据样本数
7、据计算的综合指标。研究数研究数量标志量标志 样本平均数样本平均数 x=xnx=xff样本标准差样本标准差研究品研究品质标志质标志样本成数样本成数 成数标准差成数标准差 np=n(三)样本容量和样本个数(三)样本容量和样本个数样本容量:样本容量:一个样本包含的单位数。用一个样本包含的单位数。用“n”表示。表示。一般要求一般要求 n 30样本个数:样本个数:从一个全及总体中可能抽取的样本数目。从一个全及总体中可能抽取的样本数目。(四)(四)重复抽样和不重复抽样重复抽样和不重复抽样重复抽样重复抽样:又称回置抽样。又称回置抽样。不重复抽样不重复抽样:又称不回置抽样。又称不回置抽样。可能组成的样本数目:
8、可能组成的样本数目:N(N-1)()(N-2)(N-n+1)可能组成的样本数目:可能组成的样本数目:nN例如:从例如:从A、B、C、D四个单位中,抽出两个单位构成四个单位中,抽出两个单位构成 一个样本,问可能组成的样本数目是多少?一个样本,问可能组成的样本数目是多少?重复抽样重复抽样AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(个样本)不重复抽样不重复抽样N(N-1)(N-2).43=12(个样本)第二节第二节 抽抽 样样 误误 差差一、抽样误差的含义一、抽样误差的含义 由于随机抽样的偶然因素使样本由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位
9、各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标的结构,而引起抽样指标和全及指标之间的绝对离差。之间的绝对离差。二、影响抽样误差大小的因素二、影响抽样误差大小的因素1 1、总体各单位标志值的差异程度、总体各单位标志值的差异程度2 2、样本的单位数、样本的单位数3 3、抽样方法、抽样方法4 4、抽样调查的组织形式、抽样调查的组织形式三、抽样平均误差三、抽样平均误差 抽样平均误差是抽样抽样平均误差是抽样平均数或抽样成数的标准平均数或抽样成数的标准差,反映了抽样指标与总差,反映了抽样指标与总体指标的平均误差程度。体指标的平均误差程度。假设总体包含假设总体包含1、2、3、4、5,五,五
10、个数字。个数字。则:总体平均数为则:总体平均数为x=1+2+3+4+55=3 现在,采用重复抽样从中抽出现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的两个,组成一个样本。可能组成的样本数目:样本数目:25个。个。如:如:.1+3 2=21+42=2.52+42=33+52=4 多数样本指标与总体指标都多数样本指标与总体指标都有误差有误差,误差有大、有小,有正、误差有大、有小,有正、有负,抽样平均误差就是将所有有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误所以抽样平均误差是反映抽样误差一般水平的指标。差一般水平的指标
11、。抽抽 样样 平平 均均 误误 差差 的的 计计 算算 公公 式式抽样平均数的平均误差抽样成数平均误差(以上两个公式实际上就是第四章讲的标准差。以上两个公式实际上就是第四章讲的标准差。但反映的是样本指标与总体指标的平均离差程度)但反映的是样本指标与总体指标的平均离差程度)实际上,利用上述两个公式是计算不出抽样平均误差的。实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?想一想,为什么?抽样平均数平均误差的计算方法抽样平均数平均误差的计算方法采用重复抽样采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体
12、标准差未知时,可与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)用样本标准差代替)(教材(教材P180P180例题)例题)通过例题可说明以下几点通过例题可说明以下几点:样本平均数的平均数等于总体平均数样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的可通过调整样本单位数来控制抽样平均误差可通过调整样本单位数来控制抽样平均误差。例题:假定抽样单位数增加例题:假定抽样单位数增加 2 2 倍、倍、0.50.5 倍时,抽样平均误差怎样变化?倍时,抽样平均误差怎样变化?解解:抽样单位数增加:抽样单位数增加 2 倍,即为原来的倍,即为原来的
13、3 倍倍则:则:抽样单位数增加抽样单位数增加 0.5倍,即为原来的倍,即为原来的 1.5倍倍则:则:即:即:当样本单位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.577倍倍。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165倍倍。采用不重复抽样:采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。例题一例题一:随机抽选某校学生随机抽选某校学生100100人,调查他们的体人,调查他们的体重。得到他们的平均体重为重。得到他们
14、的平均体重为5858公斤,标公斤,标准差为准差为1010公斤。问抽样推断的平均误差公斤。问抽样推断的平均误差是多少?是多少?例题二:例题二:某厂生产一种新型灯泡共某厂生产一种新型灯泡共20002000只,随机只,随机抽出抽出400400只作耐用时间试验,测试结果只作耐用时间试验,测试结果平均使用寿命为平均使用寿命为48004800小时,样本标准差小时,样本标准差为为300300小时,求抽样推断的平均误差?小时,求抽样推断的平均误差?例题一解例题一解:即即:当根据样本学生的平均体重估计全部学生的平均当根据样本学生的平均体重估计全部学生的平均 体重时体重时,抽样平均误差为抽样平均误差为1 1公斤。
15、公斤。例题二解例题二解:计算结果表明:计算结果表明:根据部分产品推断全部产品的平均使用寿命根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。时,采用不重复抽样比重复抽样的平均误差要小。已知:已知:则:则:已知:已知:则:则:n=100=10 x=58N=2000 n=400=300 x=4800抽样成数平均误差的计算方法抽样成数平均误差的计算方法采用重复抽样采用重复抽样:采用不重复抽样:采用不重复抽样:例题三例题三:某校随机抽选某校随机抽选400400名学生,发现戴眼镜的学名学生,发现戴眼镜的学生有生有8080人。根据样本资料推断全部学生中戴人。根据样本资料推
16、断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?眼镜的学生所占比重时,抽样误差为多大?例题四例题四:一批食品罐头共一批食品罐头共6000060000桶,随机抽查桶,随机抽查300300桶桶,发现有,发现有6 6桶不合格,求合格品率的抽样平桶不合格,求合格品率的抽样平均误差?均误差?例例 题题 三三 解解:已知:已知:则:样本成数则:样本成数即:即:根据样本资料推断全部学生中戴眼镜的学根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为生所占的比重时,推断的平均误差为2%2%。例例 题题 四四 解:解:已知已知:则:样本合格率则:样本合格率计算结果表明:计算结果表明:不重复
17、抽样的平均误差小于重复抽样,不重复抽样的平均误差小于重复抽样,但是但是“N”“N”的数值越大,则两种方法计算的数值越大,则两种方法计算 的抽样平均误差就越接近。的抽样平均误差就越接近。四、抽四、抽 样样 极极 限限 误误 差差含义含义:抽样极限误差指在进行抽样估计时,根据研究抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。本指标与总体指标之间可允许的最大误差范围。计算方法计算方法:它等于样本指标可允许变动的上限它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。或下限与总体
18、指标之差的绝对值。=pp -Pp P ppp抽样平均数极限误差抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:五、抽样误差的概率度五、抽样误差的概率度 含含 义义抽样误差的概率度是测量抽样估计可靠抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号程度的一个参数。用符号“t”“t”表示。表示。公式表示:公式表示:t=t(t t 是极限误差与抽样平均误差的比值)是极限误差与抽样平均误差的比值)(极限误差是(极限误差是 t t 倍的抽样平均误差)倍的抽样平均误差)上式可变形为:上式可变形为:第三节第三节 抽样估计的方法抽样估计的方法一、总体参数的点估计一、总体参数的点估计总体参数点估计
19、的特点总体参数点估计的特点:总体参数优良估计的标准总体参数优良估计的标准 无偏性无偏性一致性一致性有效性有效性二、总体参数的区间估计二、总体参数的区间估计区间估计三要素区间估计三要素估计值估计值抽样误差范围抽样误差范围抽样估计的置信度抽样估计的置信度总体参数区间估计的特点:总体参数区间估计的特点:什什 么么 是是 抽抽 样样 估估 计计 的的 置置 信信 度度?抽样估计的置信度就是表明抽抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一样指标和总体指标的误差不超过一定范围的概率保证程度定范围的概率保证程度。符号表示:符号表示:P(x-X )x 理论已经证明,在大样本的情况理论已经证明,在
20、大样本的情况下,抽样平均数的分布接近于正态分下,抽样平均数的分布接近于正态分布,分布特点是:抽样平均数以总体布,分布特点是:抽样平均数以总体平均数为中心,两边完全对称分布,平均数为中心,两边完全对称分布,即抽样平均数的正误差与负误差的可即抽样平均数的正误差与负误差的可能性是完全相等的。且抽样平均数愈能性是完全相等的。且抽样平均数愈接近总体平均数,出现的可能性愈大,接近总体平均数,出现的可能性愈大,概率愈大;反之,抽样平均数愈离开概率愈大;反之,抽样平均数愈离开总体平均数,出现的可能性愈小,概总体平均数,出现的可能性愈小,概率愈小,趋于率愈小,趋于0 0。(见下图)。(见下图)正正 态态 概概
21、率率 分分 布布 图图Xx+1x-168.27%x+2x-295.45%由此可知由此可知,误差范围愈大误差范围愈大,抽样估计的置信度愈高抽样估计的置信度愈高,但抽样估计但抽样估计的精确度愈低;反之,误差范围愈小,则抽样估计的置信度的精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,但抽样估计的精确度愈高。愈低,但抽样估计的精确度愈高。因为扩大或缩小以后因为扩大或缩小以后的平均误差,就是极的平均误差,就是极限误差:限误差:=t所以,抽样平均误所以,抽样平均误差的系数就是概差的系数就是概率度率度t。数理统计已经证明,抽样数理统计已经证明,抽样误差的概率就是概率度的误差的概率就是概率度的 函数
22、,二者对应的函数函数,二者对应的函数 关系已编成关系已编成“正态分布正态分布 概率表概率表”。三、总体参数区间估计的方法三、总体参数区间估计的方法(一)根据给定的抽样误差范围,(一)根据给定的抽样误差范围,求概率保证程度求概率保证程度分析步骤:分析步骤:1 1、抽取样本,计算抽样指标。、抽取样本,计算抽样指标。2 2、根据给定的极限误差范围估、根据给定的极限误差范围估 计总体参数的上限和下限。计总体参数的上限和下限。3 3、计算概率度、计算概率度。4 4、查表求出概率、查表求出概率F F(t t),并对),并对 总体参数作出区间估计。总体参数作出区间估计。(二)根据给定的概率(二)根据给定的概
23、率F F(t t),推算),推算 抽样极限误差的可能范围抽样极限误差的可能范围分分 析析 步步 骤骤:1 1、抽取样本,计算样本指标。、抽取样本,计算样本指标。2 2、根据给定的、根据给定的F F(t t)查表求得概率度)查表求得概率度 t t。3 3、根据概率度和抽样平均误差计算极限误差。、根据概率度和抽样平均误差计算极限误差。4 4、计算被估计值的上、下限,对总体参数作、计算被估计值的上、下限,对总体参数作 出区间估计。出区间估计。某农场进行小麦产量抽样调查,某农场进行小麦产量抽样调查,小麦播种总面积为小麦播种总面积为1 1万亩,采用不重万亩,采用不重复简单随机抽样,从中抽选了复简单随机抽
24、样,从中抽选了100100亩亩作为样本进行实割实测,测得样本平作为样本进行实割实测,测得样本平均亩产均亩产400400斤,方差斤,方差144144斤。斤。(1)以以95.45%95.45%的可靠性推断该农的可靠性推断该农场小麦平均亩产可能在多少斤之间?场小麦平均亩产可能在多少斤之间?若概率保证程度不变,要求抽样允许若概率保证程度不变,要求抽样允许误差不超过误差不超过1 1斤,问至少应抽多少亩斤,问至少应抽多少亩作为样本?作为样本?例例 题题 一一:例题一解题过程:例题一解题过程:已知:已知:N=10000 n=100 问题一解问题一解:1 1、计算抽样平均误差、计算抽样平均误差2 2、计算抽样
25、极限误差、计算抽样极限误差3 3、计算总体平均数的置信区间、计算总体平均数的置信区间上限:上限:下限:下限:即:以即:以95.45%的可靠性估计该农场小麦平均亩产量在的可靠性估计该农场小麦平均亩产量在 397.62斤至斤至402.38斤之间斤之间.问题二解:问题二解:已知:已知:则样本单位数:则样本单位数:即:当即:当至少应抽至少应抽544.6亩作为样本。亩作为样本。例例 题题 二:二:某纱厂某时期内生产了某纱厂某时期内生产了1010万个单位的纱,按纯随机万个单位的纱,按纯随机抽样方式抽取抽样方式抽取20002000个单位检验,检验结果合格率为个单位检验,检验结果合格率为95%95%,废品率为
26、,废品率为5%5%,试以,试以95%95%的把握程度,估计全部的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?纱合格品率的区间范围及合格品数量的区间范围?已知:已知:区间下限:区间下限:区间上限:区间上限:例例 题题 三:三:为调查农民生活状况,在某地区为调查农民生活状况,在某地区5000户农民户农民中,按不重复简单随机抽样法,抽取中,按不重复简单随机抽样法,抽取400户户进行调查,得知这进行调查,得知这400户中拥有彩色电视机户中拥有彩色电视机的农户为的农户为87户。户。要求计算:要求计算:1、以、以95%的把握程度估计该地区全部农户的把握程度估计该地区全部农户中拥有彩色电视
27、机的农户在多大比例之间?中拥有彩色电视机的农户在多大比例之间?2、若要求抽样允许误差不超过若要求抽样允许误差不超过0.02,其它,其它条件不变,问应抽多少户作为样本?条件不变,问应抽多少户作为样本?例例 题题 三三 的的 问问 题题 一一 解:解:已知:已知:N=5000N=4001、计算样本成数、计算样本成数:2、计算抽样平均误差:、计算抽样平均误差:3、计算抽样极限误差:、计算抽样极限误差:4、计算总体、计算总体P的置信区间的置信区间:下限:上限:即:以即:以95%的把握程度估计该地区农户中拥有彩电的农户在的把握程度估计该地区农户中拥有彩电的农户在 17.87%至至25.63%之间。之间。
28、例例 题题 三三 的的 问问 题题 二二 解:解:当当其他条件不变时:其他条件不变时:=1635(户)第四节第四节 抽样组织设计抽样组织设计一、简单随机抽样一、简单随机抽样1、含义:、含义:按随机原则直接从总体按随机原则直接从总体N个单位中个单位中抽取抽取 n 个单位作为样本。个单位作为样本。2、样本单位数的计算方法、样本单位数的计算方法:通过抽样极限误差公式计算必要的样本单位数。通过抽样极限误差公式计算必要的样本单位数。重复抽样重复抽样:不重复抽样:不重复抽样:抽样平均数抽样平均数抽样成数抽样成数二、类型抽样二、类型抽样三、等距抽样三、等距抽样四、整群抽样四、整群抽样先对总体各单位按主要标志
29、加以分组,然后再从先对总体各单位按主要标志加以分组,然后再从各组中按随机的原则抽选一定单位构成样本。各组中按随机的原则抽选一定单位构成样本。先按某一标志对总体各单位进行排队,然后依一先按某一标志对总体各单位进行排队,然后依一定顺序和间隔来抽取样本单位的一种组织形式。定顺序和间隔来抽取样本单位的一种组织形式。将总体各单位划分成许多群,然后从其中随机抽将总体各单位划分成许多群,然后从其中随机抽取部分群,对中选群的所有单位进行全面调查的取部分群,对中选群的所有单位进行全面调查的抽样组织形式。抽样组织形式。什么是总体成数?将总体所包含的总体单位按某一标志划分为两大部分,具有将总体所包含的总体单位按某一标志划分为两大部分,具有某种特征的单位数占全部单位数的比重,就是总体的成数。某种特征的单位数占全部单位数的比重,就是总体的成数。总体的成数就是这个总体的平均数。总体的成数就是这个总体的平均数。产品质量产品质量合格品合格品不合格品不合格品数量(件)数量(件)合合 计计N1N0N总体平均数总体平均数x10f(总体成数)(总体成数)