抽样与参数估计PPT讲稿.ppt

上传人:石*** 文档编号:88390247 上传时间:2023-04-25 格式:PPT 页数:71 大小:4.32MB
返回 下载 相关 举报
抽样与参数估计PPT讲稿.ppt_第1页
第1页 / 共71页
抽样与参数估计PPT讲稿.ppt_第2页
第2页 / 共71页
点击查看更多>>
资源描述

《抽样与参数估计PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样与参数估计PPT讲稿.ppt(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、抽样与参数估计抽样与参数估计1 1第1页,共71页,编辑于2022年,星期日 第6章 抽样(Sampling)与参数估计(Estimate)n n学习目的和要求学习目的和要求n n学习重点学习重点n n学习难点学习难点 n n教学方法教学方法 n n授课时数授课时数 n n基本内容基本内容 2 2第2页,共71页,编辑于2022年,星期日学习目的与要求学习目的与要求n n通过本章学习能理解参数估计的一般问题;掌握参数的区间估计并会对样本容量的确定掌握。3 3第3页,共71页,编辑于2022年,星期日学习重点学习重点n n均值的区间估计方法的应用均值的区间估计方法的应用n n成数的区间估计方法的

2、应用成数的区间估计方法的应用 4 4第4页,共71页,编辑于2022年,星期日学习难点学习难点n n在不同条件下的区间估计在不同条件下的区间估计5 5第5页,共71页,编辑于2022年,星期日教学方法 n讨论讨论n讲授讲授6 6第6页,共71页,编辑于2022年,星期日基本内容基本内容n n第第1节节 抽样与抽样分布抽样与抽样分布n n第第2节节 参数估计的基本方法参数估计的基本方法 n n第第3节节 总体均值的区间估计总体均值的区间估计n n第第4节节 总体比例的区间估计总体比例的区间估计n n第第5节节 样本容量的确定样本容量的确定n n第第6节节 其它抽样方法及其抽样分布特征其它抽样方法

3、及其抽样分布特征7 7第7页,共71页,编辑于2022年,星期日n n抽样法的特点:随机原则抽样法的特点:随机原则 部分估计总体部分估计总体 存在误差并可以控制存在误差并可以控制n n抽样法的应用:对某些不可能进行全面调查而又抽样法的应用:对某些不可能进行全面调查而又需要了解其需要了解其 全面情况的社会经济现象,必须应全面情况的社会经济现象,必须应用抽样法。(破坏性试验、总体过大、单位过于用抽样法。(破坏性试验、总体过大、单位过于分散,实际调查不可能的)分散,实际调查不可能的)8 8第8页,共71页,编辑于2022年,星期日第1节 抽样与抽样分布一、有关抽样的基本概念一、有关抽样的基本概念n

4、n总体(母体)总体(母体)总体(母体)总体(母体)(Population)(Population)n n样本(子样)样本(子样)样本(子样)样本(子样)(Sample)(Sample)n n总体指标总体指标总体指标总体指标(总体参数总体参数总体参数总体参数)(Population parameterPopulation parameter)n n样本指标样本指标样本指标样本指标(样本统计量样本统计量样本统计量样本统计量)(Sample statisticSample statistic)9 9第9页,共71页,编辑于2022年,星期日抽样方法 n n重置抽样重置抽样重置抽样重置抽样(重复抽样)

5、(重复抽样)(Sampling with replacement)(Sampling with replacement)要从总体要从总体N N个单位中随机抽取一个容量为个单位中随机抽取一个容量为n n的样本,每次从的样本,每次从总体中抽取一个单位,把顺序号登记下来之后,重新放回参加总体中抽取一个单位,把顺序号登记下来之后,重新放回参加下一次抽选,连续反复抽取下一次抽选,连续反复抽取n n次组成所要求容量的样本。次组成所要求容量的样本。n n不重置抽样不重置抽样不重置抽样不重置抽样(不重复抽样)(不重复抽样)(Sampling without replacement)(Sampling with

6、out replacement)要从总体要从总体N N个单位中随机抽取一个容量为个单位中随机抽取一个容量为n n的样本,每的样本,每 次从次从总体中抽取一个单位,被抽中的单位不再放回参加下一次总体中抽取一个单位,被抽中的单位不再放回参加下一次抽选,连续进行次便组成样本。抽选,连续进行次便组成样本。n n 不重复抽样所得样本对总体的代表性较大,抽样误差较小,所不重复抽样所得样本对总体的代表性较大,抽样误差较小,所以实践中通常采用不重复抽样。以实践中通常采用不重复抽样。1010第10页,共71页,编辑于2022年,星期日 概率抽样的组织方式概率抽样的组织方式n n简单随机抽样简单随机抽样:从总体中

7、抽取样本最常用的方法。从从总体中抽取样本最常用的方法。从容量为容量为N N的总体中进行抽样,如果容量为的总体中进行抽样,如果容量为n n 的每个可能样本的每个可能样本被抽到的可能性相等,则称容量为被抽到的可能性相等,则称容量为n n的样本为简单随机样本。的样本为简单随机样本。n n分层抽样:也称分类抽样或类型抽样,它是按某个主要标分层抽样:也称分类抽样或类型抽样,它是按某个主要标志对总体各单位进行分类,然后从各层中按随机原则分别志对总体各单位进行分类,然后从各层中按随机原则分别抽取一定数目的单位构成样本。抽取一定数目的单位构成样本。n n等距抽样等距抽样也称机械抽样或系统抽样。它是先将总体单位

8、按一也称机械抽样或系统抽样。它是先将总体单位按一定顺序排队,计算出抽样间隔(或抽样距离),然后按固定定顺序排队,计算出抽样间隔(或抽样距离),然后按固定的顺序和间隔抽取样本单位。的顺序和间隔抽取样本单位。n n整群抽样:也称丛聚抽样或集团抽样。它是将总体分整群抽样:也称丛聚抽样或集团抽样。它是将总体分为若干部分为若干部分(每一部分称为一个群每一部分称为一个群),然后按随机原则从,然后按随机原则从中一群一群地抽选,对抽中群内的所有单位进行全面调中一群一群地抽选,对抽中群内的所有单位进行全面调查。查。1111第11页,共71页,编辑于2022年,星期日1.1.总体中各元素的观察值所形成的分布总体中

9、各元素的观察值所形成的分布 2.2.分布通常是未知的分布通常是未知的3.3.可以假定它服从某种分布可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体1212第12页,共71页,编辑于2022年,星期日1.1.一个样本中各观察值的分布一个样本中各观察值的分布 2.2.也称经验分布也称经验分布 3.3.当样本容量当样本容量n n逐渐增大时,样本分布逐渐接近总体的分逐渐增大时,样本分布逐渐接近总体的分布布 样本分布样本分布(sample distribution)样样本本1313第13页,共71页,编辑于2022年,星期日二、抽样分布二、抽样分布(Sa

10、mpling distribution)(Sampling distribution)1 1、抽样分布的意义、抽样分布的意义 n n对统计量的所有可能取值及其对应概率的描述,对统计量的所有可能取值及其对应概率的描述,就是统计量的抽样分布,即就是统计量的抽样分布,即抽样分布抽样分布抽样分布抽样分布。n n抽样分布反映样本统计量的分布特征,根据抽样分布抽样分布反映样本统计量的分布特征,根据抽样分布的规律,可揭示样本统计量与总体参数之间的关系,的规律,可揭示样本统计量与总体参数之间的关系,计算抽样误差,并说明抽样推断的可靠程度。计算抽样误差,并说明抽样推断的可靠程度。1414第14页,共71页,编辑

11、于2022年,星期日抽样分布抽样分布(sampling distribution)总体总体计算样本统计计算样本统计量量例如:样本均例如:样本均值、比例、方值、比例、方差差样样本本1515第15页,共71页,编辑于2022年,星期日例:样本均值的抽样分布例:样本均值的抽样分布【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总体体的均值、方差及分布如下的均值、方差及分布如下总体分布总体分布总体分布总体分布1

12、14 42 23 30 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差1616第16页,共71页,编辑于2022年,星期日现从总体中抽取现从总体中抽取现从总体中抽取现从总体中抽取n n2 2的简单随机样本,在重复抽样条的简单随机样本,在重复抽样条的简单随机样本,在重复抽样条的简单随机样本,在重复抽样条件下,共有件下,共有件下,共有件下,共有4 44=164=16个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为个样本。所有样本的结果为n n3,43,4n n3,33,3n n3,23,2n n3,13,1n n3 3n n2,42,4n n2,32,3

13、n n2,22,2n n2,12,1n n2 2n n4,44,4n n4,34,3n n4,24,2n n4,14,1n n4 4n n1,41,4n n4 4n n1,31,3n n3 3n n2 2n n1 1n n1,21,2n n1,11,1n n1 1n n第二个观察值第二个观察值第二个观察值第二个观察值n n第一个第一个第一个第一个n n观察值观察值观察值观察值n n所有可能的所有可能的所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)1717第17页,共71页,编辑于2022年,星期日计算出各样本的均值,如下表。并给出样本均值

14、的抽样计算出各样本的均值,如下表。并给出样本均值的抽样计算出各样本的均值,如下表。并给出样本均值的抽样计算出各样本的均值,如下表。并给出样本均值的抽样分布分布分布分布n n3.53.5n n3.03.0n n2.52.5n n2.02.0n n3 3n n3.03.0n n2.52.5n n2.02.0n n1.51.5n n2 2n n4.04.0n n3.53.5n n3.03.0n n2.52.5n n4 4n n2.52.5n n4 4n n2.02.0n n3 3n n2 2n n1 1n n1.51.5n n1.01.0n n1 1n n第二个观察值第二个观察值第二个观察值第二个观

15、察值第一个第一个第一个第一个观察值观察值观察值观察值n n1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.51818第18页,共71页,编辑于2022年,星期日样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 =2.5=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布P P(X X)

16、1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X1919第19页,共71页,编辑于2022年,星期日2 2、样本均值的抽样分布、样本均值的抽样分布n n样本平均数的标准差反映了样本平均数与总体平均数的平均误差,故样本平均数的标准差反映了样本平均数与总体平均数的平均误差,故称之为称之为抽样平均误差抽样平均误差抽样平均误差抽样平均误差(或抽样标准差)。计算公式:(或抽样标准差)。计算公式:(重复抽样)(重复抽样)n n可见,抽样平均误差与总体标准差成正比变化,与样本容量的平方根可见,抽样平均误差与总体标准差成正比变化,与样本容

17、量的平方根成反比变化。成反比变化。n n当总体为正态分布时,对于任何样本容量,样本平均数的抽当总体为正态分布时,对于任何样本容量,样本平均数的抽样分布是正态分布。若总体方差样分布是正态分布。若总体方差 2 2未知,则可用样本方差未知,则可用样本方差s s2 2取取而代之而代之 。n n样本容量很大,无论总体分布如何,样本平均数近似服从正样本容量很大,无论总体分布如何,样本平均数近似服从正态分布。态分布。2020第20页,共71页,编辑于2022年,星期日3 3、样本比例的抽样分布、样本比例的抽样分布 n n当从总体中抽出一个容量为当从总体中抽出一个容量为n n的样本时,样本比例服从二项分布。的

18、样本时,样本比例服从二项分布。n n当当nn时时,二二项项分分布布趋趋近近于于正正态态分分布布。所所以以,在在大大样样本本下下,若若np5np5且且n(1-p)5n(1-p)5,样本比例,样本比例p p近似服从正态分布。近似服从正态分布。n n比例的抽样平均误差比例的抽样平均误差 (重复抽样)(重复抽样)n n式式中中,P P为为总总体体比比例例,实实际际计计算算时时通通常常采采用用以以往往经经验验数数据据或或样样本本比比例例 。2121第21页,共71页,编辑于2022年,星期日例:灯泡厂从例:灯泡厂从例:灯泡厂从例:灯泡厂从1000010000只灯泡中随机抽取只灯泡中随机抽取只灯泡中随机抽

19、取只灯泡中随机抽取500500只检查其耐用时数,结果只检查其耐用时数,结果只检查其耐用时数,结果只检查其耐用时数,结果如下表。该厂规定耐用时数在如下表。该厂规定耐用时数在如下表。该厂规定耐用时数在如下表。该厂规定耐用时数在850850以下为不合格。求平均耐用时数以下为不合格。求平均耐用时数以下为不合格。求平均耐用时数以下为不合格。求平均耐用时数及不合格率的抽样平均误差。及不合格率的抽样平均误差。及不合格率的抽样平均误差。及不合格率的抽样平均误差。耐用时数耐用时数灯泡数灯泡数 x xxfxf800-850800-850850-900850-900900-950900-950950-1000950

20、-10001000-10501000-10501050-11001050-1100373712912918518510210240407 78258258758759259259759751025102510751075305253052511287511287517112517112599450994504100041000752575253700003700003225003225000 0255000255000400000400000157500157500合计合计500500462500462500147500014750002222第22页,共71页,编辑于2022年,星期日解:解

21、:解:解:n n重复抽样条件下重复抽样条件下 不重复抽样条件下不重复抽样条件下 2323第23页,共71页,编辑于2022年,星期日练习:练习:练习:练习:n n1 1、从某大学学生中随机抽选、从某大学学生中随机抽选100100名调查体重,结果平均体重为名调查体重,结果平均体重为5858千千克。根据过去的资料知道该校学生体重标准差为克。根据过去的资料知道该校学生体重标准差为1010千克。求抽样千克。求抽样误差。误差。n n2 2、某工厂共生产新型聚光灯、某工厂共生产新型聚光灯20002000只,随机抽选只,随机抽选400400只进行耐用时间调只进行耐用时间调查,结果平均寿命为查,结果平均寿命为

22、48004800小时,标准差为小时,标准差为300300小时。求抽样误差。小时。求抽样误差。n n3 3、从某校学生中随机抽选、从某校学生中随机抽选400400名,发现戴眼镜的有名,发现戴眼镜的有8080人。计算求抽人。计算求抽样误差。样误差。n n4 4、一批食品罐头、一批食品罐头6000060000桶,随机抽查桶,随机抽查300300桶,有桶,有6 6桶不合格。求合格桶不合格。求合格率的抽样误差。率的抽样误差。n n5 5、假设、假设4 4个人工资分别为:个人工资分别为:400400、500500、700700、800800元,现随机抽选元,现随机抽选2 2人人进行调查。进行调查。n n(

23、1 1)验证)验证n n(2 2)计算重复抽样及不重复抽样的抽样平均误差。)计算重复抽样及不重复抽样的抽样平均误差。2424第24页,共71页,编辑于2022年,星期日第第2 2节节 参数估计的基本方法参数估计的基本方法 n n参数估计参数估计以实际观察的样本数据所计算的统计量作为未知总体参数以实际观察的样本数据所计算的统计量作为未知总体参数的估计值。的估计值。一、一、点估计点估计点估计点估计(Point estimate)(Point estimate)n n点估计也称定值估计点估计也称定值估计,就是直接以样本统计量作为总体参数的估计值。,就是直接以样本统计量作为总体参数的估计值。n n点估

24、计的优点是它提供了总体参数的具体估计值,可作为决策的点估计的优点是它提供了总体参数的具体估计值,可作为决策的依据,其缺点是不能提供有关抽样误差的信息。依据,其缺点是不能提供有关抽样误差的信息。n n样本均值是总体均值样本均值是总体均值 的点估计量,样本方差的点估计量,样本方差s s2 2是总体方差是总体方差 2 2的点估的点估计量,样本比例计量,样本比例p p是总体比例是总体比例P P的点估计量。的点估计量。n n优良估计量的标准:优良估计量的标准:无偏性无偏性 有效性有效性 一致性一致性2525第25页,共71页,编辑于2022年,星期日二、区间估计二、区间估计(Interval estim

25、ate)(Interval estimate)抽样误差抽样误差抽样误差抽样误差n n统统计计调调查查的的误误差差,是是指指调调查查所所得得结结果果与与总总体体真真值值之之间间的的差差异异。误误差差的的来来源源有有登登登登记记记记性性性性误误误误差差差差和和代代代代表表表表性性性性误误误误差差差差两两大大类类。代代表表性性误误差差分分为为系系系系统统统统性性性性误误误误差差差差和和偶偶偶偶然然然然性性性性误误误误差差差差。抽抽样样估估计计中中所所谓谓的的抽抽抽抽样样样样误误误误差差差差,就就是是指指这这种种偶偶然然性性误误差或随机误差。差或随机误差。n n(1 1)实实实实际际际际抽抽抽抽样样样

26、样误误误误差差差差。指指某某一一特特定定样样本本的的样样本本估估计计值值与与总总体体参参数数真真值值之间的离差。之间的离差。n n(2 2)抽抽抽抽样样样样平平平平均均均均误误误误差差差差。统统计计学学中中常常用用标标准准差差来来衡衡量量均均值值的的代代表表性性,所所以以抽样平均误差可以衡量样本对总体的代表性大小。抽样平均误差可以衡量样本对总体的代表性大小。n n(3 3)抽抽抽抽样样样样极极极极限限限限误误误误差差差差。指指一一定定概概率率条条件件下下抽抽样样误误差差的的可可能能范范围围,也也称称允允许许误误差差。抽抽样样极极限限误误差差的的可可能能范范围围与与抽抽样样估估计计的的可可能能性

27、性即即概概率率紧紧密密相相联。联。2626第26页,共71页,编辑于2022年,星期日n n样本平均数的抽样极限误差样本平均数的抽样极限误差n n样本比例的抽样极限误差样本比例的抽样极限误差n n抽样误差与抽样可靠性的关系抽样误差与抽样可靠性的关系2727第27页,共71页,编辑于2022年,星期日影响抽样误差的主要因素影响抽样误差的主要因素 1 1、抽抽抽抽样样样样单单单单位位位位数数数数的的多多少少。在在其其它它条条件件不不变变的的情情况况下下,抽抽样样单单位位数数愈愈多,抽样误差愈小;反之抽样单位数愈少,抽样误差就愈大。多,抽样误差愈小;反之抽样单位数愈少,抽样误差就愈大。2 2、总体离

28、散程度总体离散程度总体离散程度总体离散程度的高低。当其它条件不变时,总体离散程度愈的高低。当其它条件不变时,总体离散程度愈低,抽样误差愈小;反之总体离散程度愈高,抽样误差愈大。低,抽样误差愈小;反之总体离散程度愈高,抽样误差愈大。3 3、抽样方法、抽样方法 4 4、组织方式、组织方式2828第28页,共71页,编辑于2022年,星期日 第3节 总体均值的区间估计n n一、区间估计的基本原理一、区间估计的基本原理1 1、大数定律、大数定律n n大数定律主要是说明:当大数定律主要是说明:当n n足够大时,独立同分布的随机足够大时,独立同分布的随机变量的算术平均数趋近于数学期望;事件发生的频率变量的

29、算术平均数趋近于数学期望;事件发生的频率接近于其发生的概率。接近于其发生的概率。即样本统计量接近于总体参数。即样本统计量接近于总体参数。2 2、中心极限定理、中心极限定理n n中心极限定理是说明:当中心极限定理是说明:当n n充分大时,大量的起微小作用充分大时,大量的起微小作用的相互独立的随机变量之和趋于正态分布。的相互独立的随机变量之和趋于正态分布。2929第29页,共71页,编辑于2022年,星期日大样本大样本(n30)(n30)下总体均值的区间估计下总体均值的区间估计n n区间估计区间估计区间估计区间估计就是根据样本求出总体未知参数的估计区间,并使其可靠程度就是根据样本求出总体未知参数的

30、估计区间,并使其可靠程度达到预定要求。达到预定要求。n n(1 1 1 1)总体方差总体方差总体方差总体方差2 2 2 2已知时已知时已知时已知时n n由于由于 ,所以对于给定的置信度,所以对于给定的置信度1-1-,有,有n n即即 n n可见,极限误差的计算公式为可见,极限误差的计算公式为n n则总体均值的置信区间为则总体均值的置信区间为3030第30页,共71页,编辑于2022年,星期日例:从某大学学生中随机抽取例:从某大学学生中随机抽取例:从某大学学生中随机抽取例:从某大学学生中随机抽取100100100100名调查体重情况。经称量和计算,得名调查体重情况。经称量和计算,得名调查体重情况

31、。经称量和计算,得名调查体重情况。经称量和计算,得到平均体重为到平均体重为到平均体重为到平均体重为58585858千克。根据过去的资料知道大学生体重的标准差是千克。根据过去的资料知道大学生体重的标准差是千克。根据过去的资料知道大学生体重的标准差是千克。根据过去的资料知道大学生体重的标准差是10101010千克。千克。千克。千克。在在在在95%95%95%95%的置信水平下,求该大学学生平均体重的置信区间。的置信水平下,求该大学学生平均体重的置信区间。的置信水平下,求该大学学生平均体重的置信区间。的置信水平下,求该大学学生平均体重的置信区间。n n解:已知解:已知 =5858,=1010,z z

32、/2/2=1.961.96,n=100n=100n n =10/10=110/10=1(千克)(千克)n n =1.961=1.961.961=1.96(千克)(千克)n n n n 置信下限为置信下限为58-1.96=57.0458-1.96=57.04,n n 置信上限为置信上限为58+1.96=59.9658+1.96=59.96n n故所求置信区间为(故所求置信区间为(57.0457.04,59.9659.96)千克。)千克。3131第31页,共71页,编辑于2022年,星期日 (2 2)总体方差总体方差2 2未知时未知时n n由于由于 t(n-1)t(n-1),对于给定的置信度,对于

33、给定的置信度1-1-,有,有n n置信下限置信下限 置信上限置信上限 n n在大样本下,总体均值的置信区间为在大样本下,总体均值的置信区间为3232第32页,共71页,编辑于2022年,星期日3333第33页,共71页,编辑于2022年,星期日例:某进出口公司出口一种名茶,规定每包重量不低于例:某进出口公司出口一种名茶,规定每包重量不低于例:某进出口公司出口一种名茶,规定每包重量不低于例:某进出口公司出口一种名茶,规定每包重量不低于150150150150克。克。克。克。现不重复抽取现不重复抽取现不重复抽取现不重复抽取1%1%1%1%检验,结果如下。以检验,结果如下。以检验,结果如下。以检验,

34、结果如下。以95.45%95.45%95.45%95.45%的概率估计这批茶叶平的概率估计这批茶叶平的概率估计这批茶叶平的概率估计这批茶叶平均每包重量范围,以确定该批茶叶是否达到要求。均每包重量范围,以确定该批茶叶是否达到要求。均每包重量范围,以确定该批茶叶是否达到要求。均每包重量范围,以确定该批茶叶是否达到要求。每包重量每包重量(克)(克)包数包数x xxfxf1481481491491491491501501501501511511511511521521010202050502020148.5148.5149.5149.5150.5150.5151.5151.51485148529902

35、990752575253030303032.432.412.812.82 228.828.8合计合计100100150301503076763434第34页,共71页,编辑于2022年,星期日解:解:解:解:n n 在在95.45%95.45%的概率保证下,的概率保证下,n n =20.087=0.174(g)=20.087=0.174(g)n n 则总体平均数置信区间为则总体平均数置信区间为n n 即(即(150.126,150.474)150.126,150.474)之间之间n n 说明该批茶叶达到要求。说明该批茶叶达到要求。3535第35页,共71页,编辑于2022年,星期日小样本下(小

36、样本下(n30)n30)总体均值的区间估计总体均值的区间估计n n在小样本条件下,样本平均数的分布依赖于在小样本条件下,样本平均数的分布依赖于总体总体的概率分布。若总体服从正态分布,无论样本容量如何,样本平的概率分布。若总体服从正态分布,无论样本容量如何,样本平均数都服从正态概率分布。若总体不服从正态分布,必须扩大样均数都服从正态概率分布。若总体不服从正态分布,必须扩大样本容量。本容量。n n(1 1 1 1)总体方差)总体方差)总体方差)总体方差2 2 2 2已知时已知时已知时已知时 n n总体均值的置信区间为总体均值的置信区间为 n n(2 2 2 2)总体方差)总体方差)总体方差)总体方

37、差2 2 2 2未知时未知时未知时未知时n n总体均值的置信区间为总体均值的置信区间为 (,)3636第36页,共71页,编辑于2022年,星期日例:某保险公司投保人年龄设某保险公司投保人年龄呈正态分布,现例:某保险公司投保人年龄设某保险公司投保人年龄呈正态分布,现例:某保险公司投保人年龄设某保险公司投保人年龄呈正态分布,现例:某保险公司投保人年龄设某保险公司投保人年龄呈正态分布,现从中抽取从中抽取从中抽取从中抽取10101010人,其年龄分别为:人,其年龄分别为:人,其年龄分别为:人,其年龄分别为:32323232,50505050,40404040,24242424,33333333,44

38、444444,45454545,48484848,44444444,47474747岁。试以岁。试以岁。试以岁。试以95%95%95%95%的置信水平估计该保险公司投保人的平均年龄。的置信水平估计该保险公司投保人的平均年龄。的置信水平估计该保险公司投保人的平均年龄。的置信水平估计该保险公司投保人的平均年龄。解:解:当置信度为当置信度为95%95%时,时,=2.2622 2.6544=6.00(=2.2622 2.6544=6.00(岁)岁)因为因为40.7-6.00=34.7 40.7+6.00=46.740.7-6.00=34.7 40.7+6.00=46.7所以该保险公司投保人的平均年龄的

39、置信区间为(所以该保险公司投保人的平均年龄的置信区间为(34.734.7,46.746.7)岁)岁。3737第37页,共71页,编辑于2022年,星期日第第4 4节节 总体比例的区间估计总体比例的区间估计n n在大样本条件下,若在大样本条件下,若npnp5 5,n(1-p)n(1-p)5 5,则样本比例趋近,则样本比例趋近于正态分布。于正态分布。n n对于给定置信度,有对于给定置信度,有n n总体比例的置信区间为总体比例的置信区间为n n小样本条件下,不作介绍。小样本条件下,不作介绍。3838第38页,共71页,编辑于2022年,星期日例:总体比例的区间估计例:总体比例的区间估计【例例例例】某

40、某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机抽抽取取了了100100个个下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区区间间为为55.65%74.35%55.65%74.35%3939第39页,共71页,编辑于2022年,星期日例:某厂对一批产品

41、进行质量检验,随机重复抽取样品例:某厂对一批产品进行质量检验,随机重复抽取样品例:某厂对一批产品进行质量检验,随机重复抽取样品例:某厂对一批产品进行质量检验,随机重复抽取样品100100100100只,样本合格只,样本合格只,样本合格只,样本合格品率为品率为品率为品率为95959595,试计算把握程度为,试计算把握程度为,试计算把握程度为,试计算把握程度为90909090的合格品率置信区间。的合格品率置信区间。的合格品率置信区间。的合格品率置信区间。解:已知解:已知n=100n=100,p=95%p=95%,1-=90%1-=90%,查表得,查表得z z/2/2=1.645=1.645 =0.

42、0218=0.0218 p p=z=z/2/2 =1.6450.0218=0.0359 =1.6450.0218=0.0359或或3.59%3.59%95%-3.59%=91.41%95%-3.59%=91.41%,95%+3.59%=98.59%95%+3.59%=98.59%故该批产品合格率的置信区间为(故该批产品合格率的置信区间为(91.41%,98.59%)91.41%,98.59%)4040第40页,共71页,编辑于2022年,星期日练习练习1 1 1 1、从一批产品中按不重复随机方法抽选、从一批产品中按不重复随机方法抽选1/201/20,共,共200200件,件,其中废其中废品品8

43、 8件。当概率保证程度为件。当概率保证程度为 95.45%95.45%时,可否认为该批产品的废品时,可否认为该批产品的废品率不超过率不超过5%5%?2 2、一电视节目主持人想了解观众对电视节目的喜欢情况,他选、一电视节目主持人想了解观众对电视节目的喜欢情况,他选取取500500名观众作样本,结果说喜欢该节目的名观众作样本,结果说喜欢该节目的175175人。现以人。现以95%95%的概的概率估计观众喜欢这一节目的区间范围。若该主持人希望估计极限误率估计观众喜欢这一节目的区间范围。若该主持人希望估计极限误差不超过差不超过5%5%,有多大把握?,有多大把握?3 3、已知炼钢厂的铁水含碳量在正常情况下

44、服从正态分布,其方差为、已知炼钢厂的铁水含碳量在正常情况下服从正态分布,其方差为0.1080.1080.1080.108,现测定了,现测定了9 9炉钢水,平均含碳量炉钢水,平均含碳量4.4844.484。按。按95%95%的可的可靠程度估计该厂铁水含碳量。靠程度估计该厂铁水含碳量。4141第41页,共71页,编辑于2022年,星期日4.4.4.4.某市抽查某市抽查某市抽查某市抽查25252525户家庭用户电力消费量,结果如下。试以户家庭用户电力消费量,结果如下。试以户家庭用户电力消费量,结果如下。试以户家庭用户电力消费量,结果如下。试以95%95%95%95%的概率保的概率保的概率保的概率保证

45、,估计全市家庭用户电力平均消费量的置信区间、总消费量的置信区证,估计全市家庭用户电力平均消费量的置信区间、总消费量的置信区证,估计全市家庭用户电力平均消费量的置信区间、总消费量的置信区证,估计全市家庭用户电力平均消费量的置信区间、总消费量的置信区间及用电量在间及用电量在间及用电量在间及用电量在85858585度以上的比例。度以上的比例。度以上的比例。度以上的比例。用电量(度)用电量(度)户数户数45455555555565656565757575758585858595952 25 59 96 63 3合计合计25254242第42页,共71页,编辑于2022年,星期日第5节 样本容量的确定

46、n n在重置抽样下,在重置抽样下,n n所以,必要抽样单位数所以,必要抽样单位数n n在不重置抽样下,必要抽样单位数在不重置抽样下,必要抽样单位数n n 4343第43页,共71页,编辑于2022年,星期日n n例:某市进行职工家庭生活费抽样调查,已知职工家庭平均每人每月生活费收入的标准例:某市进行职工家庭生活费抽样调查,已知职工家庭平均每人每月生活费收入的标准差为差为110110元,允许误差范围元,允许误差范围1010元,概率把握程度元,概率把握程度95%95%,试确定应抽选的户数。,试确定应抽选的户数。解:解:n n例:某企业要调查产品合格率,已知以往的合格率曾有例:某企业要调查产品合格率

47、,已知以往的合格率曾有90%90%、98%98%、99%99%。现要求误差。现要求误差不超过不超过1%1%,把握程度为,把握程度为95%95%,问需要抽选多少件产品?,问需要抽选多少件产品?n n 解:解:n n例:要调查某校大学生英语四级考试成绩,假设根据历史资料该校学生平均成例:要调查某校大学生英语四级考试成绩,假设根据历史资料该校学生平均成绩的标准差为绩的标准差为2020分,及格率为分,及格率为65%65%。现用重复抽样方法,要求在。现用重复抽样方法,要求在95%95%的置信度下,平的置信度下,平均分数的误差不超过均分数的误差不超过2 2分,及格率的误差不超过分,及格率的误差不超过4%4

48、%,求必要抽样数目。,求必要抽样数目。n n 解:解:4444第44页,共71页,编辑于2022年,星期日【例例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为拥有工商管理学士学位的大学毕业生年薪的标准差大约为拥有工商管理学士学位的大学毕业生年薪的标准差大约为拥有工商管理学士学位的大学毕业生年薪的标准差大约为20002000元,假定想要估计年薪元,假定想要估计年薪元,假定想要估计年薪元,假定想要估计年薪95%95%的置信区间,希望边际误差为的置信区间,希望边际误差为的置信区间,希望边际误差为的置信区间,希望边际误差为400400元,应抽取多大的样本容量?元,应抽取多大的样本容量?元,应抽取

49、多大的样本容量?元,应抽取多大的样本容量?解:4545第45页,共71页,编辑于2022年,星期日影响必要抽样数目的因素影响必要抽样数目的因素n n(1 1)允允许许误误差差范范围围。当当其其它它条条件件不不变变时时,允允许许误误差差愈愈小小,必必要要的的抽抽样样单单位位数数就就需需要要愈愈多多;反反之之,允允许许误误差差愈愈大大,抽抽样样单单位位数数就就可以愈少。可以愈少。n n(2 2)总总体体方方差差2 2。其其他他条条件件不不变变的的情情况况下下,总总体体方方差差2 2愈愈大大,总总体体单单位位的的差差异异程程度度愈愈大大,则则样样本本单单位位数数应应愈愈多多;反反之之,样样本本单单位

50、位数数可愈少。可愈少。n n(3 3)抽抽样样估估计计的的可可靠靠程程度度1-1-。当当其其他他条条件件不不变变时时,抽抽样样估估计计的的可可靠靠程程度度愈愈高高,z z/2/2数数值值愈愈大大,抽抽样样数数目目就就必必须须愈愈多多;反反之之,抽抽样样估估计的可靠程度愈低,抽样数目就可以愈少。计的可靠程度愈低,抽样数目就可以愈少。n n(4 4)抽抽样样方方法法。相相同同条条件件下下,由由于于采采用用重重复复抽抽样样比比不不重重复复抽抽样样的的误误差大,所以,前者应比后者多抽一些样本单位。差大,所以,前者应比后者多抽一些样本单位。n n 除上述因素之外,抽样组织方式也是影响抽样单位数的一个原因

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁