《统计学 第四版(cha6).ppt》由会员分享,可在线阅读,更多相关《统计学 第四版(cha6).ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章第六章 统计量及其抽样分布统计量及其抽样分布p统计量统计量p关于分布的几个概念关于分布的几个概念p有正态分布导出的几个重要分布有正态分布导出的几个重要分布p样本均值的分布与中心极限定理样本均值的分布与中心极限定理p样本比例的抽样分布样本比例的抽样分布p两个样本均值之差的分布两个样本均值之差的分布p关于样本方差的分布关于样本方差的分布第一节第一节 统计量统计量n统计量统计量设设 是从总体是从总体 中抽取的容中抽取的容 量为量为 的一个样本,如果由此样本构造一个函的一个样本,如果由此样本构造一个函 数数 ,不依赖于任何未知参数,不依赖于任何未知参数,则称函数则称函数 是一个统计量。是一个统计
2、量。例:设例:设 是从某总体是从某总体 中抽取的一个中抽取的一个 样本,则样本,则 统计量统计量 非统计量非统计量n常用统计量常用统计量样本均值样本均值样本方差样本方差样本变异系数样本变异系数样本偏度样本偏度n次序统计量次序统计量设设 是从总体是从总体 中抽取的一个中抽取的一个 样本,样本,称为第称为第 个次序统计量,它是样本个次序统计量,它是样本 满足如下条件的函数:每当满足如下条件的函数:每当 样本得到一组观测值样本得到一组观测值 时,其由小时,其由小 到大的排序到大的排序 中,第中,第 个个 值值 就作为次序统计量就作为次序统计量 的观测值,而的观测值,而 称为次序统计量。其中,称为次序
3、统计量。其中,和和 分别分别 为最小和最大次序统计量。为最小和最大次序统计量。例:例:、中位数、四分位数都是。、中位数、四分位数都是。n充分统计量充分统计量统计量加工过程中样本信息一点都不损失的统统计量加工过程中样本信息一点都不损失的统计量称为计量称为充分统计量充分统计量例:某电子元件厂欲了解其产品的不合格率,质检员抽检了例:某电子元件厂欲了解其产品的不合格率,质检员抽检了100个电子元件,检查结果是,除前个电子元件,检查结果是,除前3个不合格外,其它个不合格外,其它都是合格品。当企业领导问及结果时,质检员给出如下都是合格品。当企业领导问及结果时,质检员给出如下两种回答:两种回答:(1)抽检的
4、)抽检的100个产品中有个产品中有3个不合格;个不合格;(2)抽检的产品前)抽检的产品前3个是不合格的。个是不合格的。若记若记 为产品不合格,为产品不合格,为产品合格,则两种为产品合格,则两种回答的统计量分别是回答的统计量分别是 和和 前者是充前者是充分统计量而后者不是。分统计量而后者不是。第二节第二节 关于分布的几个概念关于分布的几个概念总体分布总体分布样本分布样本分布抽样分布抽样分布渐进分布渐进分布近似分布近似分布n总体参数总体参数总体平均值总体平均值总体方差总体方差总体标准差总体标准差总体比率总体比率n样本统计量样本统计量从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本
5、个单位作为样本样本平均值样本平均值样本方差样本方差样本标准差样本标准差样本比率样本比率n总体分布总体分布(population distribution)总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 分布通常是未知的分布通常是未知的可以假定它服从某种分布可以假定它服从某种分布 总体总体总体总体n样本分布样本分布(sample distribution)一个样本中各观察值的分布一个样本中各观察值的分布 也称经验分布也称经验分布当样本容量当样本容量n逐渐增大时,样本分布逐渐接近总逐渐增大时,样本分布逐渐接近总体的分布体的分布 样样样样本本本本n抽样分布抽样分布(sampling
6、 distribution)样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布-在重复选取容量为在重复选取容量为n的样本时,由该统计量的的样本时,由该统计量的所有可能取值形成的相对频数分布所有可能取值形成的相对频数分布 随机变量是样本统计量随机变量是样本统计量-样本均值样本均值,样本比率,样本方差等样本比率,样本方差等结果来自容量相同的所有可能样本结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据断的理论基础,也是抽样推断科学性的重要依据 n抽样分布的形成过程抽样分布
7、的形成过程总体总体总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、比率、方差比率、方差比率、方差样样样样本本本本n渐进分布渐进分布(asymptotic distribution)当样本量当样本量 无限增大时,统计量无限增大时,统计量的极限分布称为的极限分布称为渐进分布渐进分布例:设例:设 是抽自正态总体是抽自正态总体 的一个样本。当的一个样本。当 时,时,和和 ,所以统计量,所以统计量 的渐进分布为的渐进分布为 。由于精确的抽样分布往往很难求,在实际应用中,由于精确的抽样分布往往很难求,在实际应用中,当当
8、较大时,就用这种极限分布作为抽样分布的一较大时,就用这种极限分布作为抽样分布的一种近似。种近似。n近似分布(近似分布(approximate distribution)在精确的抽样分布和渐进分布都很难求得的情况下,在精确的抽样分布和渐进分布都很难求得的情况下,还可利用计算机模拟来获得某种统计量的近似分布还可利用计算机模拟来获得某种统计量的近似分布n获取方法获取方法 1 确定统计量确定统计量T 及样本容量及样本容量n;2 从总体中抽取从总体中抽取N个样本,并计算统计量的值(观测个样本,并计算统计量的值(观测值),记为值),记为T1,T2,TN;3 根据这根据这N个观测值构件经验分布函数个观测值构
9、件经验分布函数 。就是就是 的近似分布。的近似分布。2 分布分布第三节第三节 几个重要理论分布几个重要理论分布分布分布1 3 分布分布n 2分布分布设随机变量相互独立且皆服从设随机变量相互独立且皆服从 ,则随机变量,则随机变量 所服从的分布称为分布,记为所服从的分布称为分布,记为 X 其中,参数其中,参数n称为自由度称为自由度n 2(卡方)分布是由海尔墨特(卡方)分布是由海尔墨特(Hermert)和卡和卡皮尔生皮尔生(K.Person)分别于分别于1875年和年和1900年导出的,它是从正态分布派生出来的年导出的,它是从正态分布派生出来的一个分布,在统计学中占有重要地位一个分布,在统计学中占有
10、重要地位n分布的变量值始终为正分布的变量值始终为正 n 2分布的数学期望是自由度分布的数学期望是自由度n,方差为方差为2 nn分布的形状取决于其自由度分布的形状取决于其自由度n的大小,通常的大小,通常为不对称的正偏分布,但随着自由度的增大为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。逐渐趋于对称。一般当一般当n 30 30时,时,2分布分布可用正态分布近似计算可用正态分布近似计算n 分布图示分布图示 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20n 分布的使用分布的使用 nt分布分布对对t-分分布布是是由由W.S.Gosset(1876-1937)于
11、于1908年年在在一一篇篇署署名名为为“student”的的论论文文中中首首次次提提出出,因此又称为因此又称为“学生氏学生氏”分布分布t -分布是一概率分布簇分布是一概率分布簇某某一一特特定定的的 t 分分布布依依赖赖于于参参数数,称称之之为为自自由由度度(=n-1)随随着着自自由由度度的的增增加加,t-分分布布与与正正态态分分布布之之间间的的差差距距将将会会不不断断减减小小(n30),且且t-分分布布的的离离散散程程度度也将减小也将减小t-分布的均值为分布的均值为0,方差为,方差为x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比
12、较t t 分布分布分布分布标准正态分布标准正态分布标准正态分布标准正态分布t t不同自由度的不同自由度的不同自由度的不同自由度的t t分布分布分布分布标准正态分布标准正态分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z znt分布与标准正态的对比分布与标准正态的对比nF分布分布设设若若随随机机变变量量U为为服服从从自自由由度度为为n1的的 2分分布布,即即U 2(n1),V为为服服从从自自由由度度为为n2的的 2分分布布,即即V 2(n2),且且U和和V相互独立,则随机变量相互独立,则随机变量服从自由度服从自由度n1和和n2的的F分布,记为分布,记为n
13、F分布的图示分布的图示F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)nF分布的使用分布的使用 F 分布分布F(k-1,n-k)0 0F Fn抽样分布定理抽样分布定理正正态态分分布布再再生生定定理理:设设为为一一组组相相互互独独立立的的随随机机变变量量,且且都都服服从从正正态态分分布布 ;则则 服从正态分布服从正态分布其中:其中:当当 ,可认为,可认为第四节第四节 样本均值的分布与样本均值的分布与 中心极限定理中心极限定理中中心心极极限限定定理理:设设 为为一一组组独独立立同同分分布布的的随随机机变变量量,期期望望为为 ,标标准准差差为为 ;则服从;则服从
14、分布。分布。其中:其中:且且例:例:x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的的的的过过过过程程程程例:例:解:样本来自于标准差已知的正态分布总体,故抽样分布解:样本来自于标准差已知的正态分布总体,故抽样分布解:样本来自于标准差已知的正态分布总体,故抽样分布解:样本来自于标准差已知的正态分布总体,故抽样分布为正态分布。其中为正态分布。其中为正态分布。其中为正态分布。其中某类钢制产品的重量,经过多次衡量,取得有差异的某类钢制产品的重量,经过多次衡量,取得有差异的一系列数据,这些数据近似的服从正态分布。设平均一系列数据,这些数据近似的服从正态分布。设平均值为
15、值为28002800公斤,方差为公斤,方差为90009000公斤。现假定从该总体中公斤。现假定从该总体中抽出容量为抽出容量为1010的随机样本。问这个样本的平均重量小的随机样本。问这个样本的平均重量小于或等于于或等于27502750公斤的概率为多大?公斤的概率为多大?n抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布n比率(比率(proportion)总总体体(或或样样本本)中中具具有有某某种种属属性性的的单单位位与与全全部部单单位位总数之比总数之比-
16、不同性别的人与全部人数之比不同性别的人与全部人数之比-合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比总体比率可表示为总体比率可表示为样本比率可表示为样本比率可表示为第五节第五节 样本比例的抽样分布样本比例的抽样分布n样本比率的抽样分布样本比率的抽样分布当当0.1730时,时,p服从正态分布服从正态分布样本比率的数学期望样本比率的数学期望样本比率的标准差样本比率的标准差-重复抽样重复抽样-不重复抽样不重复抽样例:例:解:总体比率解:总体比率解:总体比率解:总体比率 ,由于,由于,由于,由于 都大于都大于都大于都大于5 5,可以认为比率的抽样分布为正态分布。有,可以认为比
17、率的抽样分布为正态分布。有,可以认为比率的抽样分布为正态分布。有,可以认为比率的抽样分布为正态分布。有某大学想开设新课程某大学想开设新课程“调研方法调研方法”。在向学生介绍了。在向学生介绍了课程的基本内容后,校报想作随机抽样调查。假设全课程的基本内容后,校报想作随机抽样调查。假设全校学生中有校学生中有60%60%的人认为有必要开设这门课程。问:随的人认为有必要开设这门课程。问:随机抽取机抽取5050人中,有人中,有60%60%至至80%80%的人认为有必要开设这门的人认为有必要开设这门课程的概率有多大?课程的概率有多大?设设 是独立地抽自总体是独立地抽自总体 的一个容量为的一个容量为 的的样本
18、的均值,样本的均值,是独立地抽自总体是独立地抽自总体 的容的容量为量为 的样本的均值,则有的样本的均值,则有如果两个总体均为正态分布,则如果两个总体均为正态分布,则 也为正态分也为正态分布。当布。当 ,时,则时,则 的抽样分布不的抽样分布不管总体分布如何均可用正态分布来近似。管总体分布如何均可用正态分布来近似。第六节第六节 两个样本均值之差的分布两个样本均值之差的分布例:例:解:两个总体都是正态分布,所以解:两个总体都是正态分布,所以解:两个总体都是正态分布,所以解:两个总体都是正态分布,所以 也为正态分布,也为正态分布,也为正态分布,也为正态分布,且且且且 故故故故设有甲、乙两所高校在某年录
19、取新生时,甲设有甲、乙两所高校在某年录取新生时,甲校校的平均的平均分为分为655655分,且服从正态分布,标准差为分,且服从正态分布,标准差为2020分;乙校的分;乙校的平均分为平均分为625625分,也是正态分布,标准差为分,也是正态分布,标准差为2525分。现从分。现从甲、乙两校个随机抽取甲、乙两校个随机抽取8 8名新生计算其平均分数,出现名新生计算其平均分数,出现甲校比乙校的平均分低的可能性有多大?甲校比乙校的平均分低的可能性有多大?n两个样本比例之差的抽样分布两个样本比例之差的抽样分布 设分别从具有参数为设分别从具有参数为 和和 的两个二项总体中抽取的两个二项总体中抽取 包含包含 个观
20、测值和个观测值和 个观测值的独立样本,则两个个观测值的独立样本,则两个 样本比例差的抽样分布分别为:样本比例差的抽样分布分别为:具有下列性质:具有下列性质:(1)(2)当)当 和和 很大时,很大时,的抽样分布近似为正的抽样分布近似为正态分布。态分布。例:例:解:已知大样本,解:已知大样本,解:已知大样本,解:已知大样本,的抽样分布近似服从正态分布。的抽样分布近似服从正态分布。的抽样分布近似服从正态分布。的抽样分布近似服从正态分布。故故故故一项抽样调查表明甲城市的消费者中有一项抽样调查表明甲城市的消费者中有15%15%的人喝过商的人喝过商标为标为“圣洁圣洁”牌矿泉水,而乙城市的消费者中只有牌矿泉
21、水,而乙城市的消费者中只有8%8%的人喝过。如果这些数据是真实的,那么当我们分别的人喝过。如果这些数据是真实的,那么当我们分别从甲城市抽取从甲城市抽取120120人,乙城市抽取人,乙城市抽取140140人组成两个独立人组成两个独立随机样本时,样本比例差不低于随机样本时,样本比例差不低于0.080.08的概率有多大?的概率有多大?n样本方差的分布样本方差的分布 设设 是来自总体分布为是来自总体分布为 的正的正态分布的样本,则样本方差态分布的样本,则样本方差 的分布为:的分布为:其中,其中,称为自由度为称为自由度为 的的 分布。分布。第七节第七节 关于样本方差的分布关于样本方差的分布n两个样本方差比的分布两个样本方差比的分布 设设 是来自正态总体是来自正态总体 的一个的一个样本,样本,是来自正态总体是来自正态总体 的一的一个样本,且个样本,且 与与 相互独立,相互独立,则则 是第一自由度(分子自由度)为是第一自由度(分子自由度)为 ,第二自由度(分母自由度)为,第二自由度(分母自由度)为 的的 分布。分布。