《数理统计引言及4.1总体与样本(课件).ppt》由会员分享,可在线阅读,更多相关《数理统计引言及4.1总体与样本(课件).ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计的基础知识数理统计的基础知识11.1.某电视机厂全年生产的电视机,某电视机厂全年生产的电视机,2.2.某个交通路口,某个交通路口,3.3.某汽车在高速公路上行驶某汽车在高速公路上行驶,4.4.有一大批工业产品有一大批工业产品,其中参数其中参数电视机电视机的寿命,的寿命,设设X X为任一为任一服从什么分布?服从什么分布?在任意一个小时内在任意一个小时内通过的车辆通过的车辆服从什么分布?服从什么分布?任一时刻的速度任一时刻的速度服从什么分布?服从什么分布?其中有正品和次品其中有正品和次品,任取一件任取一件,记记服从服从01 01 分布分布:数为数为X X,为为X X,从中从中该产品为正品该
2、产品为正品该产品为次品该产品为次品2数理统计数理统计 就是研究怎样有效地收集、就是研究怎样有效地收集、整理和整理和带有随机性的数据带有随机性的数据,以便对所考察的问题以便对所考察的问题作出推断作出推断和和预测预测,分析分析,直至为采取一定的决策和行动直至为采取一定的决策和行动提供依据和建议提供依据和建议.这种由局部观察这种由局部观察来对总体下结论来对总体下结论 必须建立在必须建立在科学的方法基础上科学的方法基础上,否则就会犯错误否则就会犯错误.数理统计的数理统计的就是给出这种统计推断就是给出这种统计推断任务之任务之一一以科学的理论以科学的理论及方法及方法.3数理统计数理统计1.1.如何从总体中
3、抽样如何从总体中抽样?2.2.如何用所抽样品对总体进行推断如何用所抽样品对总体进行推断?抽样抽样全面调查全面调查(如人口普查如人口普查)部分调查部分调查总体总体部分部分抽样抽样统计推断统计推断估计估计假设检验假设检验主要研究两方面的问题主要研究两方面的问题:4由于抽样是一个随机现象由于抽样是一个随机现象,对总体所作的推断不可能绝对准确对总体所作的推断不可能绝对准确,多少含有一定多少含有一定程度的程度的不确定性不确定性,这种不确定性这种不确定性概率大概率大推断比较可靠推断比较可靠概率小概率小推断不太可靠推断不太可靠数理统计的核心问题是数理统计的核心问题是:从总体中抽取样本从总体中抽取样本并且并且
4、必须伴有一定的概率必须伴有一定的概率这种伴有一定概率的推断这种伴有一定概率的推断所以根据部分观测所以根据部分观测或试验或试验的的结果结果用概率的大小表示用概率的大小表示.(部分资料部分资料),),根据样本所得到根据样本所得到的部分的部分信息信息 对该总体作出推断对该总体作出推断(检验、估计检验、估计)以表明推断的以表明推断的称称为为统计推断统计推断.要求每个推断要求每个推断可靠程度可靠程度.51.1.抽样分布抽样分布是进行统计推断的基础理论部分是进行统计推断的基础理论部分.2.2.参数估计参数估计假设总体的分布类型已知假设总体的分布类型已知,3.3.假设检验假设检验对总体的分布对总体的分布估计
5、其中的参数估计其中的参数.或分布中的参数或分布中的参数提出假设提出假设,讨论讨论样本信息样本信息 对假设作出成立与否的判断对假设作出成立与否的判断.怎样怎样利用利用4.4.回归分析回归分析之间的相互关系之间的相互关系,根据样本信息根据样本信息,对两个或两个以上对两个或两个以上 随机变量随机变量进行统计推断进行统计推断.64.1 4.1 总体与样本总体与样本一、总体与总体分布一、总体与总体分布总体总体:研究的对象的全体研究的对象的全体构成的集合构成的集合.个体个体:组成总体的每一个成员组成总体的每一个成员.统计学中关心的统计学中关心的不是每个个体的不是每个个体的所有特性所有特性,而仅仅关心它的某
6、一项而仅仅关心它的某一项或某几项或某几项数量指标数量指标.总体是一个随机变量总体是一个随机变量.(或随机向量或随机向量 )总体的分布总体的分布称为称为总体分布总体分布.定义定义4.14.1统计学中统计学中称随机变量称随机变量(或随机向量或随机向量 )X)X为总体为总体,并把随机变量并把随机变量(或随机向量或随机向量 )X X的分布的分布称为称为总体分布总体分布.用用X X表示每个个体的表示每个个体的这一项这一项 数量指标数量指标.(几项)(几项)7总体中所含个体的数量总体中所含个体的数量容量有限的总体容量有限的总体容量无限的总体容量无限的总体称为称为总体容量总体容量.称为称为无限总体无限总体;
7、称为称为有限总体有限总体;8说明说明:表示总体的表示总体的X X 既可以是随机既可以是随机变量变量,也可以是也可以是随机随机向量向量.如果只关心每一个体的如果只关心每一个体的 一项数量指标,一项数量指标,则总体是随机则总体是随机变量变量;数量指标,数量指标,如果关心两项如果关心两项 或两项以上或两项以上则总体就是随机则总体就是随机向量向量.但为简化讨论,但为简化讨论,本书只考察本书只考察一项数量指标的情形一项数量指标的情形,因此因此,今后总体今后总体都是随机都是随机变量变量.9二二、样本与样本分布、样本与样本分布10由于由于所以样本所以样本通常通常但当一次抽样实现后但当一次抽样实现后,称它们为
8、样本值称它们为样本值一是指某次抽取的一是指某次抽取的有时泛指有时泛指一次抽取的可能结果一次抽取的可能结果,从总体从总体X X中中随机抽取随机抽取n n个个体个个体称为总体称为总体X X的的这这n n个个一个一个容量为容量为 的样本的样本,n n称为称为是从总体是从总体X X中中可能可能结果结果,是是n n个随机变量个随机变量,也把它们看成也把它们看成一个一个元随机向量元随机向量它们就变成了它们就变成了n n个具体个具体的的或样本观测值或样本观测值.常有常有一个容量为一个容量为n n的样本时的样本时,每当提到总体每当提到总体 的的双重双重意义意义:具体数值具体数值,即样本值即样本值这时这时个体个
9、体样本容量样本容量.随机抽取出来的随机抽取出来的数值数值:是指样本随机变量是指样本随机变量11抽样应满足下面两个条件抽样应满足下面两个条件:(1)(1)随机性随机性:(2)(2)独立性独立性:满足以上两个条件的抽样满足以上两个条件的抽样简单随机样本简单随机样本一定一定相互独立相互独立,有了简单随机样本,有了简单随机样本,都都与总体与总体总体中的每一个个体总体中的每一个个体 有同等的机会有同等的机会每次抽取的结果每次抽取的结果,不受其它抽取结果不受其它抽取结果也不影响其它抽取结果也不影响其它抽取结果.称为称为简单随机抽样简单随机抽样且每个且每个有相同的分布有相同的分布.被抽到被抽到.的影响的影响
10、,就可以利用概率论中就可以利用概率论中 独立,独立,同分布同分布 条件下的一系列结论条件下的一系列结论.12定义定义4.2 4.2 是一组是一组相互相互独立,独立,在一次试验中在一次试验中,称为样本值称为样本值设设X X是总体是总体,的随机变量的随机变量.且与且与 有相同分布有相同分布则称则称简单随机样本简单随机样本,简称简称样本样本.为来自总体为来自总体 的的称为样本容量称为样本容量,样本的具体观测值样本的具体观测值或样本观测值或样本观测值.13设总体设总体X X的分布函数为的分布函数为故样本故样本的分布函数为:的分布函数为:因因都与总体同分布,都与总体同分布,故故的分布函数也是的分布函数也
11、是14由于由于相互独立相互独立,所以所以(1)(1)若总体若总体X X 是连续型的是连续型的与总体与总体 有相同的分布有相同的分布,所以所以由于由于所以所以 的的联合密度联合密度函数为函数为其概率分布为其概率分布为由于由于独立独立,是离散型的是离散型的,(2)(2)若总体若总体X X 与与X X同分布同分布,154.2 4.2 统计量统计量定义定义4.3 4.3 的函数的函数,任一不含未知参数任一不含未知参数为为统计量统计量.说明说明:也是随机变量也是随机变量.(2)(2)统计量中可以有参数统计量中可以有参数,是来自总体是来自总体X X的样本的样本,称称(1)(1)统计量统计量但不能有未知参数
12、但不能有未知参数.设设16例例 当当已知时已知时,当当未知时未知时,的一次观测值的一次观测值由于统计量由于统计量 就可以算出就可以算出称为统计量称为统计量 观测值观测值.设总体设总体是来自是来自 的一个样本的一个样本,是统计量是统计量;不是统计量不是统计量.中不含未知参数中不含未知参数,对样本对样本的的17二、常用的统计量二、常用的统计量是来自总体是来自总体X X的样本的样本,设设1.1.样本均值样本均值2.2.样本方差样本方差未未修正修正样本方差样本方差修正修正样本方差样本方差要估计总体的方差要估计总体的方差用用比用比用更好更好,简称简称为样本方差为样本方差.18未修正未修正样本方差样本方差
13、样本方差样本方差当当 n n 较大时较大时,19样本方差样本方差3.3.样本标准差样本标准差4.4.样本样本k k阶原点矩阶原点矩5.5.样本样本k k阶中心矩阶中心矩15 15 统称为统称为矩统计量矩统计量,简称为简称为样本矩样本矩.它们都可表为样本的显式函数它们都可表为样本的显式函数.205.5.样本样本k k阶中心矩阶中心矩时,时,216.6.顺序统计量顺序统计量是来自总体是来自总体X X的样本的样本,设设将各分量将各分量按由小到大的次序排列成按由小到大的次序排列成称称为样本的一组为样本的一组称为称为样本极小值样本极小值;称为称为样本极大值样本极大值;称为称为样本的极差样本的极差.顺序统
14、计量顺序统计量.22三三、枢轴量、枢轴量定义定义 的分布已知的分布已知,中仅包含总体的一个中仅包含总体的一个则称则称是来自总体是来自总体X X的样本的样本,设设如果函数如果函数未知参数未知参数并且并且设总体设总体X X的分布中的分布中 含有未知参数含有未知参数,为了为了估计估计,需构造一个包含需构造一个包含的的样本函数样本函数其分布已知其分布已知.已知分布已知分布为为枢轴量枢轴量.234.3 4.3 常用的统计分布常用的统计分布24给定的给定的一一、分位数、分位数定义定义4.44.4 设随机变量设随机变量X X对给定对给定的实数的实数,如果实数如果实数满足条件满足条件则称则称为为X X的分布的
15、的分布的水平水平的的上侧上侧分位数分位数.当当X X是连续型随机变量时,是连续型随机变量时,其密度函数为其密度函数为的分布函数为的分布函数为25为为 的的水平水平的上侧分位数的上侧分位数.给定的给定的为为 的的水平水平1-1-的上侧分位数的上侧分位数.26例例 求标准正态分布的求标准正态分布的上侧分位数:上侧分位数:解解27如果连续型随机变量如果连续型随机变量X X 的密度函数的密度函数是偶函数是偶函数.即密度函数的图像即密度函数的图像关于关于 y y 轴对称轴对称.称称X X是是对称分布的随机变量对称分布的随机变量,此时可定义此时可定义定义定义4.54.5其分布函数其分布函数对给定的实数对给
16、定的实数,如果正实数如果正实数满足条件满足条件则称则称水平水平的的双侧双侧分位数分位数.双侧双侧分位数分位数.设设X X是对称分布的随机变量是对称分布的随机变量,为为为为X X的分布的的分布的注意注意:只有具有对称分布只有具有对称分布的随机变量的随机变量,才有双侧分位数才有双侧分位数.28具有对称分布具有对称分布水平水平的双侧分位数的双侧分位数.为为X X的分布的的分布的对于对于的随机变量的随机变量X X29例例 求标准正态分布的求标准正态分布的水平水平=0.05,=0.05,的双侧分位数的双侧分位数.及及=0.1=0.1解解=0.05=0.05时时,设对应的双侧分位数为设对应的双侧分位数为=
17、0.1=0.1时时,设对应的双侧分位数为设对应的双侧分位数为30函数函数:如如函数有性质函数有性质如如311.1.定义定义定义定义4.6 4.6 记为记为则称则称X X服从服从自由度为自由度为 的的其中其中 时时 与与 有关有关.若随机变量若随机变量 的密度函数为的密度函数为n n为给定自然数为给定自然数.32即即当当 时时,指数分布指数分布.就是参数为就是参数为 的的当当 时时,密度函数的图像密度函数的图像皆为单峰曲线,皆为单峰曲线,n n 越大越大,峰值越靠右峰值越靠右,曲线越平缓曲线越平缓.33定理定理4.2 4.2 推论推论 相互独立,相互独立,设随机变量设随机变量 与与都服从都服从
18、则则若随机变量若随机变量相互独立相互独立,则则分布分布,都服从都服从 分布分布,34定理定理 设设则则因为因为定理定理 若随机变量若随机变量相互独立相互独立,且且则则证证相互独立相互独立,所以所以也相互独立也相互独立.根据根据 分布的可加分布的可加性性,即即P66P66,例,例2.292.29当当n n较大时较大时,可用正态分布近似可用正态分布近似.35例例 且且求求解解 设设相互独立相互独立,则则 分布的自由度分布的自由度就是其数学期望就是其数学期望.进而可求出进而可求出设设36 设设对于给定的对于给定的水平水平的的上侧分位数上侧分位数给定的给定的37例例 设设例例 例例 设设当当n n较大
19、时较大时,可用可用正态分布近似正态分布近似.当当n n4545时时,有表可查有表可查.的上侧分位数的上侧分位数38例例 设设解解 求求解解 求求例例 设总体设总体一个简单随机样本一个简单随机样本,为来自为来自 的的39相互独立相互独立也相互独立也相互独立.求求例例 设总体设总体一个简单随机样本一个简单随机样本,为来自为来自 的的解解 40函数函数如如函数有性质函数有性质在区间在区间41三、三、F F 分布分布1.1.定义定义定义定义4.7 4.7 的概率密度函数为的概率密度函数为 若随机变量若随机变量 则称则称X X服从服从记为记为自由度为自由度为m m和和n n其中其中 是给定自然数是给定自
20、然数.的的F F分布分布,称为第一自由度称为第一自由度,称为第二自由度称为第二自由度.42即即432.F2.F分布的典型模式分布的典型模式 定理定理4.3 4.3 则则设随机变量设随机变量X X和和Y Y 相互独立相互独立,推论推论 若随机变量若随机变量则则443.F3.F分布的分布的 设设对于给定的对于给定的水平水平的的上侧分位数上侧分位数给定的给定的45例例(P276 )(P276 )即即即即当当0.10.1时时,可查表可查表.46在在F F分布表中,分布表中,当当 较大时较大时,例例 设设求求0.975可用结论可用结论:解解47一般地,一般地,对对有有证证 设设证毕证毕48四、四、t t
21、分布分布1.1.定义定义定义定义4.8 4.8 的概率密度函数为的概率密度函数为 若随机变量若随机变量 则称则称X X服从服从记为记为t t 分布分布,其中其中 是给定自然数是给定自然数.说明说明:为偶函数为偶函数,其图象关于其图象关于 轴对称轴对称.轴为轴为 的渐近线的渐近线.与标准正态分布与标准正态分布 的密度函数接近的密度函数接近.(4)(4)当当 较大时较大时,自由度为自由度为n n 的的为函数的最大值为函数的最大值.49即即是偶函数是偶函数,得到得到由由 分布的密度函数分布的密度函数50 定理定理4.4 4.4 2.2.分布的典型模式分布的典型模式设随机变量设随机变量且且X X与与Y
22、 Y独立独立,则则51 设设对于给定的对于给定的水平水平的的上侧分位数上侧分位数给定的给定的给定的给定的52例例 设设P286P28653例例 设设544.4 4.4 抽样分布抽样分布55定理定理 设设则则定理定理 若随机变量若随机变量相互独立相互独立,且且则则 定理定理4.3 4.3 则则设随机变量设随机变量X X和和Y Y 相互独立相互独立,定理定理4.4 4.4 设随机变量设随机变量且且X X与与Y Y独立独立,则则56一、正态总体的抽样分布一、正态总体的抽样分布 定理定理一个简单随机样本一个简单随机样本,证证故它们的故它们的X X的的则则因为因为独立独立,即即且都与且都与 同分布同分布
23、,线性组合线性组合设总体设总体 是是来自来自57在此定理的条件下,在此定理的条件下,定理定理一个简单随机样本一个简单随机样本,X X的的则则设总体设总体 是是来自来自58 定理定理4.1 4.1 一个简单随机样本一个简单随机样本,来自来自X X的的设总体设总体 是是分别为样本均值分别为样本均值则则相互独立相互独立.和样本方差和样本方差,与与59 定理定理4.2 4.2 一个简单随机样本一个简单随机样本,来自来自X X的的设总体设总体 是是分别为样本均值和样本方差分别为样本均值和样本方差,则则1.1.单正态总体的抽样分布单正态总体的抽样分布602.2.双正态总体的抽样分布双正态总体的抽样分布设两
24、个正态总体设两个正态总体的样本的样本,与与相互独立相互独立,是总体是总体X X的的容量为容量为 的样本的样本,是总体是总体Y Y的的 容量为容量为 与与也相互独立也相互独立,故故P134 P134 定理定理4.3 4.3(1 1)61设两个正态总体设两个正态总体的样本的样本,与与相互独立相互独立,是是X X的容量为的容量为 的样本的样本,是是Y Y的的容量为容量为 与与也相互独立也相互独立,故故 定理定理4.34.3(1 1)当当时,时,62设两个正态总体设两个正态总体与与相互独立相互独立,是总体是总体X X的的容量为容量为 的样本的样本,是总体是总体Y Y的的有相同的方差,有相同的方差,的样本的样本,容量为容量为 则则其中其中定理定理4.34.3(3 3)63设两个正态总体设两个正态总体的样本的样本,与与相互独立相互独立,是总体是总体X X的的容量为容量为 的样本的样本,是总体是总体Y Y的的容量为容量为 定理定理4.3 4.3(2 2)64例例设设是来自总体是来自总体的简单随机的简单随机样本,样本,求系数求系数使使 服从服从 分分布布,并求其自由度并求其自由度.解解自由度为自由度为3.3.65