《大学课件-概率论之数理统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《大学课件-概率论之数理统计的基本概念.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、从本章起,我们转入课程的第二部分数理统计学。数理统计学与概率论是两个密切联系的姊妹学科。 大体上可以这样说,概率论是数理统计学的基础,而数理统计学是概率论的重要应用。,第六章 数理统计的基本概念,数理统计是一门什么样的学科?,数理统计学是这样一门学科:它使用概率论和其它数学方法,研究怎样收集(通过试验和观察)带有随机误差的数据,并在设定的模型(称为统计模型)之下,对这种数据进行分析(称为统计分析),以对所研究的问题作出推断(称为统计推断)。 由于所收集的统计数据(资料)只能反映事物的局部特征,数理统计的任务就在于从统计资料所反映的局部特征以概率论作为理论基础去推断事物的整体特征。,6.1 总体
2、、样本和统计量,6.1.1 总体与样本,在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体.,比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全 体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X表示.,按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.,从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等(代表性),同时还要求每次的抽取是独立的(独立性), 这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本
3、.往后如不作特别说明,提到“样本”总是指简单随机样本,从总体X中抽取一个个体,就是对随机变量X进行一次试验.抽取n个个体就是对随机变量X进行n次试验,分别记为X1, X2, , Xn.则样本就是n维随机变量(X1,X2,Xn).在一次抽样以后, (X1, X2, ,Xn)就有了一组确定的值(x1, x2, ,xn),称为样本观测值.样本观测值(x1, x2, ,xn)可以看成一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间. 称(X1, X2, ,Xn)为样本,n为样本容量.,总体,样本,样本观察值,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布. 样本是联
4、系两者的桥梁. 总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体.,总体、样本、样本观察值的关系,6.1.2 统计量,统计量的定义 设X1,X2,Xn为来自总体X的样本,称不含未知参数的样本的函数 g(X1,X2,Xn) 为统计量 若 x1,x2,.,xn 为样本观测值,则称 g(x1,x2,.,xn) 为统计量g(X1,X2,Xn)的观测值. 统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数,例 设 X1,X2,Xn 是来自总体 X 的样本,XN(, 2),其中 、 2为未知
5、参数, 则 X1, min X1,X2,Xn 均为统计量,但诸如 等均不是统计量,因它含有未知参数 或,6.2 经验分布函数,设,诸观察值按从小到大可排成,而,是事件,发生的概率.,依伯努利大数定律(频率收敛于概率),有,另外,格里汶科定理指出了这一更深刻的结论,即,6.3 抽样分布,为了用概率的方法探讨一个统计量在推断总体时的性能或把握推断结论的置信程度,我们必须要知道统计量的分布或近似分布.统计量的分布,通常称为抽样分布.,6.3.1 样本均值和样本方差的数字特征,6.3.2 三种重要的概率分布,1. 2分布 定义 设X1,X2,Xn为相互独立的随机变量,它们都服从标准正态分布N(0,1)
6、 ,则称随机变量 所服从的分布为自由度为n的2分布,记为 X 2(n),可以证明,2(n)的概率密度为 其中()称为伽马函数,,2分布概率密度 图6.1 2(n)分布的概率密度曲线 可以看出,随着n的增大图形趋于“平缓”,其图形下区域的 重心亦逐渐往右下移动,2分布具有下面性质:,2. t分布 定义 设X N(0,1),Y 2(n),X与Y独立, 则称随机变量 服从自由度为 n 的 t 分布,又称为学生氏分布. 记为 T t(n),可以证明t(n)的概率密度为:,图6.2 t分布的概率密度曲线,显然t分布的概率密度是x的偶函数,图6.2 描绘了n = 1,3,7时t(n)的概率密度曲线作为比较
7、,还描绘了N(0,1)的概率密度曲线 可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近,3. F分布 命题6.3.4 设X2(m),Y2(n),且X与Y独立,称随机变量 服从自由度为(m,n)的F分布,记为FF(m,n)m, n分别称为第一 自由度和第二自由度. 可以证明其概率密度函数为:,由F分布的定义 容易看出,若 F F(m,n) 则 1/F F(n,m),图6.3 F分布的概率密度曲线,在统计推断(区间估计和假设检验)中,已知总体X的分布及某概率值,需要知道X小于等于哪个数的概率为,这个数称为X的分位数,也就是, 设 X(n) (为某种分布,n为有关自
8、由度), 01,称满足 的数 为分布(n) 的分位数(或分位点).,6.3.3 分位数,求分位点一般采用查表的方法,这些表都是数值运算的结果.R软件中有专门的函数qnorm()(求标准正态分布的分位点)、qt(, n)(求自由度为n的t分布的分位点)、qchisq(,n)(求自由度为n的 2分布的分位点)和qf(, m, n)(求第一自由度为m、第二自由度为n的F分布的分位点).,标准正态分布的分位点用 表示. 标准正态分布和 t 分布还有双侧分位数的定义,即 这是因为标准正态分布和t 分布的密度函数关于y轴是对称的,图6.3.4和6.3.6所示就是双侧分位数, 不难发现,四种常用分布的分位数
9、示意图,另外,在分位点表中对于标准正态分布、t分布和F分布只能查到1/2的分位数,需利用对称性间接查1/2的分位数,对称性指的是以下三个关系式,根据这三个分布的定义和特点很容易得到.,6.3.4 正态总体的抽样分布,一、单个正态总体的抽样分布,推论6.3.1 设 (X1,X2,Xn) 是来自总体 XN(,2) 的一个样本, 则,证明:,且它们表示的随机变量是相互独立的,故,解:,解 :,查表得,则有,由于,二、两个正态总体下的抽样分布,结论1:,证 明:,特别,当12 = 22 时,有,证明:由于,且相互独立, 由F分布的构造知,注意:此结论只有在两个总体的方差相等时才成立.,证明: (1)因为,所以,(2)因为,(3)故,所以,解,(结论1),解:,(推论6.3.4),则,所以,解:,因为,(推论6.3.3),