《概率统计第六章第一节.ppt》由会员分享,可在线阅读,更多相关《概率统计第六章第一节.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、现在转入课程的第二部分现在转入课程的第二部分数理统计数理统计 数理统计的特点是应用面广,分支数理统计的特点是应用面广,分支较多较多,社会的发展不断向统计提出新的问社会的发展不断向统计提出新的问题题。从从历历史史的的典典籍籍中中,人人们们不不难难发发现现许许多多关关于于钱钱粮粮、户户口口、地地震震、水水灾灾等等等等的的记记载载,说说明明人人们们很很早早就就开开始始了了统统计计的的工工作作。但是当时的统计,只是对有关事实的但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断导下,作出超越这些数据范围之外的推断。
2、到了十九世纪末二十世纪初,随到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正着近代数学和概率论的发展,才真正诞生了数理统计学这门学科诞生了数理统计学这门学科.数理统计学是一门应用性很强的学科数理统计学是一门应用性很强的学科.它是研究怎样以它是研究怎样以有效的方式有效的方式收集、收集、整理和整理和分析分析带有随机性的数据,带有随机性的数据,以便对所考察的以便对所考察的问题作出推断和预测,直至为采取一定的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议决策和行动提供依据和建议.计算机的诞生与发展,为数据处理提计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计
3、算供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势机的结合是必然的发展趋势.学习统计无须把过多时间花在计算上,学习统计无须把过多时间花在计算上,可以更有效地把时间用在基本概念、方法原可以更有效地把时间用在基本概念、方法原理的正确理解上理的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SAS,SPSS,STAT等,都可以让你快速、等,都可以让你快速、简便地进行数据处理和分析简便地进行数据处理和分析.概率论概率论与与数理统计数理统计是两个有密切联系的学是两个有密切联系的学科科,它们都以随机现象的统计规律为研究对象它们都以随机现象的统计规律为研究对象.但在研究问题的方法上有
4、很大区别:但在研究问题的方法上有很大区别:概率论概率论 已知随机变量服从某分布已知随机变量服从某分布,寻寻求分布的性质、数字特征、及其应用求分布的性质、数字特征、及其应用;数理统计数理统计 通过对试验数据的统计分通过对试验数据的统计分析析,寻找所服从的分布和数字特征寻找所服从的分布和数字特征,从而推断从而推断总体的规律性总体的规律性.数理统计的核心问题数理统计的核心问题由样本推断总体由样本推断总体 6.1 6.1 总体与样本总体与样本1.总体、个体和样本的概念总体、个体和样本的概念2.随机样本的定义随机样本的定义3.小结小结 总体容量有限的称为总体容量有限的称为有有限总体限总体,总体总体 一一
5、个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.(1)(1)总体总体研究对象的全体称为研究对象的全体称为总体总体(母体母体),总体中每个对象称为总体中每个对象称为个体个体.总体、个体和样本的概念总体、个体和样本的概念研究某批灯泡的质量研究某批灯泡的质量总体总体考察国产考察国产 轿车的质量轿车的质量 在统计研究中,人们关心总体仅仅是关心其每个在统计研究中,人们关心总体仅仅是关心其每个个体的一项个体的一项(或几项或几项)数量指标和该数量指标在总体中的分布情况数量指标和该数量指标在总体中的分布情况.该批灯泡寿命的全体就是总体该批灯泡寿命的全体就是总体 灯泡的寿命灯泡的寿命 每公里的耗油
6、量每公里的耗油量所有国产轿车每公里耗油量的全体就是总体所有国产轿车每公里耗油量的全体就是总体这时,这时,每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体.称总体中所含个体的数目为称总体中所含个体的数目为总体容量总体容量,总体容量无限的称为总体容量无限的称为无限总体无限总体.并常用随机变量的记并常用随机变量的记号或用其分布函数表示总体号或用其分布函数表示总体.比如说比如说 总体总体 X 或或 总体总体 F(x).很自然地很自然地,我们就用随机变量我们就用随机变量 X 来表示所考察的总体来表示所考察的总体.设该大学一年级学生的年龄分布如下设该大学一年级学生的年龄分布如下年龄
7、年龄 18 19 20 21 22比例比例 0.5 0.3 0.1 0.07 0.03 若从该大学一年级学生中任意抽查学生若从该大学一年级学生中任意抽查学生的年龄,的年龄,X 的概率分布是:的概率分布是:可见可见,X 的概率分布反映了总体中各个值的分布情况的概率分布反映了总体中各个值的分布情况.考察某大学一年级考察某大学一年级 学生的年龄学生的年龄 某大学一年级全体学生某大学一年级全体学生 的年龄构成问题的总体的年龄构成问题的总体也就是说,也就是说,总体可以用一个随机变量总体可以用一个随机变量 X 或其分布来描述或其分布来描述.所得结果为一随机变量,记作所得结果为一随机变量,记作 X.X 概率
8、概率 X 的的分布函数分布函数和数字特征就是和数字特征就是总体总体的的分布函数和数字特征分布函数和数字特征.今后不必区分总体和其相应的随机变量今后不必区分总体和其相应的随机变量.那么那么,此总体就可用描述其寿命的随机变量此总体就可用描述其寿命的随机变量 X 或用其分或用其分布函数布函数 F(x)表示表示.我们用我们用X和和Y分别表示身高和体重,那么分别表示身高和体重,那么此总体就可用二维随机变量此总体就可用二维随机变量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表来表示示.总体概念的要旨总体概念的要旨:总体就是一个随机变量或总体就是一个随机变量或一个概率分布!一个概率分布!再如再
9、如,若研究某地区中学生的营养状况时若研究某地区中学生的营养状况时,关心关心的数量指标是身高和体重,的数量指标是身高和体重,如研究某批灯泡的寿命时如研究某批灯泡的寿命时,关心的关心的数量指标就是寿命数量指标就是寿命,样本中所包含的个体数目称为样本中所包含的个体数目称为样本容样本容量量.但是,一旦取定一组样本,得到的是但是,一旦取定一组样本,得到的是 n 个具体的数个具体的数 x1,x2,xn ,按一定规则从总体中抽取若干个按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息体进行观察试验以获得有关总体的信息.为推断总体分布及各种特征为推断总体分布及各种特征,从国产轿车中抽从国产轿车中抽
10、5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为 5 (2)样本)样本样本是随机变量样本是随机变量抽到哪抽到哪 5 辆是随机的!辆是随机的!容量为容量为 n 的样本可以看作的样本可以看作n 维随机变量维随机变量(X1,X2,Xn).所所抽取的部分个体称为样本抽取的部分个体称为样本.这一抽取过程称为这一抽取过程称为抽样抽样,称为称为样本样本(X1,X2,Xn)的一组观测值的一组观测值,简称,简称样本值样本值.它要求抽它要求抽取的样本取的样本X1,X2,Xn 满足下面两点满足下面两点:它可它可以用与总体同分布的以用与总体同分布的 n 个相互独立的随机变量个相互独立的随机变量 X1,X2,Xn
11、 表示表示.1.随机性:随机性:随机样本抽取,即随机样本抽取,即Xi(i=1,2,n)与所考察与所考察的总体的总体 X 同分布同分布.为了使抽取为了使抽取的样本能很好地反映总体的信息,的样本能很好地反映总体的信息,必须考虑抽样方法必须考虑抽样方法.最常用的一种抽样方法叫作最常用的一种抽样方法叫作简单随机抽样简单随机抽样,2.独立性:独立性:X1,X2,Xn 是相互独立的随机变量是相互独立的随机变量;抽样的目的是为了对总体进行统计推断,抽样的目的是为了对总体进行统计推断,由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本,简单随机样本,今后今后,说说到到“X1,Xn 是来自某总
12、体的样本是来自某总体的样本”时时,若不特别若不特别说明说明,就指就指简单随机样本简单随机样本.则其简单随机样本的则其简单随机样本的联合分布函数为联合分布函数为F(x1,x2,xn)=简单随机样本是应用中最常见的情形简单随机样本是应用中最常见的情形,若总体若总体 X 的分布函数为的分布函数为F(x),若总体若总体 X 的概率密度为的概率密度为 f(x),则其简单随机样本的联则其简单随机样本的联合概率密度为合概率密度为 F(x1)F(x2)F(xn)解解例例1解解例例23.小结小结(3)(3)简单随机样本简单随机样本:设设X1,X2,Xn 为来自总体的样本为来自总体的样本若若X1,X2,Xn 相互
13、独立且与均总体相互独立且与均总体同分布,称同分布,称X1,X2,Xn 为来自总体的简单随机样本为来自总体的简单随机样本第二节 样本分布函数 直方图一、样本分布函数 我们把总体的分布函数 称为总体分布函数.从总体中抽取容量为n的样本得到n个样本观测值,若样本容量n较大,则相同的观测值可能重复出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表:观测值 总计 频 数 频 率 1其中定义 设函数 其中和式 是对小于或等于 的一切 的频率 求和,则称 为样本分布函数,经验分布函数。易知样本分布函数 具有下列性质:(2)是非减函数 (1)(3)(4)在每个观测值 处是右连续的,点 是 的跳
14、跃间断点,在该点的跃度就等于频率样本分布函数 的图形如图6-1所示图6-1 对于任意的实数 总体分布函数 是事件 的概率;样本分布函数 是事件 发生的频率根据伯努利大数定理可知,当 时,对于任意的正数 ,有 格利文科(Glivenko)进一步证明了 当 时,样本分布函数 与总体分布函数 之间存在着更密切的近似关系的结论.这些结论就是我们在数理统计中可以依据样本来推断总体的理论基础 频率频率直方图常用于描述数据的分布情况直方图常用于描述数据的分布情况,它通常是把它通常是把数据的值域分成若干相等的区间数据的值域分成若干相等的区间,于是数据就按区间分成于是数据就按区间分成若干组若干组,在每个区间上作
15、一个小矩形:在每个区间上作一个小矩形:小矩形的面积该组的频率小矩形的面积该组的频率2所有的小长方形的面积之和所有的小长方形的面积之和.于是于是5.2 直方图直方图1.统计量的定义统计量的定义5.3 统计量统计量是是不是不是实例实例12.几个常用统计量的定义几个常用统计量的定义(1)样本均值样本均值(2)样本方差样本方差其观察值其观察值其观察值其观察值(3)样本标准差样本标准差其观察值其观察值(4)样本样本 k 阶阶(原点原点)矩矩其观察值其观察值(5)样本样本 k 阶中心矩阶中心矩其观察值其观察值当样本容量较大时,相同的样本观测值往往可能重复出现,为了使计算简化,应先把所得的数据整理,设得到下表:观测值 总计 频数 其中 .于是样本均值 ,样本方差样本二阶中心矩 可以分别按下列公式计算:(11)(12)(13)若总体 的 阶矩 存在独立且与 同分布。故有与样本二阶中心矩显然,当样本容量 充分大时,样本方差是近似相等的则当 时独立且与X同分布,所以因为进而由第五章中关于依概率收敛的序列的性质知道其中 为连续函数,这就是下一章所要介绍的矩估计法的理论根据。从而由第五章的大数定理知