《第6章 抽样分布.ppt》由会员分享,可在线阅读,更多相关《第6章 抽样分布.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第6 6章章 抽样分布抽样分布 从本章起从本章起,我们转入课程的第二部分我们转入课程的第二部分数理数理统计学统计学.概率论和数理统计都是研究随机现象统概率论和数理统计都是研究随机现象统计规律性的学科计规律性的学科,但是它们在研究问题的方法上但是它们在研究问题的方法上又有其自身的特点又有其自身的特点.在在概率论中概率论中,所研究的随机变量所研究的随机变量,它的它的分布通分布通常是已知的常是已知的或者是假设为已知的或者是假设为已知的,在这一前提下在这一前提下,我们去研究它的性质我们去研究它的性质,特点和规律性特点和规律性.例如求出它例如求出它的数字特征的数字特征,讨论随机变量函数的分布等讨论随机
2、变量函数的分布等.在在数理统计中数理统计中,所研究的随机变量所研究的随机变量,它的它的分布分布是未知的是未知的,或者是分布已知或者是分布已知,但当中的参数未知但当中的参数未知.我们是通过对所研究的随机变量进行重复独立的我们是通过对所研究的随机变量进行重复独立的观察观察,得到许多观察值得到许多观察值,对这些数据进行分析对这些数据进行分析,从从而而对所研究的随机变量的分布做出种种的推断对所研究的随机变量的分布做出种种的推断.数理统计的内容十分丰富数理统计的内容十分丰富,大体上可分为收大体上可分为收集数据和统计推断两个方面集数据和统计推断两个方面:(1)(1)收集数据收集数据 研究如何对随机现象进行
3、观研究如何对随机现象进行观察或试验察或试验,以便获得能够很好地反映整体情况的以便获得能够很好地反映整体情况的局部数据局部数据.其内容包括抽样技术、试验设计等其内容包括抽样技术、试验设计等.(2)(2)统计推断统计推断 研究如何对收集到的局部数研究如何对收集到的局部数据进行整理、分析据进行整理、分析,并对所考察的对象的整体特并对所考察的对象的整体特性做出尽可能准确可信的推测和判断性做出尽可能准确可信的推测和判断.其内容包其内容包括括参数估计、假设检验、方差分析参数估计、假设检验、方差分析和和回归分析回归分析等等.统计推断是数理统计的主体统计推断是数理统计的主体.数理统计具有数理统计具有“部分推断
4、整体部分推断整体”的特的特征征.一、总体一、总体 在在统计统计学中学中,我我们们将将问题问题所涉及的研究所涉及的研究对对象的象的全体称全体称为为总体总体(或母体或母体),),而把而把组组成成总总体的每个研究体的每个研究对对象称象称为为个体个体.例如例如,在研究某批灯泡的平均使用寿命在研究某批灯泡的平均使用寿命时时,该该批批灯泡的全体就灯泡的全体就组组成了成了总总体体,而其中每只灯泡就是个而其中每只灯泡就是个体体.研究某批灯泡的质量研究某批灯泡的质量总体总体个体个体6.1 6.1 总体与样本总体与样本 但是在但是在统计统计学里学里,我我们们关心的不是个体的种种具体关心的不是个体的种种具体特征特征
5、,而而仅仅仅仅是它的某一是它的某一项项(或某几或某几项项)数量指数量指标标X以及以及X的分布情况的分布情况.例如上述例子中研究的是灯泡的例如上述例子中研究的是灯泡的寿命寿命.此此时时,总总体体X是是全体灯泡的使用寿命全体灯泡的使用寿命,个体是每个灯泡的使用寿命个体是每个灯泡的使用寿命.这样这样,若抛开实际背景若抛开实际背景,总体总体X就是一些数就是一些数.由于个由于个体的抽取是随机的体的抽取是随机的,所以总体所以总体X中有大有小中有大有小,有的出现的有的出现的机会多机会多,有的出现的机会少有的出现的机会少,因此用一个概率分布去描述因此用一个概率分布去描述和归纳总体是恰当的和归纳总体是恰当的.从
6、这个意义上看从这个意义上看,总体就是一个分总体就是一个分布布,而其数量指标就是服从这个分布的随机变量而其数量指标就是服从这个分布的随机变量.因此在因此在理论上可以把总体与随机变量的概率分布等同起来理论上可以把总体与随机变量的概率分布等同起来.某批灯泡的寿命某批灯泡的寿命 例如例如:研究某批灯泡的寿命时研究某批灯泡的寿命时,关心的数量指标关心的数量指标就是寿命就是寿命,那么那么,此总体就可以用随机变量此总体就可以用随机变量X表示表示,或用其分布函数或用其分布函数F(x)表示表示.寿命寿命 X 可用一概率可用一概率(指数指数)分布来刻划分布来刻划.统计中统计中,总体这个概念总体这个概念 的要旨是的
7、要旨是:总体就是一个概总体就是一个概率分布率分布.类似地类似地,在研究某地区中学生的营养状况时在研究某地区中学生的营养状况时,若关心若关心的数量指标是身高和体重的数量指标是身高和体重,我们用我们用X 和和Y 分别表示身高分别表示身高和体重和体重,那么此总体就可用二维随机变量那么此总体就可用二维随机变量(X,Y)或其联合或其联合分布函数分布函数 F(x,y)来表示来表示.二、样本二、样本总体分布一般是未知总体分布一般是未知,或只知道是包含未知参数的或只知道是包含未知参数的分布分布.为推断总体分布及各种特征为推断总体分布及各种特征,一般情况下一般情况下,对总体对总体的每一个个体都进行观察或试验是不
8、可能的的每一个个体都进行观察或试验是不可能的,这是因为这是因为经济上、时间上不允许经济上、时间上不允许(如个体的数量很大如个体的数量很大),),或观察试或观察试验是带破坏性的验是带破坏性的(如灯泡的寿命、炮弹的射程如灯泡的寿命、炮弹的射程).).因此因此,必须对总体进行抽样观察必须对总体进行抽样观察.按一定规则从总体中抽取若干个体进行观察试验按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息以获得有关总体的信息,这一抽取过程称为这一抽取过程称为“抽样抽样”,所抽取的部分个体称为所抽取的部分个体称为样本样本.样本中所包含的个体数样本中所包含的个体数目称为目称为样本容量样本容量n.2
9、.独立性独立性:X1,X2,Xn是相互独立的随机变是相互独立的随机变量量.由于抽样的目的是为了对总体的分布进行统计推断由于抽样的目的是为了对总体的分布进行统计推断,为了使抽取的样本能很好地反映总体的信息为了使抽取的样本能很好地反映总体的信息,必须考虑抽必须考虑抽样方法样方法.最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随机抽样简单随机抽样”,它它要求抽取的样本满足下面两点要求抽取的样本满足下面两点:1.代表性代表性:样本具有随机性样本具有随机性,即要求总体中每一个体即要求总体中每一个体都有同等机会被选入样本都有同等机会被选入样本,因此因此 X1,X2,Xn中的每一个中的每一个与所考察
10、的总体有相同的分布与所考察的总体有相同的分布.由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本.今后如不加声明今后如不加声明,均指均指简单简单随机随机样样本本.简单随机样本简单随机样本可以用与总体同分布的可以用与总体同分布的n个相个相互独立的随机变量互独立的随机变量X1,X2,Xn表示表示.=F(x1)F(x2)F(xn)若总体的概率密度函数为若总体的概率密度函数为f(x)、分布函数为、分布函数为F(x),则其简单随机样本的联合概率密度函数为则其简单随机样本的联合概率密度函数为=f(x1)f(x2)f(xn)其简单随机样本的联合分布函数为其简单随机样本的联合分布
11、函数为 统计是从手中已有的资料统计是从手中已有的资料样本值,去推断样本值,去推断总体的情况总体的情况总体分布总体分布F(x)的性质的性质.总体(理论分布)总体(理论分布)?样本样本 样本值样本值总体、样本、样本值的关系总体、样本、样本值的关系6.2 6.2 统计量与抽样分布统计量与抽样分布一、统计量一、统计量 样样本是本是总总体的代表和反映体的代表和反映,但我但我们们在抽取在抽取样样本后本后,并并不直接利用不直接利用样样本本进进行推断行推断,而需要而需要对样对样本本进进行一番行一番“加工加工”和和“提提炼炼”,把把样样本中所包含的关于我本中所包含的关于我们们所关心的事物的所关心的事物的信息集中
12、起来信息集中起来,这这便是便是针对针对不同的不同的问题问题构造构造样样本的某个本的某个函数函数,称之称之为为统计量统计量.样本均值样本均值样本方差样本方差推导推导:下面列出一些常用的下面列出一些常用的统计统计量量样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩k=1,2,k=1,2,比较比较:顺序统计量最小顺序统计量最小顺序统计量:最大顺序统计量最大顺序统计量:以上定义的各个统计量的观察值分别为以上定义的各个统计量的观察值分别为:证证所以所以n 次随机取值的平均值的期望不变次随机取值的平均值的期望不变而而但偏差比任一次取值的偏差缩小了但偏差比任一次取值的偏差缩小了n 倍倍 这是这是取多次测
13、量均值的理论依据取多次测量均值的理论依据.作为样本的函数作为样本的函数,统计量是随机变量统计量是随机变量,因此它有自己的因此它有自己的分布分布.称称统计量的分布为统计量的分布为抽样分布抽样分布.二、统计三大分布二、统计三大分布分布分布1、定义定义记为记为分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布.分布的密度函数为分布的密度函数为 分布具有可加性设,且独立,则证定理定理(1)(1)可加性:可加性:(2(2)标准正态分布标准正态分布的分位点的分位点:查表,查表,分布的分位点分布的分位点:例如,例如,记为记为Tt(n).2 2、t 分布分布定义定义独立独立,则则称随机称随机
14、变变量量 服从服从自由度为自由度为n的的t t分布,分布,偶函数偶函数,关于关于x=0对称对称.当当较较大大时时,t t分布接近于分布接近于标准标准正正态态分布分布.t t分布的分位点分布的分位点:查表,查表,3.上 分位点若则有可查书后附表4由对称性知,有t分布性质与正态分布类似.记为记为FF(m,n).3 3、F 分布分布定义定义独立独立,则则称随机称随机变变量量 服从服从自由度为自由度为(m,n)的的F分布,分布,F(n1,n2)的概率密度的概率密度为为由定义可见,由定义可见,F(n,m)F分布的分位点分布的分位点:例如,例如,例如,例如,例1 设正态总体 ,而 是来自X的样本,令试确定随机变量Y的分布.解解 由已知条件知 填空时可直接写解解 由已知条件及正态分布的独立可加性有例例3解解:解解:例例3