《第四章 随机抽样与抽样分布优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章 随机抽样与抽样分布优秀课件.ppt(76页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 随机抽样与抽样分布第1页,本讲稿共76页定义:定义:数理统计是以数理统计是以概率论概率论为基础,研究社会和为基础,研究社会和自然界中大量随机现象数量变化基本规律的一种自然界中大量随机现象数量变化基本规律的一种方法。方法。其主要内容有:其主要内容有:参数估计参数估计、假设检验假设检验、相关相关分析分析、试验设计试验设计、非参数统计非参数统计、过程统计过程统计等等。第2页,本讲稿共76页特点:特点:它以随机现象的观察试验取得资料作为出发点,以概率论为理论基础来研究随机现象.根据资料为随机现象选择数学模型,且利用数学资料来验证数学模型是否合适,在合适的基础上再研究它的特点,性质和规律性.第3
2、页,本讲稿共76页起源与发展起源与发展:古典时期古典时期(19(19世纪以前世纪以前):这是描述性的这是描述性的统计学统计学形成和发展阶段,是数理统计的萌形成和发展阶段,是数理统计的萌芽时期。瑞土数学家贝努里芽时期。瑞土数学家贝努里(1654-1795(1654-1795年年)较早地系统论证较早地系统论证了了大数定律大数定律。17631763年,英国数学家年,英国数学家贝叶斯贝叶斯提出了一种提出了一种归纳推归纳推理理的理论,后被发展为一种的理论,后被发展为一种统计推断统计推断方法方法贝叶斯方法,贝叶斯方法,开创了数理统计的先河。法国数学家开创了数理统计的先河。法国数学家棣莫佛棣莫佛(1667-
3、1754)(1667-1754)于于17331733年首次发现了年首次发现了正态分布正态分布的密度函数,并计算出该曲线在各的密度函数,并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础。种不同区间内的概率,为整个大样本理论奠定了基础。18091809年,年,德国数学家高斯德国数学家高斯(1777-1855)(1777-1855)和法国数学家勒让德和法国数学家勒让德(1752-(1752-1833)1833)各自独立地发现了各自独立地发现了最小二乘法最小二乘法,并应用于观测数据的误,并应用于观测数据的误差分析,在数理统计的理论与应用方面都作出了重要贡献。差分析,在数理统计的理论与应
4、用方面都作出了重要贡献。第4页,本讲稿共76页 近代时期近代时期(19(19世纪末至世纪末至18451845年年):数理统计的主要分支建立,是数理统计的形成时期。数理统计的主要分支建立,是数理统计的形成时期。18891889年,英国数学家年,英国数学家皮尔逊皮尔逊(1857-1936)(1857-1936)提出了矩估计法,提出了矩估计法,次年又提出了频率曲线的理论,并于次年又提出了频率曲线的理论,并于19001900年在德国数学家赫年在德国数学家赫尔梅特在发现卡方分布的基础上提出了卡方检验,这是数理尔梅特在发现卡方分布的基础上提出了卡方检验,这是数理统计发展史上出现的第一个小样本分布。统计发展
5、史上出现的第一个小样本分布。19081908年,英国的统计年,英国的统计学家学家戈塞特戈塞特(1876-1937)(1876-1937)创立了小样本检验代替了大样本检创立了小样本检验代替了大样本检验的理论和方法验的理论和方法(即即t t分布和分布和t t法法),这为数理统计的另一分支,这为数理统计的另一分支多元分析奠定理论基础。多元分析奠定理论基础。19121912年,英国统计学家费歇年,英国统计学家费歇(1890-1962)(1890-1962)推广了推广了t t检验法,同时发展了检验法,同时发展了显著性检验显著性检验及估计和及估计和方差分析方差分析等数理统计新分支。这样,数理统计的一些重要
6、等数理统计新分支。这样,数理统计的一些重要分支如分支如假设检验假设检验、回归分析回归分析、方差分析、正交设计等有了其、方差分析、正交设计等有了其决定其面貌的内容和理论决定其面貌的内容和理论.数理统计成为应用广泛、方法独特的数理统计成为应用广泛、方法独特的一门数学学科。一门数学学科。第5页,本讲稿共76页 现代时期现代时期(1945(1945年以后年以后):美籍罗马尼亚美籍罗马尼亚数理统计学数理统计学家瓦你德家瓦你德(1902-1950)(1902-1950)致力于用数致力于用数学方法使统计学精确化、严密化,取得了很多重要成果,他发展学方法使统计学精确化、严密化,取得了很多重要成果,他发展了了决
7、策理论决策理论,提出了一般的判别问题,创立了序贯分析理论,提出了一般的判别问题,创立了序贯分析理论,提出著名的序贯概率比检法。瓦尔德的两本著作提出著名的序贯概率比检法。瓦尔德的两本著作序贯分序贯分析析和和统计决策函数论统计决策函数论,被认为是数理发展史上的经典,被认为是数理发展史上的经典之作。之作。由于计算机的应用,推动了数理统计在理论研究和应用方面由于计算机的应用,推动了数理统计在理论研究和应用方面不断地向纵不断地向纵深发展深发展,并产生一些新的分支和边缘性的新学科,并产生一些新的分支和边缘性的新学科,如最优设计和非参数统计推断等。如最优设计和非参数统计推断等。当前,数理统计的应用范围愈来愈
8、广泛,已渗透到许当前,数理统计的应用范围愈来愈广泛,已渗透到许多科学领域,应用到多科学领域,应用到国民经济国民经济各个部门,成为科学研究不各个部门,成为科学研究不可缺少的工具。可缺少的工具。第6页,本讲稿共76页第四章第四章 抽样分布抽样分布4.1.4.1.基本概念基本概念4.2.4.2.抽样分布抽样分布4.3.4.3.三种分布三种分布第7页,本讲稿共76页抽样调查:抽样调查:通过调查群体中的一部分个通过调查群体中的一部分个体来了解整个群体体来了解整个群体.概率论的任务:概率论的任务:对不同的抽样结果出现对不同的抽样结果出现的可能性大小进行讨论,为根据样本情况的可能性大小进行讨论,为根据样本情
9、况推断总体情况提供理论依据推断总体情况提供理论依据.数理统计的任务:数理统计的任务:根据样本情况推断总根据样本情况推断总体情况体情况.第8页,本讲稿共76页4.1 4.1 基本概念基本概念 一、总体与个体:一、总体与个体:总体:某一个问题的研究对象的全体总体:某一个问题的研究对象的全体.个体:组成总体每个基本单元个体:组成总体每个基本单元.把研究对象的某项数量指标的全体把研究对象的某项数量指标的全体看作总体;把每个数值看作个体看作总体;把每个数值看作个体第9页,本讲稿共76页 一般地,我们把所研究的总体,一般地,我们把所研究的总体,即研究对象的某项数量指标记作即研究对象的某项数量指标记作X,X
10、,它它的取值在客观上有一定的分布,的取值在客观上有一定的分布,X X也是一也是一个个随机变量随机变量总体总体R.V.X有限总体有限总体无限总体无限总体第10页,本讲稿共76页例例.研究一批灯泡的平均寿命研究一批灯泡的平均寿命.该批灯泡的全体该批灯泡的全体:总体,总体,其中每个灯泡其中每个灯泡:个体个体.总体总体个体个体抽抽样样推推断断第11页,本讲稿共76页二、抽样与样本二、抽样与样本抽样抽样:为了推断总体的性态而从总体中为了推断总体的性态而从总体中抽取部分个体的过程称为抽样抽取部分个体的过程称为抽样.样本样本:设从总体设从总体X X中随机抽取或观察中随机抽取或观察n n个个个个体体X X1
11、1,X,X2 2 X Xn n,所得的这一组个体所得的这一组个体(X(X1 1,X,X2 2X Xn n)称为总体称为总体X X的一个样本的一个样本.其中个体的数目其中个体的数目n n称为称为样本容量样本容量.第12页,本讲稿共76页注注意意:在抽取或观察每个个体之前,在抽取或观察每个个体之前,X X1 1,X,X2 2X Xn n都是未知的,因而它们都是都是未知的,因而它们都是随机变量,随机变量,(X(X1 1,X,X2 2X Xn n)为为n n维随机变维随机变量量当当n n次抽取或观察一经完成,我们就次抽取或观察一经完成,我们就得到一组实数(得到一组实数(x1 1,x2 2,xn n),
12、),称其为称其为样本观察值样本观察值或样本值或样本值第13页,本讲稿共76页三、简单随机抽样三、简单随机抽样定义定义:如果:如果X X X X1 1,X,Xn n是相互独立并且与是相互独立并且与X X同分同分布的随机变量布的随机变量,则称则称X X1 1,X,X,X,Xn n为来自总体为来自总体X X的的容量为容量为n n的简单随机样本的简单随机样本,简称样本简称样本.注注:有限总体时,采用放回抽样所得的:有限总体时,采用放回抽样所得的样本才是简单随机样本,今后只讨论简样本才是简单随机样本,今后只讨论简单随机样本单随机样本第14页,本讲稿共76页简单随机样本满足的三个条件:简单随机样本满足的三
13、个条件:(1).(1).随机性随机性:抽样或观察应随机地进行,每:抽样或观察应随机地进行,每个个体被抽或被观察的机会均等;个个体被抽或被观察的机会均等;(2).(2).独立性独立性:每次抽取或观察独立进行,其:每次抽取或观察独立进行,其结果不受其它抽取或观察结果的影响结果不受其它抽取或观察结果的影响(3).(3).代表性代表性:即从总体中抽出的一组样本,它:即从总体中抽出的一组样本,它在所关注的指标上可以代表该群体在所关注的指标上可以代表该群体.在上述三个条件之下,在上述三个条件之下,X X1 1,X,X2 2X Xn n是相互是相互独立的,且与独立的,且与X X有相同的分布有相同的分布第15
14、页,本讲稿共76页四、统计量四、统计量定义定义2 2:设:设X X1 1,X,X2 2,X,X,X,Xn n为总体为总体X X的一个容的一个容量为量为n n的样本,的样本,g(Xg(X1 1,X,X2 2,X,X,X,Xn n)为一个连续为一个连续函数,如果函数,如果g(g()中不包含未知参数,则称:中不包含未知参数,则称:g(Xg(X1 1,X,X,X,X2 2,X,Xn n)为关于总体为关于总体X X的的统计量统计量.统计量即不包含未知参数的样本函数统计量即不包含未知参数的样本函数第16页,本讲稿共76页例例.设设X X1 1,X X X X2 2 2 2,X Xn n为来自总体为来自总体
15、N(N(,2 2)的样的样本本.其中其中 已知已知,2 2 未知未知,则则哪些是统计量哪些是统计量?第17页,本讲稿共76页注:几种重要的统计量注:几种重要的统计量样本均值样本均值样本方差样本方差样本样本k k阶中心矩阶中心矩样本标准误样本标准误样本标准差样本标准差第18页,本讲稿共76页4.2 抽样分布抽样分布注意注意:统计量是独立同分布随机变量统计量是独立同分布随机变量X X1 1,X,X2 2 X Xn n的函数的函数,因而它也是一个随因而它也是一个随机变量,从而也就有了统计量的分布。机变量,从而也就有了统计量的分布。第19页,本讲稿共76页一、和的分布一、和的分布定理定理1 1:设:设
16、X X1 1,X,X2 2是两个是两个独立独立随机变量随机变量,其密度函数分别是其密度函数分别是 fx x1(x x1),fx2 (x2 2),如果如果X=XX=X1 1+X+X2 2 2 2,则则X X X X的密度函数是的密度函数是第20页,本讲稿共76页密度函数密度函数 f(x)分布函数分布函数 F(x)分析分析:第21页,本讲稿共76页证证 明明:第22页,本讲稿共76页积分上限积分上限(变上限变上限)函函数数第23页,本讲稿共76页例例:设:设X X1 1,X,X2 2独立同分布于独立同分布于N(N(,2 2),求求X X1 1+X+X2 2的分布的分布.故故 X X1+X+X2 N
17、(2 ,2,2 2 2)解解:由:由知知类似地类似地 X X1-X2 N(0,2,2 2 2)第24页,本讲稿共76页例:设例:设X X1 1和和X X2 2独立独立,分别服从二项分布分别服从二项分布B(nB(n1 1,p),p)和和B(nB(n2 2,p),p).求求Y=XY=XY=XY=X1 1+X+X2 2的分布的分布.解:解:第25页,本讲稿共76页二、样本均数的分布二、样本均数的分布定理定理2 2:设总体:设总体X X N(N(,2 2),X X1 1,X,X2 2,X Xn n为其容量为为其容量为n n的样本,则的样本,则第26页,本讲稿共76页一般结果一般结果:随机变量随机变量X
18、 X N(N(N(N(,2 2 2 2),则,则,则,则它的线性它的线性函数函数Y=aX+bY=aX+b仍然服从正态分布仍然服从正态分布,并且并且 Y N(a Y N(a+b,a2 2)这里这里a,ba,b为常数为常数.第27页,本讲稿共76页更一般结果:更一般结果:X X X X1 1 1 1,X,X,X,X2 2 2 2,X,Xn n n n相互独立相互独立,并且并且 i=1,2,i=1,2,n,n,则其线性组合:则其线性组合:仍然服从正态分布,并且仍然服从正态分布,并且这里这里c ci i为不全为零的常数为不全为零的常数.第28页,本讲稿共76页三、一个重要定理三、一个重要定理 设设X
19、X1 1,X X2 2,X X X Xn n n n是取自总体是取自总体N(,N(,2 2 2 2)的的一个样本一个样本,则则第29页,本讲稿共76页注意到注意到:从而有从而有:证明证明:第30页,本讲稿共76页一、一、2 2 分布分布定定义义1 1:设设X1,X2,Xn 独立同分布于独立同分布于N(0,1),则称则称服从服从自由度自由度为为 n 的的 分布,记分布,记4.3 三种分布注注:第31页,本讲稿共76页 2(n)分布的概率密度函数为分布的概率密度函数为:这里:这里:第32页,本讲稿共76页1、数字特征、数字特征:2、可加性、可加性:3、上侧分位数、上侧分位数:性性 质质第33页,本
20、讲稿共76页二、二、t t 分布分布定义定义2 2:设设 XN(0,1)与与 Y 2(n)独立,则称独立,则称 服从自由度为服从自由度为 n 的的 t 分布分布,记,记 tt(n).第34页,本讲稿共76页1).1).图形关于图形关于 t=0 t=0 对称对称;即有即有E E(X X)=0)=02).t2).t分布的的极限是标准正态分布分布的的极限是标准正态分布,即:即:事实上事实上,当当n30n30时时,两者就非常接近了两者就非常接近了.t t 分布的几个简单性质:分布的几个简单性质:第35页,本讲稿共76页 n=n=1第36页,本讲稿共76页3).3).对于给定的对于给定的0 0 1,1,
21、称满足件称满足件的点的点t t (n)(n)为为t t分布的上侧分布的上侧 分位点。分位点。第37页,本讲稿共76页定理定理:这里:X N(1,2),Y N(2,2),且且第38页,本讲稿共76页从而由从而由 t t 分布的定义得:分布的定义得:相互独立相互独立又由于又由于证明证明:且且第39页,本讲稿共76页例题例题:某克山病区测得:某克山病区测得1111例急性克山病患者例急性克山病患者以及以及1313名健康人的血膦值如表,问该地克山名健康人的血膦值如表,问该地克山病患者与健康人的血膦值是否不同?现假设病患者与健康人的血膦值是否不同?现假设两组数据的方差是相同的,则这个题目实际两组数据的方差
22、是相同的,则这个题目实际是问两组数据的均值是否相同?是问两组数据的均值是否相同?5.5.78784.4.82824.4.57574.4.17174.4.14143.3.73733.3.60602.2.50502.2.34342.2.33331.1.98981.1.98981.1.6767健健健健康康康康Y Y Y Y6.6.53536.6.40405.5.78785.5.85855.5.18184.4.73734.4.32323.3.73733.3.73733.3.24242.2.6060患患患患者者者者X X X X第40页,本讲稿共76页我们现在的问题就是判断我们现在的问题就是判断EX是否
23、等于是否等于EY,那我们自然选择统计量那我们自然选择统计量 作为我们的作为我们的判定对象,也即当判定对象,也即当 时我们即可判时我们即可判定:定:EX EY!由于数据本身是随机的,因!由于数据本身是随机的,因此此 必定在一定范围内波动,因此我必定在一定范围内波动,因此我们只能利用们只能利用 的概率分布来判定!但的概率分布来判定!但是的分布是含有参数是的分布是含有参数的,故我们选择:的,故我们选择:作为我们的判定标准。作为我们的判定标准。第41页,本讲稿共76页关于判别标准的几个问题:关于判别标准的几个问题:(1).什么样的事件才足以使我们作出判决?什么样的事件才足以使我们作出判决?由于事件发生
24、的随机性,只有某个事件的发由于事件发生的随机性,只有某个事件的发生有足够的信息量才能作出判决。生有足够的信息量才能作出判决。(2).概率上的小概率事件必然发生和统计中概率上的小概率事件必然发生和统计中的判别准则有什么不同?的判别准则有什么不同?(3).事件发生的合理性准则,即小概率事件事件发生的合理性准则,即小概率事件不该发生。不该发生。第42页,本讲稿共76页统计过程:统计过程:假设总体服从一定的分布,那么我们得到的样假设总体服从一定的分布,那么我们得到的样本就应该是本就应该是“合理的合理的”!从而统计量的取值!从而统计量的取值(样本观察值样本观察值)就应该是合理的,即不应该是一就应该是合理
25、的,即不应该是一个小概率事件。这就是样本和样本观察值之间个小概率事件。这就是样本和样本观察值之间的关系,也是概率和统计之间的关系。的关系,也是概率和统计之间的关系。第43页,本讲稿共76页三、三、F F分布分布定义定义3:设随机变量设随机变量并且并且 与与 相互独立相互独立,则称随机变量则称随机变量 服从自由度为服从自由度为(n1,n2)的的F分布分布,记记FF(n1,n2).第44页,本讲稿共76页第45页,本讲稿共76页定理:定理:若若则:则:第46页,本讲稿共76页证明:证明:第47页,本讲稿共76页F分布的上侧临界值(上分布的上侧临界值(上 分位点)分位点):满足上式满足上式(0 1)
26、的点的点F(n1,n2)为为F分布的上分布的上 分位点分位点.n1=10,n2=5n1=10,n2=25第48页,本讲稿共76页F分布的上分布的上 分位点有下列性质分位点有下列性质:证明证明:若:若F F(n1,n2),按定义有按定义有又由于又由于从而从而第49页,本讲稿共76页例题例题:某克山病区测得:某克山病区测得11例急性克山病患例急性克山病患者以及者以及13名健康人的血膦值如表,问该地名健康人的血膦值如表,问该地克山病患者与健康人的血膦值是否有相同克山病患者与健康人的血膦值是否有相同的方差?也即这两批数据是否有足够的代的方差?也即这两批数据是否有足够的代表性?表性?5.5.78784.
27、4.82824.4.57574.4.17174.4.14143.3.73733.3.60602.2.50502.2.34342.2.33331.1.98981.1.98981.1.6767健健健健康康康康Y Y6.6.53536.6.40405.5.78785.5.85855.5.18184.4.73734.4.32323.3.73733.3.73733.3.24242.2.6060患患患患者者者者X X第50页,本讲稿共76页我们现在的问题就是判断我们现在的问题就是判断 是否等于是否等于 ,那我们自然选择统计量那我们自然选择统计量 作为我们的判作为我们的判定对象,也即当定对象,也即当 时我们
28、即可判定:时我们即可判定:!由于数据本身是随机的,因此!由于数据本身是随机的,因此 必必定在一定范围内波动,因此我们只能利用定在一定范围内波动,因此我们只能利用 的概率分布来判定!我们的假定是的概率分布来判定!我们的假定是 ,故我们选择:,故我们选择:作为我们的判定标准。作为我们的判定标准。第51页,本讲稿共76页例:设总体例:设总体X服从正态分布服从正态分布N(,2),从从中抽取容量为中抽取容量为16的样本的样本,试在试在:1)已知已知 2=25 2)2未知未知,但已知样本方差但已知样本方差S2=20.8的情况下的情况下,求样本均值求样本均值 与总体均值与总体均值 之差的绝对值小于之差的绝对
29、值小于2的概率的概率.第52页,本讲稿共76页解解:1).由于统计量由于统计量第53页,本讲稿共76页2).由于由于 2未知未知,但但S2=20.8,这时统这时统计量计量:第54页,本讲稿共76页4.4.样本分布图样本分布图随机变量的概率密度或分布函随机变量的概率密度或分布函数,可以通过函数图来直观刻画数,可以通过函数图来直观刻画总体的规律。对于样本,我们也总体的规律。对于样本,我们也可以做出反映样本频率分布密度可以做出反映样本频率分布密度的直方图和反映样本累积频率的的直方图和反映样本累积频率的经验分布图。经验分布图。第55页,本讲稿共76页1。直方图。直方图例:给定某次考试成绩,现考察各例:
30、给定某次考试成绩,现考察各个分数段的分布情况。个分数段的分布情况。通常先分组通常先分组,了解大致趋势,最后再了解大致趋势,最后再给出总体分布给出总体分布;第56页,本讲稿共76页Histogram第57页,本讲稿共76页7.9257.9387.9227.9157.9187.9277.9357.9317.9197.9227.9227.9187.9227.9257.9257.9207.9277.9227.9307.9307.9297.9287.9307.9357.9307.9397.9257.9247.9307.9357.9207.9257.9307.9267.9237.9207.9297.930
31、7.9257.9227.9307.9207.9247.9257.9297.9227.9257.9307.9267.9187.9237.9277.9277.9277.9237.9227.9237.9297.9317.9227.9257.9257.9257.925 7.9277.9207.9227.9277.9237.9257.9187.9137.9257.9267.9287.9247.9227.9237.9157.9197.9307.9257.9307.9307.9257.9187.9207.9187.9287.9287.9387.9307.9387.9147.9247.9297.9287.92
32、07.9187.923例:在散剂分装过程中例:在散剂分装过程中,随机抽取随机抽取100袋袋称重称重,结果如下结果如下.画出袋装散剂重量画出袋装散剂重量X X的的频率直方图频率直方图.第58页,本讲稿共76页2 2。作图步骤。作图步骤1.收集数据,并找出数据中最大值收集数据,并找出数据中最大值xL和和最小值最小值xS2.计算极差:计算极差:3.确定分组组数确定分组组数 k k值的选择参考表值的选择参考表 10-20250以上以上7-12100-2506-1050-100Kn第59页,本讲稿共76页4.4.确定组距确定组距h 5.计算各组的上、下边界值计算各组的上、下边界值 6.计算各组的组中值计
33、算各组的组中值xi 7.统计落入各组的数据个数,整理成统计落入各组的数据个数,整理成频数表频数表 8.作直方图作直方图 第60页,本讲稿共76页Histogram with 10point range第61页,本讲稿共76页Histogram with 5 point range第62页,本讲稿共76页思考题:思考题:1).组间距的大小对于直方图的图示有什组间距的大小对于直方图的图示有什么影响?么影响?2).什么样的数据有更大的代表性?怎什么样的数据有更大的代表性?怎么衡量数据本身对总体的代表性呢?么衡量数据本身对总体的代表性呢?3).能否解释统计中为什么要采用随机抽能否解释统计中为什么要采用
34、随机抽样!样!第63页,本讲稿共76页第64页,本讲稿共76页3。经验分布函数。经验分布函数定义:如果总体定义:如果总体X的的n个独立观察值个独立观察值 ,其累积频率:,其累积频率:称称Fn(x)为样本分布函数或经验分布为样本分布函数或经验分布函数函数.第65页,本讲稿共76页例例.随机地观测总体随机地观测总体X X 得得8 8个数据:个数据:2.5,3,2.5,3.5,3,2.7,2.5,2,求求X 的经验分布函数的经验分布函数.2 2.5=2.5=2.5 2.7 3=3 3.5第66页,本讲稿共76页例:设有例:设有150名学生进行英语测验,名学生进行英语测验,试完成下表:试完成下表:10
35、1085x95 85x95 404075x85 75x85 272765x75 65x75 55x65 55x65 45x55 45x55 7 735x45 35x45 frequencyfrequencyTest ScoreTest Scorex95 140 x85 x75 73x65 60 x55 7x45 Cumulative frequency Test Score第67页,本讲稿共76页样本分布函数的流程图样本分布函数的流程图样本分布函数的流程图样本分布函数的流程图离离离离散散散散分布律分布律分布律分布律连连连连续续续续概率概率概率概率密度密度密度密度分布函数分布函数样样本本统计统计
36、统计统计表表表表频数频数频数频数直方图直方图直方图直方图累积频数累积频数累积频数累积频数直方图直方图直方图直方图分布分布分布分布函数函数函数函数第68页,本讲稿共76页例:根据已知数据列表如下例:根据已知数据列表如下分组编分组编分组编分组编号号号号1 12 23 34 45 56 67 78 89 9组组组组 限限限限(70(70,80)80)(80(80,90)90)(90(90,100)100)(10(100 0,110)110)(110,(110,120)120)(120(120,130)130)(130(130,140)140)(140(140,150)150)(150(150,160
37、)160)组中值组中值组中值组中值757585859595105105115115125125135135145145155155组频数组频数组频数组频数3 39 913131616262620207 74 42 2组频率组频率组频率组频率(%)3 39 913131616262620207 74 42 2累积频累积频累积频累积频率率率率(%)(%)3 312122525414167678787949498981 1第69页,本讲稿共76页于是得频率直方图为于是得频率直方图为4127090160 x频率频率(%)2028110140第70页,本讲稿共76页而积累频率的直方图为而积累频率的直方图
38、为积累频率积累频率(%)101020201001003030404050506060707080809090 x x70 90 110 130 16070 90 110 130 160第71页,本讲稿共76页4。理论分布函数。理论分布函数离散型总体:离散型总体:例例.X X1 1,X X2 2,Xn 来自两点分布的样本来自两点分布的样本,第72页,本讲稿共76页连续型总体:连续型总体:例例.X X1 1,X2,X Xn 来自来自N(0,1)分布的样本分布的样本第73页,本讲稿共76页4.5.概率纸及其应用概率纸及其应用例题:例题:选择不同的坐标纸区分下列函数:选择不同的坐标纸区分下列函数:第74页,本讲稿共76页正态概率纸正态概率纸 现设现设X N(,2),则则(X-)/N(0,1),令令u=(X-)/,则有,则有F(x)=(u).可以看到可以看到u和和X是线性关系,我们现将与是线性关系,我们现将与X对应的对应的u值改为值改为(u),也即,也即F(x),则,则F(x)与与X的图示仍然是一条直线。的图示仍然是一条直线。概率纸的关键就是数据的变换。概率纸的关键就是数据的变换。可以判断纵坐标的刻度必是不均匀的。可以判断纵坐标的刻度必是不均匀的。第75页,本讲稿共76页第76页,本讲稿共76页