《3第三章 概率基础2.ppt》由会员分享,可在线阅读,更多相关《3第三章 概率基础2.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、张宝林张宝林 内蒙古师范大学化学与环境科学学院内蒙古师范大学化学与环境科学学院环境统计环境统计课程主要内容第一章第一章 绪论绪论第二章第二章 环境统计调查和数据整理环境统计调查和数据整理第三章第三章 环境统计的概率论基础环境统计的概率论基础第四章第四章 环境统计的描述性统计学环境统计的描述性统计学第五章第五章 环境统计的推断性统计学环境统计的推断性统计学第六章第六章 常用多元统计分析及其软件实现常用多元统计分析及其软件实现第七章第七章 地统计学简介地统计学简介主要参考书吴聿明(1991).环境统计学,中国环境科学出版社.李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004程子峰,徐富春编
2、著,2006,环境数据统计分析基础,化学工业出版社主要参考书第三章第三章 环境统计的概率论基础环境统计的概率论基础街头的摸球中奖在黑布袋中有六个白乒乓球与六个黄乒乓球,玩家随便从黑布袋中摸出6 个球,摸出6 黄或6 白可得100 元钱;摸出5 黄1 白或5 白1 黄,可得10 元;摸出4 黄2 白或者4 白2 黄,可得1 元钱;摸出3 黄3 白则要花20 元钱买一瓶洗发水共有7 种情况,竟有6 种情况可获奖,而只有1 种情况要花钱买东西。按照概率,当玩家摸10 次球时,最大的可能为4 次3 黄3 白,共赔48 元;5 次为4 黄2 白或4 白2 黄,获得5 元;1 次为5 黄1 白或5 白1
3、黄,获得10 元.这样玩家一般都会损失30 元钱左右,平均一次损失3 元.当玩的次数不断增加时,玩家平均损失的钱数几乎总保持在此数额.第三章第三章 环境统计的概率论基础环境统计的概率论基础博弈成科学博弈成科学甲乙甲乙2人赌技相同,各出赌注人赌技相同,各出赌注500元。约定:谁先赢元。约定:谁先赢3局,则谁拿走全局,则谁拿走全部部1000元。现已经赌了元。现已经赌了3局,甲局,甲2胜胜1负,而因故要停止赌博,这负,而因故要停止赌博,这1000元如何分,才算公平?元如何分,才算公平?平均:对甲欠公平平均:对甲欠公平全归甲:对乙欠公平全归甲:对乙欠公平甲拿大头:甲拿大头:2/3:1/3?继续赌继续赌
4、2局,可能结果:局,可能结果:甲甲,甲乙,乙甲,乙乙甲甲,甲乙,乙甲,乙乙第一节第一节 随机事件及其概率随机事件及其概率主要内容3.1.1事件(一)必然现象与随机现象(二)随机试验与随机事件(三)样本空间(四)事件的图示3.1.2概率(一)概率的定义(二)概率的性质(三)小概率事件(四)主观概率(五)条件概率(六)贝叶斯公式(七)全概率公式第一节第一节 随机事件及其概率随机事件及其概率全概率公式全概率公式全概率公式的陈述如下全概率公式的陈述如下:设随机试验设随机试验E的样本空间为的样本空间为S。A 为为E 的事件的事件,B1,B2,Bn 为为S 的一个划分的一个划分,且且P(Bi)O(I=1,
5、2,n),则则P(A)=P(B1)P(A/B1)+P(B2)P(A/B2)+P(Bn)P(A/Bn)全概率公式的意义在于全概率公式的意义在于:对于一个复杂的事件对于一个复杂的事件A,若无法直接求出它的概率若无法直接求出它的概率P(A),则可将则可将A分解成分解成若干个简单的事件来求其概率。由此可见全概率若干个简单的事件来求其概率。由此可见全概率公式可起到化整为零公式可起到化整为零,化难为易的作用。化难为易的作用。第一节第一节 随机事件及其概率随机事件及其概率全概率公式全概率公式P(A)=P(B1)P(A/B1)+P(B2)P(A/B2)+P(Bn)P(A/Bn)例1 某商店有彩电10 台(其中
6、次品有3 台),现已出售2 台,求从剩下的彩电中任取一台是正品的概率。第一节第一节 随机事件及其概率随机事件及其概率全概率公式第一节第一节 随机事件及其概率随机事件及其概率贝叶斯公式由全概率公式可导出另一个重要公式贝叶斯公式,它是由英国数学家贝叶斯(Bayes Thomas)在1763 年发表的,其陈述如下:设随机试验E 的样本空间为S。A为E 的事件,B1,B2,Bn为S 的一个划分,且P(BI)0(i=1,2,n),则第一节第一节 随机事件及其概率随机事件及其概率贝叶斯公式贝叶斯公式的意义在于:设事件A已发生,我们需要判断引起A发生的“原因”。如果已知A发生的可能“原因”共有n个:B1,B
7、2,Bn且两两互不相容。那么我们希望知道其中某个“Bi”的概率,也就是条件概率P(Bi/A)。在实际应用中,我们往往要求出每一个P(Bi/A)(I=1,2,n),然后找出其中最大的一个P(Bi/A),则Bi就是引起事件A 发生的最可能的“原因”。贝叶斯公式在“风险决策”、“模式识别”等中有着广泛的应用。第一节第一节 随机事件及其概率随机事件及其概率贝叶斯公式贝叶斯公式的意义在于:设事件A已发生,我们需要判断引起A发生的“原因”。如果已知A发生的可能“原因”共有n个:B1,B2,Bn且两两互不相容。那么我们希望知道其中某个“Bi”的概率,也就是条件概率P(Bi/A)。在实际应用中,我们往往要求出
8、每一个P(Bi/A)(I=1,2,n),然后找出其中最大的一个P(Bi/A),则Bi就是引起事件A 发生的最可能的“原因”。第三章第三章 环境统计的概率论基础环境统计的概率论基础主要内容第一节第一节 随机事件及其概率随机事件及其概率第二节 概率分布第二节第二节 概率分布概率分布主要内容2.1随机变量2.2离散型随机变量的概率分布二项分布波松分布2.3连续型随机变量的概率分布正态分布第二节第二节 概率分布概率分布事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布概率分布(probability
9、distribution)。为了深入研究随机试验,我们先引入随机变量随机变量(random variable)的概念。第二节第二节 概率分布概率分布2.1随机变量作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。例 对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、“1头治愈”、“2头治愈”、“”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、100。例 孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡
10、”。例 测定某品种猪初生重,表示测定结果的变量x所取的值为一个特定范围(a,b),如0.51.5kg,x值可以是这个范围内的任何实数。2.1随机变量随机变量如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型离散型随机变量随机变量(discrete random variable);如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量连续型随机变量(continuous random variable)。引入随机变量的概念后,对随机试验的概率分布的研究就转为对随机变量
11、概率分布的研究了。第二节第二节 概率分布概率分布2.2离散型随机变量的概率分布要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。如果我们将离散型随机变量x的一切可能取值xi(i=1,2,),及其对应的概率pi,记作P(x=xi)=pi i=1,2,则称上式为离散型随机变量x的概率分布或分布。常用分布列(distribution series)来表示离散型随机变量显然离散型随机变量的概率分布具有pi0和pi=1这两个基本性质。2.2离散型随机变量的概率分布二项分布一、贝努利试验及其概率公式二、二项分布的意义及性质三、二项分布的概率计算及应用条件二项分布二项分
12、布一、贝努利试验及其概率公式将某随机试验重复进行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。二项分布二项分布一、贝努利试验及其概率公式在n重贝努利试验中,事件A可能发生0,1,2,n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式二项分布二项分布一、贝努利试验及其概率公式在n重贝努利试验中,事件A可能发生0,1,2,
13、n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。二项分布二项分布一、贝努利试验及其概率公式在n重贝努利试验中,事件A可能发生0,1,2,n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。二项分布二项分布一、贝努利试验及其概率公式在n重贝努利试验中,事件A可能发生0,1,2,n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。二项分布二项分布一、贝努利试验及其概率公式二二项分布二项分布二、二项分布的意义及性质一、二项分布二项分布二、二项分布的意义及性质一、二项分布二项分布二、二项分布的意义及性质二项分布由n和p两个参数决定:1、当p值较小且n不大时
14、,分布是偏倚的。但随着n的增大,分布逐渐趋于对称;2、当p值趋于0.5时,分布趋于对称;3、对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降。n值不同的二项分布比较p值不同的二项分布比较二项分布二项分布二、二项分布的意义及性质二项分布由n和p两个参数决定:此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当n时,二项分布的极限分布是正态分布。n值不同的二项分布比较p值不同的二项分布比较二项分布二项分布三、二项分布的概率计算及应用条件【例】纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为31。求窝产仔10头,有7头白猪的概率。二项分布二
15、项分布三、二项分布的概率计算及应用条件【例】纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为31。求窝产仔10头,有7头白猪的概率。二项分布二项分布三、二项分布的概率计算及应用条件【例】仔猪黄痢病在常规治疗下死亡率为20,求5 头病猪治疗后死亡头数各可能值相应的概率。二项分布二项分布三、二项分布的概率计算及应用条件【例】仔猪黄痢病在常规治疗下死亡率为20,求5 头病猪治疗后死亡头数各可能值相应的概率。二项分布二项分布三、二项分布的概率计算及应用条件二项分布的应用条件有三二项分布的应用条件有三:(1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分
16、类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。作业:作业:设在家畜中感染某种疾病的概率为20,现有两种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B注射15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗?提示:假设疫苗AB完全无效,泊松分布泊松分布波松分布是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。在生物、
17、医学研究中,服从波松分布的随机变量是常见的。如,一定畜群中某种患病率很低的非传染性疾病患病数或死亡数,畜群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数,医院门诊单位时间内就诊患者数等,都是服从波松分布的。泊松分布泊松分布Simeon Denis Poisson特别着迷于小概率事件,特别是许多情况下可能出现的事件。1837年发表,研究了在那个骑兵仍旧是骑马而不是用坦克的时代里普鲁士士兵被马蹄死的人数的数据。泊松分布泊松分布主要内容一、波松分布的意义二、波松分布的概率计算泊松分布泊松分布一、波松分布的意义若随机变量x(x=k)只取零和正整数值0,1
18、,2,且其概率分布为k=0,1,其中0;e=2.7182是自然对数的底数,则称x服从参数为的波松分布波松分布(Poissons distribution),记为xP()。波松分布作为一种离散型随机变量的概率分布有一个重要的特征,这就是它的平均数和方差相等,都等于常数它的平均数和方差相等,都等于常数,即,即=2=。利用这一特征,可以初步判断一个离散型随机变量是否服从波松分布。泊松分布泊松分布一、波松分布的意义【例】调查某种猪场闭锁育种群仔猪畸形数,共记录200窝,畸形仔猪数的分布情况如表所示。试判断畸形仔猪数是否服从波松分布。泊松分布泊松分布一、波松分布的意义【例】调查某种猪场闭锁育种群仔猪畸形
19、数,共记录200窝,畸形仔猪数的分布情况如表所示。试判断畸形仔猪数是否服从波松分布。泊松分布泊松分布一、波松分布的意义是波松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称。当=20时分布接近于正态分布;当=50时,可以认为波松分布呈正态分布。所以在实际工作中,当20时就可以用正态分布来近似地处理波松分布的问题。不同的波松分布泊松分布泊松分布二、波松分布的概率计算波松分布的概率计算,依赖于参数的确定,只要参数确定了,把k=0,1,2,代入公式即可求得各项的概率。但是在大多数服从波松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为的估计值,将
20、其代替式中的,计算出k=0,1,2,时的各项概率。泊松分布泊松分布二、波松分布的概率计算已判断畸形仔猪数服从波松分布,并已算出样本平均数=0.51。泊松分布泊松分布二、波松分布的概率计算已判断畸形仔猪数服从波松分布,并已算出样本平均数=0.51。因为e-0.51=1.6653,所以畸形仔猪数各项的概率为:P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.511(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017泊松
21、分布泊松分布二、波松分布的概率计算【例】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:泊松分布泊松分布二、波松分布的概率计算【例】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:可见细菌数的频率分布与=0.5的波松分布是相当吻合的,进一步说明用波松分布描述单位容积(或面积)中细菌数的分布是适宜的。第二节第二节 概率分布概率分布应当注意,二项分布的应用条件也是波松分布的应用条件。比如二项分布要求n 次试验是相互独立的,这也是波松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,
22、所以不符合波松分布的应用条件。对于在单位时间、单位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈波松分布。第二节第二节 概率分布概率分布2.3连续型随机变量的概率分布连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(axb)来表示。2.3连续型随机变量的概率分布连续型随机变量的概率分布作126头基础母羊体重资料的频率分布直方图,图中纵座标取频率与组距的比值。资料的分布曲线2.3连续型随机变量的概率分布连续型随机变量的概率分布可以设想,如果样本取得越来越大(n+),
23、组分得越来越细(i0),某一范围内的频率将趋近于一个稳定值概率。这时,频率分布直方图各个直方上端中点的联线频率分布折线将逐渐趋向于一条曲线,换句话说,当n+、i0时,频率分布折线的极限是一条稳定的函数曲线。对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差,完全反映了体重的变动规律。这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数。资料的分布曲线2.3连续型随机变量的概率分布连续型随机变量的概率分布若记体重概率分布密度函数为f(x),则x取值于区间a,b)的概率为图中阴影部分的面积,即P(axb)=资料的分布曲线2.3连续型随机变量的概率分布连续
24、型随机变量的概率分布连续型随机变量概率分布性质:1、分布密度函数总是大于或等于0,即f(x)0;2、当随机变量x取某一特定值时,其概率等于0;3、在一次试验中随机变量x之取值必在-x+范围内,为一必然事件。分布密度曲线下、横轴上的全部面积为1。(c为任意实数)2.3连续型随机变量的概率分布连续型随机变量的概率分布正态分布正态分布正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从或近似服从正态分布的,如考试成绩、身高、体重、产奶量、产毛量、血红蛋白含量、血糖含量等。许多统计分析方法都是以正态分布为基础的许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分
25、布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。2.3连续型随机变量的概率分布连续型随机变量的概率分布正态分布正态分布一、正态分布的定义及其特征二、标准正态分布三、正态分布的概率计算正态分布正态分布一、正态分布的定义及其特征(一)正态分布的定义若连续型随机变量x的概率分布密度函数为其中为平均数,2为方差,则称随机变量x服从正态分布(normal distribution),记为xN(,2)。相应的概率分布函数为正态分布密度曲线正态分布正态分布一、正态分布的定义及其特征(二)正态分布的特征1、正态分布密度曲线是单峰、对称的悬钟形曲线
26、,对称轴为x=;2、f(x)在x=处达到极大,极大值 ;3、f(x)是非负函数,以x轴为渐近线,分布从-至+;正态分布正态分布一、正态分布的定义及其特征(二)正态分布的特征4、曲线在x=处各有一个拐点,即曲线在(-,-)和(+,+)区间上是下凸的,在-,+区间内是上凸的;正态分布正态分布一、正态分布的定义及其特征(二)正态分布的特征5、正态分布有两个参数,即平均数和标准差。是位置参数。当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。是变异度参数。当恒定时,愈大,表示x的取值愈分散,曲线愈“胖”;愈小,x的取值愈集中在附近,曲线愈“瘦”。相同而不同的三个正态分布相同而不
27、同的三个正态分布正态分布正态分布一、正态分布的定义及其特征(二)正态分布的特征6、分布密度曲线与横轴所夹的面积为1,即:二、标准正态分布二、标准正态分布正态分布是依赖于参数和2(或)的一簇分布,正态曲线之位置及形态随和2的不同而不同。这就给研究具体的正态总体带来困难,需将一般的N(,2)转换为=0,2=1的正态分布。我们称=0,2=1的正态分布为标准正态分布(standard normal distribution)。标准正态分布的概率密度函数及分布函数分别记作(u)和(u),二、标准正态分布二、标准正态分布随机变量u服从标准正态分布,记作uN(0,1),分布密度曲线如图。对于任何一个服从正态
28、分布N(,2)的随机变量x,都可以通过标准化变换:u=(x-)将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差(standard normal deviate)。标准正态分布密度曲线二、标准正态分布二、标准正态分布对不同的u值编成函数表,称为正态分布表,从中可查到u在意一个区间内取值的概率。这就给解决不同、2的正态分布概率计算问题带来很大方便。三、正态分布的概率计算三、正态分布的概率计算关于正态分布的概率计算,我们先从标准正态分布着手。这是因为,一方面标准正态分布在正态分布中形式最简单,而且任意正态分布都可化为标准正态分布来计算;另一方面,人们已经根据标准正态分布的分布
29、函数编制成正态分布表以供直接查用。三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计算 设u服从标准正态分布,则u在u1,u2内取值的概率为:(u2)(u1)而(u1)与(u2)可由附表查得。P(0uu1)(u1)-0.5 P(uu1)=(-u1)P(uu1)=2(-u1)P(uu1)=1-2(-u1)P(u1uu2)(u2)-(u1)三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计算已知uN(0,1),试求:(1)P(u-1.64)?(2)P(u2.58)=?(3)P(u2.56)=?(4)P(0.34u1.53)=?三、正态分布的概率计算三、正态分
30、布的概率计算(一)标准正态分布的概率计算已知uN(0,1),(1)P(u-1.64)=0.05050(2)P(u2.58)=(-2.58)=0.004940(3)P(u2.56)=2(-2.56)=20.005234=0.010468(4)P(0.34u1.53)=(1.53)-(0.34)=0.93669-0.6331=0.30389三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计算关于标准正态分布,以下几种概率应当熟记:P(-1u1)=0.6826P(-2u2)=0.9545P(-3u3)=0.9973P(-1.96u1.96)=0.95P(-2.58u2.58)=0
31、.99三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计算u变量在上述区间以外取值的概率分别为:P(u1)=2(-1)=1-P(-1u1)=1-0.6826=0.3174P(u2)=2(-2)=1-P(-2u2)=1-0.9545=0.0455P(u3)=1-0.9973=0.0027P(u1.96)=1-0.95=0.05P(u2.58)=1-0.99=0.01三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算正态分布密度曲线和横轴围成的一个区域,其面积为1,这实际上表明了“随机变量x取值在-与+之间”是一个必然事件,其概率为1。若随机变量 x服从正
32、态分布N(,2),则x的取值落在任意区间x1,x2)的概率,记作P(x1xx2),等于图中阴影部分曲边梯形面积。即:正态分布的概率三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算对上式作变换u=(x-),得dx=du,故有其中,三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算服从正态分布N(,2)的随机变量x在x1,x2)内取值的概率,等于服从标准正态分布的随机变量u在(x1-)/,(x2-)/)内取值的概率。因此,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。三、正态分布的概率计
33、算三、正态分布的概率计算(二)一般正态分布的概率计算设x服从=30.26,2=5.102的正态分布,试求P(21.64x32.98)。三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算设x服从=30.26,2=5.102的正态分布,试求P(21.64x32.98)。三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算关于一般正态分布,以下几个概率(即随机变量x落在加减不同倍数区间的概率)是经常用到的。P(-x+)=0.6826P(-2x+2)=0.9545P(-3x+3)=0.9973P(-1.96x+1.96)=0.95P(-2.58x+2.58)=
34、0.99三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算126头基础母羊体重资料的次数分布接近正态分布,现根据其平均数=52.26(kg),标准差S=5.10(kg),算出平均数加减不同倍数标准差区间内所包括的次数与频率实际频率与理论概率相当接近,说明126头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算生物统计中,不仅注意随机变量x落在平均数加减不同倍数标准差区间(-k,+k)之内的概率而且也很关心x落在此区间之外的概率。我们把随机变量x落在平均
35、数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作。对应于双侧概率可以求得随机变量x小于-k或大于+k的概率,称为单侧概率(一尾概率),记作2。三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算x落在(-1.96,+1.96)之外的双侧概率为0.05,而单侧概率为0.025。即 P(x-1.96)=P(x+1.96)=0.025双侧概率与单侧概率三、正态分布的概率计算三、正态分布的概率计算(二)一般正态分布的概率计算x落在(-2.58,+2.58)之外的双侧概率为0.01,而单侧概率 P(x-2.58)=P(x+2.58)=0.005双侧概率与单侧概率第二节
36、第二节 概率分布概率分布前面讨论的三个重要的概率分布中,前1个属连续型随机变量的概率分布,后2个属离散型随机变量的概率分布。三者间的关系如下:对于二项分布,在n,p0,且n p=(较小常数)情况下,二项分布趋于波松布。在这种场合,波松分布中的参数用二项分布的n p代之;在n,p0.5时,二项分布趋于正态分布。在这种场合,正态分布中的、2用二项分布的n p、n p q代之。在实际计算中,当p0.1且n很大时,二项分布可由波松分布近似;当p0.1且n很大时,二项分布可由正态分布近似。对于波松分布,当时,波松分布以正态分布为极限。在实际计算中,当20(也有人认为6)时,用波松分布中的代替正态分布中的及2,即可由后者对前者进行近似计算。作业:作业:公共汽车车门的高度是按成年男子与车门公共汽车车门的高度是按成年男子与车门碰头的机会小于碰头的机会小于0.01设计的。设我国成年设计的。设我国成年男子的平均身高为男子的平均身高为168厘米,标准差为厘米,标准差为7厘米,求车门的最低高度。厘米,求车门的最低高度。