《统计学之概率分布与抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计学之概率分布与抽样分布.pptx(54页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1本资料来源2第四章第四章 概率、概率概率、概率 分布与抽样分布分布与抽样分布厦门大学经济学院计统系厦门大学经济学院计统系游家兴游家兴3例例1 1:掷铜板:掷铜板当你掷铜板的时候,结果只有两种可能,正面或者当你掷铜板的时候,结果只有两种可能,正面或者反面。下图显示掷铜板反面。下图显示掷铜板10001000次的结果。次的结果。4掷铜板的人掷铜板的人法国自然主义者布方伯爵(法国自然主义者布方伯爵(Count Buffon, 1707-1788)把铜板掷了)把铜板掷了4040次,结果:次,结果:2048个个正面,或者说正面比例是正面,或者说正面比例是2048/4040=0.5069。大约大约1900
2、年时,英国统计学家皮尔逊(年时,英国统计学家皮尔逊(Karl Pearson,1857-1936)很神勇地掷一个铜板)很神勇地掷一个铜板 24000次。结果:次。结果:12012次正面,比例次正面,比例0.5005。南非数学家柯瑞屈(南非数学家柯瑞屈(John Kerrich)在第二次)在第二次世界大战被德国人关在牢里的时候,掷了铜板世界大战被德国人关在牢里的时候,掷了铜板 10000次。结果:次。结果:5067次正面,比例次正面,比例0.5067。5例例2 2:中两次头彩:中两次头彩1986年时,亚当斯(年时,亚当斯(Adams)第二度赢得新泽)第二度赢得新泽西州彩券,前一次亚当斯赢到了累积
3、奖金西州彩券,前一次亚当斯赢到了累积奖金390万美元,这次又赢得了万美元,这次又赢得了150万美元。万美元。纽约时报纽约时报(1986年年2月月14日)宣称:同一日)宣称:同一个赢得两次大奖的机会,差不是每个赢得两次大奖的机会,差不是每170亿次中亿次中有一次。有一次。两星期后,两星期后,纽约时报纽约时报刊登了两位统计学家刊登了两位统计学家的来信,说这是胡说八道。的来信,说这是胡说八道。6亚当斯在一生中赢两次大奖的机会诚然很小,亚当斯在一生中赢两次大奖的机会诚然很小,但是几乎可以确定:在美国几百万经常买彩券但是几乎可以确定:在美国几百万经常买彩券的人当中,会有人赢得两次头奖。的人当中,会有人赢
4、得两次头奖。两位统计学家估计:两位统计学家估计:7 7年内再有人赢到两次大年内再有人赢到两次大奖的机会是一半一半。奖的机会是一半一半。果其不然,在果其不然,在19881988年年5 5月,汉弗莱斯(月,汉弗莱斯(Humphri Humphri -es-es)赢得了他的第二个宾州彩券累积奖金)赢得了他的第二个宾州彩券累积奖金(总计(总计680680万美元)。万美元)。7本章我们首先学习:本章我们首先学习:什么是概率?什么是概率?什么是概率分布?什么是概率分布?8第一节第一节 随机事件与概率随机事件与概率一、随机事件与概率一、随机事件与概率(一)随机试验与事件(一)随机试验与事件随机现象的特点是:
5、随机现象的特点是:在条件不变的情况下,一系列的试验或在条件不变的情况下,一系列的试验或观测会得到不同的结果;观测会得到不同的结果;在试验或观测前不能预见何种结果将出在试验或观测前不能预见何种结果将出现。现。9对随机现象的试验或观测称为随机试验,它必对随机现象的试验或观测称为随机试验,它必须满足以下的性质:须满足以下的性质:(1 1)每次试验的可能结果不是唯一的;)每次试验的可能结果不是唯一的;(2 2)每次试验之前不能确定何种结果会出)每次试验之前不能确定何种结果会出现;现;(3 3)试验可在相同条件下重复进行。)试验可在相同条件下重复进行。10在随机试验中,可能出现也可能不出现的结果,在随机
6、试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一试验的结果可能是一个简单事件,也可能是一个复杂事件。个复杂事件。简单事件就是不可以再分解的事件,又称为简单事件就是不可以再分解的事件,又称为基本事件。基本事件。复杂事件是由简单事件组合而成的事件。复杂事件是由简单事件组合而成的事件。11基本事件还可称为样本点,设试验有基本事件还可称为样本点,设试验有n n个基个基本事件,分别记为本事件,分别记为 (i=1,2,(i=1,2,,n)n)。集合集合=1 1 , ,2 2 , , , ,n n 称为样本空间,称为样本空间,中
7、的元素就是样本点。中的元素就是样本点。i12例:投掷一粒均匀的六面体骰子,出现的点数例:投掷一粒均匀的六面体骰子,出现的点数有可能是有可能是1 1、2 2、3 3、4 4、5 5、6 6共六种。这六种结共六种。这六种结果是基本结果,不可以再分解成更简单的结果果是基本结果,不可以再分解成更简单的结果了,所以了,所以=1=1,2 2,3 3,4 4,5 5,66为该试验的为该试验的样本空间。样本空间。“出现点数是奇数出现点数是奇数”这一事件就不是简单事件,这一事件就不是简单事件,它是由基本事件它是由基本事件11,33和和55组合而成的。组合而成的。13我们通常用大写字母我们通常用大写字母A A,B
8、 B,C C,来表示随机来表示随机事件,例如,设事件,例如,设A A表示表示“出现点数是奇数出现点数是奇数”,则则A=1A=1,3 3,55;设;设B B表示表示“出现点数是偶数出现点数是偶数”,则则B=2B=2,4 4,66。14(二)概率(二)概率1.概率的定义概率的定义概率是指随机事件发生的可能性,或称为机概率是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。率,是对随机事件发生可能性的度量。概率的古典定义:假设事件概率的古典定义:假设事件A在等可能的在等可能的n种方式中可以以种方式中可以以m种方式发生,则事件发生种方式发生,则事件发生的概率表示为:的概率表示为: p=
9、p(A)=m/n15古典概率有两个特点:古典概率有两个特点:1 1、结果有限,即基本空间中只含有限个元、结果有限,即基本空间中只含有限个元素。如掷铜板,只能出现素。如掷铜板,只能出现“正面朝上正面朝上”和和“反面朝上反面朝上”两种结果。两种结果。2 2、各个结果出现的可能性被认为是相同的。、各个结果出现的可能性被认为是相同的。如掷铜板,出现正面或反面的机会被认为是如掷铜板,出现正面或反面的机会被认为是相等的。相等的。16概率的古典定义有所缺陷,概率的古典定义有所缺陷,“等可能等可能”这一词这一词模糊不清。事实上,这一词看上去与模糊不清。事实上,这一词看上去与“等概率等概率”是同义的,那么我们实
10、质上是用概率来定义自是同义的,那么我们实质上是用概率来定义自己,形成循环定义。己,形成循环定义。概率的统计定义:在相同条件下随机试验概率的统计定义:在相同条件下随机试验n n次,次,某事件某事件A A出现出现m m次,则比值次,则比值m/nm/n称为事件称为事件A A发生的发生的频率。随着频率。随着n n的增大,该频率围绕某一常数的增大,该频率围绕某一常数p p上上下波动,且波动的幅度逐渐减小,趋于稳定,下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为:这个频率的稳定值即为该事件的概率,记为: ( )mP Apn17例:设一个袋子中装有白球例:设一个袋子中装有白球
11、2个,黑球个,黑球3个。个。(1)从中随机摸出从中随机摸出1只球,问刚好是白球的概率只球,问刚好是白球的概率有多大?有多大? 解:摸出的任何解:摸出的任何1只球形成一个基本事件,样本只球形成一个基本事件,样本点总数为点总数为n=5。 用用A表示摸出的是白球事件,则表示摸出的是白球事件,则A由两个基本点由两个基本点组成,即组成,即A=白球,白球白球,白球,有利场合数,有利场合数m=2。因。因此,刚好摸出白球的概率为此,刚好摸出白球的概率为: P(A)=m/n=2/5=0.418(2) 从中随机摸出从中随机摸出2只球,一问只球,一问2只球都是白球只球都是白球的概率有多大的概率有多大? 二问二问2只
12、球一白一黑的概率有只球一白一黑的概率有多大多大? 三问三问2只球都是黑球的概率有多大只球都是黑球的概率有多大?解:由于摸出解:由于摸出2只球才成一个基本事件,所以只球才成一个基本事件,所以样本点总数为样本点总数为 ,故,故P(A)=P(2只球都是白球只球都是白球)=1/ =1/10P(B)=P(2只球一白一黑只球一白一黑)=23/10=6/10P(C)=P(2只球都是黑球只球都是黑球)=3/1025C25C192. 概率的基本性质概率的基本性质性质性质1 1P(A)0。性质性质2 P()=1。性质性质3 若事件若事件A与事件与事件B互不相容,即互不相容,即AB=,则,则P(AB)=P(A)+P
13、(B)。20例,从一副纸牌中抽牌一次(抽完放回),例,从一副纸牌中抽牌一次(抽完放回),如果如果E1为事件为事件“抽到抽到A”,E2为事件为事件“抽到抽到K”,则:,则: P(E1)=4/52=1/13 P(E2)=4/52=1/13因为不可能同时抽到因为不可能同时抽到A和和K,所以它们是互,所以它们是互不相容的,则抽到不相容的,则抽到A或或K的概率为:的概率为:1212112()()()131313P EEP EP E21重新定义,重新定义,E1为事件为事件“抽到抽到A”,E2为事件为事件“抽到黑桃抽到黑桃”,因为有可能抽到黑桃,因为有可能抽到黑桃A,所,所以以E1和和E2不是互不相容的,那
14、么抽到不是互不相容的,那么抽到A或黑或黑桃的概率为:桃的概率为:12121241314()()()()52525213P EEP EP EP EE22推论推论1:不可能事件的概率为:不可能事件的概率为0,即:,即: P()=0推论推论2 :P( )=1-P(A), 表示表示A的对立事件,的对立事件,即它们二者必有一事件发生但又不能同时发即它们二者必有一事件发生但又不能同时发生。生。3. 事件的独立性事件的独立性定义:对事件定义:对事件A与与B,若,若p(AB)=p(A)p(B),则称,则称它们是统计独立的,简称相互独立,即两个事它们是统计独立的,简称相互独立,即两个事件中不论哪一个事件发生与否
15、都不影响另一个件中不论哪一个事件发生与否都不影响另一个事件发生的概率。事件发生的概率。A23例:已知袋中有例:已知袋中有6 6只红球只红球, 4, 4只白球。从袋中有只白球。从袋中有放回地取两次球放回地取两次球, ,每次都取每次都取1 1球。设球。设 表示第表示第i i次取到红球。那么,次取到红球。那么,因为因为也就是说,也就是说,B B1 1,B,B2 2相互独立。相互独立。题目将有放回改为无放回,则题目将有放回改为无放回,则B B1 1和和B B2 2相互独立相互独立吗?吗?iB1263()()105P BP B122111233()() ()() ()55P B BP B B P BP
16、B P B24第二节第二节 随机变量及概率分布随机变量及概率分布随机变量是指随机事件的随机变量是指随机事件的量量的表现。的表现。例如:投掷骰子,点数例如:投掷骰子,点数1 1、2 2、3 3、4 4、5 5、6 6是是可能出现的随机变量。可能出现的随机变量。随机变量的概率分布是一个函数,它把随机变随机变量的概率分布是一个函数,它把随机变量的每一个值与一个实数(概率)相对应。量的每一个值与一个实数(概率)相对应。概率分布反映了随机变量的取值或随机事件概率分布反映了随机变量的取值或随机事件中各种结果的分布状况和分布特征。中各种结果的分布状况和分布特征。25离散型随机变量离散型随机变量当随机变量所有
17、可能取值的集合只包含有限个元当随机变量所有可能取值的集合只包含有限个元素时,就称为离散型随机变量。素时,就称为离散型随机变量。设离散型随机变量设离散型随机变量X X的所有可能取值为的所有可能取值为x x1 1,x,x2 2,,x,xn n, , ,相应的概率为,相应的概率为p(xp(x1 1) ),p(xp(x2 2), p(x), p(xn n),),。用表格统一表示出。用表格统一表示出来是:来是:X 1x 2x nx P 1( )p x 2()p x ()np x 26如:如:骰子各个点数的概率分布表骰子各个点数的概率分布表X 1 2 3 4 5 6 P 1/6 1/6 1/6 1/6 1
18、/6 1/6 27离散型概率分布的性质离散型概率分布的性质(1) 0p(xi)1 (i=1,2, )(2) iixp128随机变量的期望值随机变量的期望值随机变量的期望值(随机变量的期望值(E E)也称为平均值,是随)也称为平均值,是随机变量分布的集中趋势,即分布的中心位置。机变量分布的集中趋势,即分布的中心位置。离散型随机变量的期望值离散型随机变量的期望值: :性质性质: :其中其中X X1 1,X X2 2都是随机变量,都是随机变量,是任意常数。是任意常数。 1niiiE Xx p x 2121XEXEXXE29有这样的一个投资项目(如下表),试问它的有这样的一个投资项目(如下表),试问它
19、的预期回报是多少?预期回报是多少?该投资项目的期望收益率是该投资项目的期望收益率是6.9%6.9%。例题例题30随机变量的方差随机变量的方差定义定义:离散型随机变量离散型随机变量X的方差为的方差为方差的平方根方差的平方根称为标准差。称为标准差。方差方差2或标准差或标准差反映随机变量反映随机变量X相对其期望值相对其期望值的离散程度,的离散程度,2或或越小越小, 说明期望值的代表性说明期望值的代表性越好;越好;2或或越大,说明期望值的代表性越差。越大,说明期望值的代表性越差。性质:对于任意常数性质:对于任意常数a,2(ax)=a22(x)成立。成立。222iiiE Xxp x31二项分布二项分布二
20、项分布是离散型随机变量的一个重要的概率二项分布是离散型随机变量的一个重要的概率分布。分布。在一些问题中,我们只对试验中某事件在一些问题中,我们只对试验中某事件A A是否是否出现感兴趣,如调查消费者对某种品牌是否喜出现感兴趣,如调查消费者对某种品牌是否喜欢,调查某地区住户是否脱贫等等。欢,调查某地区住户是否脱贫等等。32这些例子所具有的共同性质概括如下:这些例子所具有的共同性质概括如下:试验包含了试验包含了n个相同的试验;个相同的试验;每个试验只有两个可能的结果;每个试验只有两个可能的结果;每一次试验出现每一次试验出现“是是”或或“否否”的概率是相的概率是相同的。同的。试验是互相独立的。试验是互
21、相独立的。通常称具有上述特征的通常称具有上述特征的n次重复试验为次重复试验为n次贝努次贝努里试验,简称贝努里试验(里试验,简称贝努里试验(Bernoulli trials)。)。33以以Bk表示表示n重贝努里试验中事件重贝努里试验中事件A正好出现正好出现k次次这一事件,则:这一事件,则: (k=0,1,2,,n)knkknkqpCBp34连续型随机变量连续型随机变量当一个随机变量可能取值的集合为无穷不可数当一个随机变量可能取值的集合为无穷不可数集合时,就称为连续型随机变量。集合时,就称为连续型随机变量。由于连续型随机变量可以取某一区间或整个实由于连续型随机变量可以取某一区间或整个实数轴上的任意
22、一个值,无法一一列举。一般用数轴上的任意一个值,无法一一列举。一般用概率密度函数来表示连续型随机变量的概率分概率密度函数来表示连续型随机变量的概率分布。布。35概率密度函数反映概率分布在某一区间的密集概率密度函数反映概率分布在某一区间的密集程度。程度。它不直接给出随机变量取某一特定值的概率值,它不直接给出随机变量取某一特定值的概率值,而通过密度函数图下相应给定区间的面积表示而通过密度函数图下相应给定区间的面积表示连续型随机变量在那一区间取值的概率。连续型随机变量在那一区间取值的概率。36概率密度函数概率密度函数 设设p(x)为概率密度函数,它是分布函数的导数,为概率密度函数,它是分布函数的导数
23、,满足下述两个条件:满足下述两个条件: (1) p(x)0 (2) 1d xxp37连续型随机变量的概率是计算随机变量落在某连续型随机变量的概率是计算随机变量落在某区域的可能性,也即通过对密度函数进行积分区域的可能性,也即通过对密度函数进行积分获得相应的概率值。获得相应的概率值。如计算随机变量如计算随机变量X落在落在a, b区间内的概率区间内的概率:a bxP( (axb) )()( )dbap a X bp xx概率密度曲线概率密度曲线38()( )dap Xap xx如:如:()( )dbp Xbp xxa bx39例子一个连续型随机变量只在一个连续型随机变量只在0, 4范围内取值,其范围
24、内取值,其概率密度函数为概率密度函数为 ,a是常数。是常数。计算计算a;求求p(1X2)解:根据解:根据 ,可知,可知 , 进一步,进一步, 求积分:求积分: ( )1p x dx40(0.5)1ax dx4201122axxC18a ( )0.5p xax40012341/41/23/4 1P(X)X( )1p x dx意味着整个三角形的面积为意味着整个三角形的面积为1p(1X1)=7/8,求,求 的值;的值;(2)求随机变量落入)求随机变量落入0.5,1区间的概率。区间的概率。233( ),0 xp xx42随机变量的期望值与方差随机变量的期望值与方差 定义定义: : 连续型随机变量连续型
25、随机变量X X的期望值为的期望值为 方差为方差为 性质性质: : xxxpXEd)( 222dE Xxp x x222()( )axax1212EXXE XE X43离散型与连续型随机变量的区别 离散离散型型随机随机变量变量 连续连续型型随机随机变量变量 可能可能取取值值的的个个数数 有有限限个个 无无限限个个 概率概率计算计算 计算计算某某个个点点的的概率概率 计算计算某某个个区区间间的的概率概率 概率概率描述描述函数函数 分布分布函数函数 密度密度函数函数 性性质质 1 0p(xi)1 p(xi)0 性性质质 2 ( )1iip x ( )1p x dx 期望期望 iiIE Xx p x
26、( )dE Xxp xx 方方差差 22iiixp x 22dxp xx 44正态分布正态分布是最重要的一种连续型随机变量分布。正态分布是最重要的一种连续型随机变量分布。如果连续型随机变量如果连续型随机变量X的密度函数为:的密度函数为:则称该变量则称该变量X服从均值为服从均值为,方差为,方差为2的正态分的正态分布,记为布,记为XN(, )。 xxpx222e2145如果一个正态分布的如果一个正态分布的=0,=1,则称该正态分,则称该正态分布为标准正态分布,相应的随机变量称为标准布为标准正态分布,相应的随机变量称为标准正态随机变量,用正态随机变量,用Z表示,即表示,即ZN(0,1),相应,相应的
27、分布密度函数为的分布密度函数为 zzpz22e2146一般正态分布与标准正态分布的关系一般正态分布与标准正态分布的关系: 若随机变量若随机变量X服从正态分布服从正态分布N (,2),则随机,则随机变量变量 Z = 服从标准正态分布,即服从标准正态分布,即ZN(0,1)。X4768.27%95.45%99.73%x例:例:p(-1Z1)表示变量表示变量Z落入落入(-1,1)的概率,等于的概率,等于0.68274833准则准则3准则在产品质量控制中有着重要的应用。由准则在产品质量控制中有着重要的应用。由标准正态分布表可求得:标准正态分布表可求得:当当 时,有:时,有:这说明,这说明,X的取值几乎全
28、部集中在的取值几乎全部集中在-3,3区区间内,超过这个范围的可能不到间内,超过这个范围的可能不到0.3%。(0,1)XN(1)0.6827P X (2)0.9545P X (3)0.9973P X 49这些结论推广到一般正态分布,即这些结论推广到一般正态分布,即 ,有:有:显然,显然, 的概率很小,因此可以认为的概率很小,因此可以认为X X的值几乎一定落在区间的值几乎一定落在区间 内,这在统内,这在统计学上称做计学上称做“33准则准则”。2( ,)XN ()0.6827P X(2 )0.9545P X(3 )0.9973P X3X(3 ,3 ) 50例题:课本例题:课本P85P85第第1717
29、题题解题步骤:解题步骤:1 1、算出均值;、算出均值;2 2、算出标准差;、算出标准差;3 3、计算两个标准差的变动区间:、计算两个标准差的变动区间: 4 4、判断。、判断。51学会查正态分布概率表学会查正态分布概率表 P305 ;学会运用正态分布的对称性进行分割计算学会运用正态分布的对称性进行分割计算; ;学会将正态分布化为标准正态分布,再计算其学会将正态分布化为标准正态分布,再计算其概率。概率。例如:求例如:求p(1Z1.25)?解:原式解:原式=0.5p(-1.25Z1.25)-p(-1Z1) =0.5(0.7887-0.6827) =0.05352例例1 1:某大学英语考试成绩服从正态
30、分布,已:某大学英语考试成绩服从正态分布,已知平均成绩为知平均成绩为7070分,标准差为分,标准差为1010分。求该大学分。求该大学英语成绩在英语成绩在60756075分的概率。分的概率。计算步骤:计算步骤:1 1、先转化为标准正态分布;、先转化为标准正态分布; 2 2、查表计算。、查表计算。)(. ).()( 60 707075 7010101010 50 53286075XpZpXp53例例2 2:高考标准分计算:高考标准分计算第一步,标准化获得第一步,标准化获得Z Z值:值:Z Z(原始分原始分的平均分)原始分(原始分原始分的平均分)原始分的标准差的标准差第二步,将第二步,将Z Z值转化
31、为标准分:值转化为标准分:标准分标准分T T500500100100Z Z 如,某省高考人数如,某省高考人数100000100000人,一考生高考标准人,一考生高考标准分为分为800800,那他在全省能排第几?,那他在全省能排第几?54解:由解:由T=800T=800可得可得Z=3Z=3, p(Z3)=0.5p(Z3)=0.51-p(-3Z3)=0.001351-p(-3Z3)=0.00135 100000 1000000.00135=1350.00135=135 可知他在全省可排可知他在全省可排135135位。位。再问:另一个考生高考标准分为再问:另一个考生高考标准分为672672,试问他全,试问他全省排第几名?省排第几名?三问:超过一个、两个、三个标准差的高考成绩三问:超过一个、两个、三个标准差的高考成绩能排第几名?能排第几名?