《第七章两种常用的概率分布精选PPT.ppt》由会员分享,可在线阅读,更多相关《第七章两种常用的概率分布精选PPT.ppt(69页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章两种常用的概率分布第1页,本讲稿共69页第一节第一节概率概率 一、事件及事件的概率一、事件及事件的概率 1、随机事件 2、事件的概率 3、小概率事件 二、概率的两个基本法则概率的两个基本法则 1、加法法则 2、乘法法则 第2页,本讲稿共69页1.随随机机事事件件:在在同同样样条条件件下下,反反复复多多次次进进行行同同一一试试验验,或或多多次次观观测测同同一一现现象象,所所得得结结果果并并不不完完全全一一样样,在在每每次次试试验验或或观观测测之之前前不不能能确确切切预预料料将将出出现现什什么么结结果果,这这样样的的现现象象叫叫做做随随机现象。机现象。随随机机现现象象有有三三个个特特点点:第
2、第一一、其其结结果果至至少少有有两两个个;第第二二、至至于于那那种种结结果果出出现现,人人们们事事先先并并不不知知道道;第第三三,在在相相同同条条件件下下反反复复观察或试验,呈现出一定的规律性。观察或试验,呈现出一定的规律性。随随机机现现象象发发生生的的每每一一个个结结果果,叫叫做做一一个个随随机机事事件件,简简称称事件。常用大写字母事件。常用大写字母A、B、C表示。表示。如如检检查查一一批批零零件件的的合合格格率率,随随机机取取出出10,结结果果可可能能是是“没没有有次次品品”,可可能能是是“有有一一个个次次品品”,也也可可能能是是“有有两两个个次次品品”,等等等等。其其中中每每一一个个结结
3、果果都都是是一一个个事事件件。此此外外,“次次品品数数不不多多于于4个个”、“次品数在次品数在5与与10之间之间”等结果也都是事件。等结果也都是事件。一、事件及事件的概率一、事件及事件的概率第3页,本讲稿共69页在上述这些事件中,把在上述这些事件中,把“没有次品没有次品”、“有一个次有一个次品品”、“有两个次品有两个次品”、“有有10个次品个次品”,叫做,叫做基本事件(不能分解为其他事件的最简单事件);而把基本事件(不能分解为其他事件的最简单事件);而把“次品数不多于次品数不多于4个个”、“次品数在次品数在5与与10之间之间”等叫做等叫做复合事件(由若干个基本事件复合而成)。复合事件(由若干个
4、基本事件复合而成)。一一般般来来说说,在在试试验验条条件件下下必必然然发发生生的的结结果果叫叫做做必必然然事事件件。在在试试验验条条件件下下不不可可能能发发生生的的结结果果叫叫做做不不可可能能事事件件。为为研研究究问问题题的的方方便便,它它们们均均被被看看成成随随机机事事件件的的特例。特例。第4页,本讲稿共69页2.事件的概率事件的概率(1)频率)频率频频率率的的稳稳定定性性说说明明随随机机事事件件发发生生的的可可能能性性的的大大小小是是随随机事件所固有的一种属性。机事件所固有的一种属性。(2)先验概率)先验概率(古典概率古典概率)理论概率理论概率试试验验的的各各种种可可能能结结果果(基基本本
5、事事件件)是是有有限限的的;各各种种可可能能结结果果发发生生的的可可能能性性不不变变。具有这两个特点的试验叫古典型试验。设试验的一切基本事件有n个,而事件A所包含的基本事件有k个,则事件A的概率定义为(A)第5页,本讲稿共69页 例1袋内装有五个白球、三个黑球,从中任意取两个,计算取出的两个球都是白球的概率。解解:组成试验的基本事件总数n,组成所求事件A(取到两个白球)的基本事件数k,故有 第6页,本讲稿共69页(3)经验概率(频率方法)经验概率(频率方法)估计值估计值若若在在n次次重重复复试试验验中中,事事件件A发发生生了了m次次,则则称称为为事件事件A发生的频率发生的频率。一一个个事事件件
6、的的频频率率不不是是一一个个固固定定的的常常数数,这这是是因因为为在在n次次试试验验中中,该该试试验验发发生生的的次次数数m不不是是一一个个固固定定的的常常数数,它它可可以以随随机机地地取取0、1、2、n中中的的任任何何一一个个值值。但但在在试试验验的的多多次次重重复复中中,频频率率具具有有稳稳定定性性。下下面面的的试试验验结结果果可可说说明这一点。明这一点。第7页,本讲稿共69页历次统计学家抛掷硬币的试验结果历次统计学家抛掷硬币的试验结果试验次数试验次数掷币次数掷币次数正面出现频率正面出现频率蒲丰蒲丰40400.5069棣莫根棣莫根40920.5005杰万斯杰万斯204800.5068皮尔逊
7、皮尔逊 24000 0.5005罗曼诺夫斯基罗曼诺夫斯基 806400.4979 费费 勤勤100000.4923第8页,本讲稿共69页从从表表中中数数字字容容易易看看出出,“出出正正面面”的的频频率率总总在在附附近波动,而且近似等于近波动,而且近似等于。在在不不变变的的条条件件下下,重重复复进进行行n次次试试验验,事事件件A发发生生的的频频率率稳稳定定的的在在某某一一常常数数P附附近近上上下下波波动动。且且n越越大大,波波动动幅幅度度越越小小,当当试试验验次次数数趋趋于于无无穷穷时时该该事事件件发发生生的的频频率率会会于于常常数数相相等等,则则称称常常数数P为为事事件件A的的概概率率,记记作
8、作P(A)。这这一一定定义义一一般般称称为为概概率率的的统统计计定定义义,它它适适用用于于一一切类型的试验。切类型的试验。对于概率的这一定义,显然有:对于概率的这一定义,显然有:(1)对于任何事件对于任何事件A,总有总有0P(A)1(2)若若U为必然事件,则为必然事件,则P(U)1。(3)若若V为不可能事件,则为不可能事件,则P(V)0。第9页,本讲稿共69页频率是大量试验的结果,是一个随试验次数频率是大量试验的结果,是一个随试验次数变化而变化的数值,是事件发生的外在表现,变化而变化的数值,是事件发生的外在表现,是一个是一个变量变量。概率是一个确定值,体现了事件发生的内在实质,概率是一个确定值
9、,体现了事件发生的内在实质,是一个是一个常量常量。第10页,本讲稿共69页4、小概率事件、小概率事件统计推断依据的基本原统计推断依据的基本原理理 如果某一事件发生的概率很小,即在多次重复试验的情况下,发生的概率小于0.05,则称其为小概率事件。小概率事件在一次试验中几乎不可能发生,这是在统计推断时所依据的基本原理。第11页,本讲稿共69页二、概率的两个基本法则二、概率的两个基本法则1、加法法则、加法法则概率具有可加性概率具有可加性若若事事件件A和和事事件件B是是两两个个互互不不相相容容的的随随机机事事件件,则则事事件件A与与事事件件B之之和和的的概概率率等等于于这这两两个个事事件件分分别别发发
10、生生的的概概率率的的和和。即即P(AB)P(A)P(B)互不相容事件互不相容事件是指事件是指事件A与事件与事件B不可不可能在一次试验中同时发生,能在一次试验中同时发生,A发生,发生,B必然不能发生,反之亦然。必然不能发生,反之亦然。两事件和两事件和的概率是指两事件中有一个发生,则第的概率是指两事件中有一个发生,则第三件事(三件事(AB)发生的概率发生的概率(A发生发生或或B发生发生)。第12页,本讲稿共69页假定试验做了N次,事件A发生了K次,事件B发生了L次,由于事件A与事件B互不相容,因此事件(AB)发生了KL次。当试验次数无限多时,频率就分别是事件A、B和事件(AB)的概率。因此有P(A
11、B)P(A)P(B)上面结果可以推广到有限多个事件的情况,即如果事件A1、A2、A3、Am是m个两两互不相容的事件,则有P(A1A2A3Am)=P(A1)P(A2)P(Am)第13页,本讲稿共69页例例2某幼儿园中班有122名幼儿,其中朝鲜族幼儿10人,回族6人,蒙族3人,其余是汉族学生,若从中班幼儿中随机抽取一个孩子,问抽到少数民族的孩子的概率是多少?解解:设A、B、C分别表示朝鲜族、回族和蒙族孩子三个事件,而ABC则表示少数民族孩子这一事件,在122名孩子中随机抽取一个孩子恰是少数民族学生的概率是P(ABC)P(A)P(B)P(C)0.156第14页,本讲稿共69页对立事件对立事件如果在一
12、次试验中结果只有两种情况,且这两种结果是互不相融事件,这样的必有一个发生的互不相融事件称为对立事件。第15页,本讲稿共69页2、乘法法则、乘法法则两个事件同时发生的概率两个事件同时发生的概率若若事事件件A和和事事件件B是是相相互互独独立立的的,那那么么这这两两个个事事件件之之积积的的概概率率等于这两个事件分别发生的概率的积。即等于这两个事件分别发生的概率的积。即P(AB)P(A)P(B)相互独立事件相互独立事件是指其中任何一个是指其中任何一个事件发生与否,都不影响另一个事件发生与否,都不影响另一个事件发生的可能性。而两个事件事件发生的可能性。而两个事件之积的概率即是两个事件分别发之积的概率即是
13、两个事件分别发生的概率的积生的概率的积适用于几种情况组适用于几种情况组合的概率合的概率。第16页,本讲稿共69页例例3某校二年级共有学生某校二年级共有学生90人,其中一班有学生人,其中一班有学生48人,人,二班有学生二班有学生42人,在一次语文考试中,共有人,在一次语文考试中,共有70人在人在80分以上。假如两班学生学习成绩是均衡的,那么从分以上。假如两班学生学习成绩是均衡的,那么从全年级随机抽取全年级随机抽取1名得名得80分以上而且是二班学生的概分以上而且是二班学生的概率是多少率是多少?第17页,本讲稿共69页解:设A和B分别表示80分以上和二班这两个事件,由于A和B是独立的,因此这个问题的
14、解决符合概率的乘法法则。随机抽取一个学生,抽到80分以上而且是二班学生的概率就是A、B两个事件同时发生的概率P(AB),由于P(A),P(B)所以P(AB)P(A)P(B)0.36从全年级随机抽取1名学生,抽得80分以上而且是二班学生的概率是0.36。第18页,本讲稿共69页练习练习1、某考生对所考知识一无所知,完全凭猜测回答3道是非题。问该生答对一题的概率有多大?2、一份10道四选一的试卷,考生完全凭猜测得满分的可能性有多大?如果每对一题得1分,该考生凭猜测得7分以上的可能性有多大?3、有一批产品共100件,其中95件是正品,5件是次品。现从中抽取10件样品,恰有2件是次品的概率。第19页,
15、本讲稿共69页第二节第二节 二项分布二项分布 一、二项分布的概念一、二项分布的概念(一)二项试验(一)二项试验(二)二项分布(二)二项分布 二、二、二项分布的平均数和标准差二项分布的平均数和标准差 三、三、二项分布的应用二项分布的应用 第20页,本讲稿共69页第二节第二节 二项分布二项分布一、二项分布的概念一、二项分布的概念教育研究中常用的一种离散型随机变量的概率分布。教育研究中常用的一种离散型随机变量的概率分布。(一)二项试验(一)二项试验凡满足下列条件的试验称为二项试验,即:凡满足下列条件的试验称为二项试验,即:(1)任任何何一一次次试试验验的的结结果果只只有有两两种种可可能能,成成功功或
16、或失失败败,A与与,如判断正误题、选择题、掷硬币等。,如判断正误题、选择题、掷硬币等。(2)若成功的概率为)若成功的概率为p,失败的概率为失败的概率为q,则则p+q=1。(3)每每次次试试验验中中成成功功或或失失败败的的概概率率不不变变,即即成成功功的的概概率率在在第第一次试验中为一次试验中为p,则在第则在第n次试验中的概率也是次试验中的概率也是p。(4)各次试验结果相互独立,即各次试验之间互不影响。各次试验结果相互独立,即各次试验之间互不影响。第21页,本讲稿共69页在教育研究中属于二项试验的事例很多。例如,某小学男教师人数占3/5,从中随机抽取5名教师(有放回抽取),每抽一个教师就相当于做
17、一次试验,共做5次试验。每抽一个教师只有男、女两种可能结果,前一次抽到男或女与后一次抽到男或女没有关系,每次抽到男教师的概率都是3/5。第22页,本讲稿共69页二项分布就是二项试验中各种可能结果的概率分布(二项分布就是二项试验中各种可能结果的概率分布(A事事件出现各种可能结果的概率分布,件出现各种可能结果的概率分布,k+1)。)。二项分布可以用次方的二项展开式来表达,二项分布中事件出现次的概率与二项展开式的各项相对应。下面用回答是非题的例子来研究二项分布与二项展开式之间的关系。当学生完全凭猜测回答两道是非题时,其可能结果有三种:全猜对、一对一错、全猜错,一对一错又有两种情况:第一道题对第二道题
18、错、第一道题错第二道题对。若猜对事件为A,猜错事件为B,则全猜对的概率为:一对一错的概率为:(二)二项分布(二)二项分布第23页,本讲稿共69页全错的概率为即可见,学生做两道是非题,做对不同题目数量的概率分布可用二次二项式来表达。当学生凭猜测回答三道是非题时,可能结果有四类:全猜对、猜对两道错一道、猜对一道错两道、全猜错;而猜对两道错一道和猜对一道错两道各有三种情况,所以共八种可能情况,各种情况的概率为:第24页,本讲稿共69页这八种情况的概率分布如图:这八种情况的概率分布如图:一切可能结果:一切可能结果:AAAAABABABAAABBBBABABBBB每一种可能结每一种可能结果的概率果的概率
19、 :pppppqpqpqpppqqqqpqpqqqq做对不同题数做对不同题数的概率分布的概率分布:p3p2qp2qp2qpq2pq2pq2q3二项分布用二二项分布用二项展开式表:项展开式表:p3+3p2q+3pq2+q3 第25页,本讲稿共69页各项概率之和等于11/8+3/8+3/8+1/8=1由上图可知,学生做三道是非题,做对不同题目数量的概率分布了用三次二项式(p+q)3的展开式来表达。同样可推知,当学生做四道是非题时,做对不同题目数量的概率之和可表示为:(p+q)p+q)4 4=同理,小学生做三道四选一题时,由于每道题猜对的概率是1/4,猜错的概率是3/4,因此猜测的各种可能结果之和可
20、表示为 等等,其他类推。第26页,本讲稿共69页 由以上各例可知,二项试验的各种可能结果出现的概率恰是二二项项展展开开式式各各项项的的值值,试试验验的的次次数数就就是是二二项项式式的的指指数数。如如果果用用n表表示示试试验验次次数数,那那么么在在 n次次试试验验中中二二项项试试验验的的各各种种可可能能结结果果出出现现的的次次数数、概概率率可可通通过过 的的展展开式来表示。二项展开式的一般形式是:开式来表示。二项展开式的一般形式是:展开式中任何一项展开式中任何一项 表示在表示在 n n次试验中某事次试验中某事件发生次件发生次 的概率,而系数的概率,而系数 表示在所有可能结果中,表示在所有可能结果
21、中,这种结果出现的次数为这种结果出现的次数为第27页,本讲稿共69页在n次试验中某事件发生k次的概率可概括为一个通式:(k=0,1,2,n)这个通式叫二项分布函数式二项分布函数式二项分布函数式二项分布函数式,运用这一函数式可以直接求出n次试验中次试验中A事件出现事件出现k次的概率次的概率。例例4某小学生凭猜测做7道是非题,问7道题中答对2道、3道、4道的概率各是多少?解解:本题试验次数为n=7,P=1/2,q=1/2,则试验7次,事件发生2次的概率为:=0.164=0.164 第28页,本讲稿共69页7道题中答对3道的概率是:=0.2737道题中答对4道的概率为:从二项展开式的一般形式中可以看
22、出,只要求出 值,则二项试验中某种结果发生的次数和概率就容易求出了。另外,可利用杨辉三角形直接查出 值。第29页,本讲稿共69页杨辉三角形杨辉三角形 n二项展开式n次方的各项系数总和12345678910 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 1 8 28 56 70 56 28 8 1 1 9 36 84 126 126 84 36 9 11 10 45 120 210 252 210 120 45 1 10 45 120 210 252 210 120 45 10 110
23、 12481632641282565121024第30页,本讲稿共69页二、二项分布的平均数和标准二、二项分布的平均数和标准 二项分布的平均数,是指二项分布中随机变量二项分布的平均数,是指二项分布中随机变量k的的算术平均数,实质上它是以算术平均数,实质上它是以k为原始数据,以概率为原始数据,以概率p(成功事成功事件件)为权数的加权算术平均数。二项分布的平均数为:为权数的加权算术平均数。二项分布的平均数为:二项分布的标准差,是指二项分布中随机变量二项分布的标准差,是指二项分布中随机变量k的的标准差(成功次数的离散程度)。二项分布的标准差为标准差(成功次数的离散程度)。二项分布的标准差为 第31页
24、,本讲稿共69页三、二项分布的应用三、二项分布的应用 利用二项分布可以计算在具有两个对立事件的随机现象的多次试验中某事件出现的概率,估计带有机遇性的实际问题。例例5.某班英语考试共有20道选择题,均为四选一题。规定每题答对得1分,答错或不答得0分。有一个学生说他过去没有学过英语,全凭猜测答题,问(1)凭猜测,他得10分的概率是多少?得18分以上的概率是多少?(2)答对多少道题可以认为他不是猜的?第32页,本讲稿共69页解解:做答20道选择题,可以看成是做20次试验,即n=20。每次试验只有两个结果,要么猜对,要么猜错,每题猜对的概率为 ,猜错的概率为 。(1)凭猜测得10分的概率为:求该学生凭
25、猜测得18分以上的概率,实际上是求他得18分或者19或者20分的概率是多少,即三种获得分数的概率之和:=1.61 1.61此概率非常小,说明完全凭猜测想得高分是不可能的。第33页,本讲稿共69页(2)判断该学生答对多少道题可以认为他不是猜的,只需知道他答对多少题时属于小概率事件,则可判定他答对该题数时就认为不是猜的。由于本题 答题的各种可能结果近似服从正态分布,因此可依据正态分布理论解决此问题。当答题得分为Z Z1.641.64时,P P0.050.05,属于小概率事件,此时 ,已知 所以 5 51.641.64 就是说当该学生答对9 9道题时,可以认为他不是猜的第34页,本讲稿共69页第三节
26、第三节正态分布正态分布 一、一、一般正态分布曲线一般正态分布曲线 二、二、标准正态分布曲线的特点标准正态分布曲线的特点 三、正态曲线下面积及正态分布表三、正态曲线下面积及正态分布表(一)正态曲线下的面积(二)正态分布表的使用 四、正态曲线下面积的利用四、正态曲线下面积的利用1、推求考试成绩中特定区间的人数 2、估计录取分数线 3、确定各等级的人数 4、将等级评定结果转化为分数 第35页,本讲稿共69页第三节第三节 正态分布正态分布所谓分布分布即指随机变量的概率分布,人们可以根据随机事件概率的原理,运用各种特定的理论分布模型,去分析、研究各种具体的随机现象。正态分布是一种最常见的、用处最广的一种
27、连续型随机变量的概率分布,是教育家高斯高斯在研究误差分布时发现的,又称为高高斯分布斯分布。无论在自然界还是在社会领域常见的变量中,许多都呈现出中间多、两头少中间多、两头少中间多、两头少中间多、两头少的正态分布状态,如同龄人的身高与体重,一个地区的降雨量等。由于人的能力,学习成绩等许多教育和心理现象的分布都是中间状态的多,两端出现的少,因此教育和心理领域常用正态分布理论与模型去分析和认识许多教育和心理现象。正态分布也是许多统计方法的前提条件,因此认识正态分布的基本特征,掌握正态分布的应用十分重要。第36页,本讲稿共69页一、一般正态分布曲线一、一般正态分布曲线正态分布是一种理论上的连续变量的概率
28、分布理论上的连续变量的概率分布。其分布图是一种均匀的圆滑曲线,称为正态分布曲线。一般正态分布曲线的方程为:式中,Y Y是正态曲线的高度,表示某观测值出现的相对次数(随机变量的概率)概率密度是观测值,即随机变量的可能取值(-,+)是观测值总体的平均数是观测值总体的标准差=3.14(圆周率)=2.7183(自然对数之底)第37页,本讲稿共69页从上述方程看出,只有是变量,而且与之离差被平方,所以无论离差取正值或负值,只要绝对值相等,对的结果都是一样的,故正态曲线是关于X=这一点的纵线为对称轴的轴对称图形(对称图形不一定是正态分布)。和称为正态分布的两个参数,一般正态分布曲线的位置和形状随其总体的平
29、均数和标准差的不同而变化,即不同的值和值的组合,就会得到不同的正态分布曲线。平均数不同,曲线在横轴上的位置就不同,如图a;标准差不同,则曲线的高矮及与底线距离的长短不同,如图b。因此,平均数的大小决定了图形的位置,标准差的大小决定平均数的大小决定了图形的位置,标准差的大小决定了图形的陡峭平缓程度。当标准差较大时,观测值分散在了图形的陡峭平缓程度。当标准差较大时,观测值分散在较大范围内,较大范围内,Y Y的最大值较小;相反,观测值分散在较小范围内,的最大值较小;相反,观测值分散在较小范围内,Y Y的最大值较大。因此,的最大值较大。因此,正态分布曲线是一簇曲线正态分布曲线是一簇曲线。第38页,本讲
30、稿共69页一般正态曲线分布图一般正态曲线分布图第39页,本讲稿共69页二、标准正态分布曲线及其特点二、标准正态分布曲线及其特点 我们通常所使用的正态分布是指正态分布的标准形式,称为标准正态分布。标准正态分布的平均数为 =0,标准差 =1。其曲线方程为:标准正态分布曲线只有一条,它是一种固定形态的正态分布。如如如如果果果果原原原原始始始始随随随随机机机机变变变变量量量量的的的的取取取取值值值值服服服服从从从从正正正正态态态态分分分分布布布布,那那那那么么么么其其其其标标标标准准准准分分分分数数数数的的的的平平平平均数为均数为均数为均数为0 0 0 0,标准差为,标准差为,标准差为,标准差为1 1
31、 1 1,因此这组标准分数就服从标准正态分布。,因此这组标准分数就服从标准正态分布。,因此这组标准分数就服从标准正态分布。,因此这组标准分数就服从标准正态分布。第40页,本讲稿共69页图图73 73 标准正态分布曲线图标准正态分布曲线图0.341340.341340.13590.13590.02280.0228第41页,本讲稿共69页标准正态分布曲线的特点标准正态分布曲线的特点*:1 1.曲曲线线最最高高点点为为Z Z=0=0,Y Y=0.3989=0.3989,标标准准正正态态分分布布曲曲线线在在Z=0Z=0处处处处Y Y值值最最大大。曲曲线线下下的的总总面面积积即即概概率率的的总总和和为为
32、1 1,对对称称轴轴左左右右各各0.50.5。2 2.曲曲线线是是以以过过Z=0Z=0的的纵纵线线为为对对称称轴轴的的呈呈钟钟形形的的轴轴对对称称图图形形,曲曲线线两两侧侧横横坐坐标标绝绝对对值值相相等等的的对对应应点点的的高高度度相相等等,对对应应的的曲曲线线下面积相等。下面积相等。3 3.标标准准正正态态分分布布的的,都都是是在在Z=0Z=0这这一一点点,而而且且多多数观测值集中在这点附近。数观测值集中在这点附近。4 4.曲曲线线与与对对称称轴轴交交点点处处Y Y值值(相相对对次次数数)最最大大,概概率率最最大大;曲曲线线向向两两侧侧先先快快后后慢慢对对称称下下降降,在在Z=Z=+1 1处
33、处有有两两个个拐拐点点,几几乎乎包包括括观观测测值值总总数数的的2/32/3;左左右右各各个个标标准准差差范范围围内内基基本本包包括括全全部部观观测测值值;横横轴轴是是标标准准正正态态分分布布曲曲线线的的水水平平渐渐进进线线,曲曲线线向向两两侧侧逐逐渐接近横轴,但永远不与横轴相交,所以渐接近横轴,但永远不与横轴相交,所以Y Y值永远不会等于零。值永远不会等于零。第42页,本讲稿共69页(一)正态曲线下的面积(一)正态曲线下的面积 正态曲线与其底边所围成的面积称为正态曲线下的面积(P)随随机机变变量量的的概概率率,代表分布的总次数。正态曲线底边表示观测值各量数,标准正态曲线底边上的量数是分数。曲
34、线被对称分为两部分,两部分面积各占总面积的一半。标准正态曲线下的总面积为1概概率率之之和和为为1 1,各部分的面积比率是确定的。在Z=0Z=0左右各一个标准差的范围内,包括总面积的68.26%表中Z=-1与Z=1两点的纵线所夹的图形的面积比率,表示相应区间内随机变量的概率,左右各两个标准差的范围内,包括总面积约95.44%,左右各三个标准差的范围内约包括总面积的99.74%,而左右各四个标准差的范围内约包括总面积的99.99%。同时,左右1.96个标准差之间,包含总面积约95%,左右2.58个标准差之间,包含总面积约99%。三、正态曲线下面积及正态分布表三、正态曲线下面积及正态分布表第43页,
35、本讲稿共69页正态曲线与基线之间某一区间的面积,相当正态曲线与基线之间某一区间的面积,相当于能在该区间找到个体的概率。于能在该区间找到个体的概率。第44页,本讲稿共69页(二)正态分布表的结构与使用(二)正态分布表的结构与使用 由于标准正态曲线具有稳定性,相同的位置对应的正态曲线下面积相等,高度相等,因此标准正曲线下的各种Z Z值对应的面积比率及Y Y值都可以由从正态分布表(附表)直接查出(依据正态分布函数,用积分计算当Z为不同值时,正态曲线下的面积与密度函数值或比率数值Y)。在附表中,列出与各种Z Z值对应的曲线高度Y Y和Z Z=0=0至某个Z Z值间的面积比率P P。只要知道某一分数Z
36、Z值的大小,就可以从中查到Z Z值对应的Y值及其左侧对应的面积比率P,反之亦然。因为正态曲线下Z=0Z=0处左右对称,所以表中仅列出了Z=0Z=0右侧的Z,Y,P值。第45页,本讲稿共69页正态分布表的使用正态分布表的使用一是已知Z Z值,求与之对应的P值;二是已知P值,求Z Z值第46页,本讲稿共69页已知已知z z值,求面积值,求面积P P 主主要要有有三三种种情情况况:一一是是求求Z=0Z=0至至某某一一值值之之间间的的面面积积比比率率;二二是是求求任任意意两两个个Z Z值值间间的的面面积积比比率率;三三是是求求某某一一Z Z值值以以上或以下的面积比率。上或以下的面积比率。例利用正态分布
37、表,求例利用正态分布表,求(1 1)Z=0Z=0至至Z=1Z=1之间的面积比率及之间的面积比率及Z=1Z=1时的时的Y Y值;值;(2 2)Z=-1Z=-1至至Z=1Z=1之间的面积比率;之间的面积比率;(3 3)Z=1.96Z=1.96以上和以上和Z=-1.96Z=-1.96以下以下的面积比率;的面积比率;(4 4)Z=-2.58Z=-2.58至至Z=2.58Z=2.58之间的面积比率。之间的面积比率。(5 5)Z=1.64Z=1.64左侧的面积比率左侧的面积比率解:查正态分布表(附表),可得:解:查正态分布表(附表),可得:(1 1)Z=1Z=1时时,P P0.341340.34134,所
38、所以以Z=0Z=0至至Z=1Z=1之之间间的的面面积积比比率为率为0.341340.34134;Z=1Z=1时对应的时对应的Y=0.24197Y=0.24197。第47页,本讲稿共69页(2)Z=1Z=1时,Z=0Z=0至至Z=1Z=1之间的面积为P1=0.34134;当Z=-1Z=-1时,Z=0Z=0至至Z=-1Z=-1间的面积,可由正态分布的对称性知,P20.34134,所以,Z=-1Z=-1至至Z=1Z=1之间的面积比率为0.341342=0.68268。(3)Z=1.96Z=1.96以上的面积等于0.5减去Z=0Z=0至至Z=1.96Z=1.96之间的面积,Z=0Z=0至至Z=1.96
39、Z=1.96的面积比率为0.475,所以Z=1.96Z=1.96以上面积比率为0.5-0.475=0.025;Z=-1.96Z=-1.96以下面积与Z=1.96Z=1.96以上面积部位对称,因此Z=-1.96Z=-1.96以下的面积比率亦为0.025。(4)Z=2.58Z=2.58时,对应的P=0.49506,Z=-2.58Z=-2.58与与Z=2.58Z=2.58之间的面积比率为0.495062=0.99012。(5)Z=1.64时,对应的P=0.44950,求其左侧的面积就是曲线左半部分的面积比率与Z=0到Z=1.64之间的面积之和,即:0.5+0.44950=0.94950。第48页,本
40、讲稿共69页2 2已知已知P P值求值求Z Z值值已知P值求Z Z值,是指利用正态分布表求一定面积比率界限对应的Z Z值。主要有两种情况,一是求正态曲线两尾端面积对应的Z Z值;二是求正态曲线中间一定面积上下界限对应的Z Z值。已知P值求Z Z值时,表上常找不到已知的准确P值对应的Z Z值,这时找到与已知面积比率最接近的Z Z值,然后找到与之对应的Z Z值即可。例例 利用正态分布表求(1)正态曲线下右尾面积为0.05对应的Z Z值;(2)正态曲线下左尾0.01对应的Z Z值;(3)正态曲线下中间面积0.95和0.99面积比率上下界限对应的Z Z值。第49页,本讲稿共69页解解:查正态分布表可得
41、:(1)正态曲线下右尾0.05面积比率对应的Z Z值即是面积0.45对应的Z Z值。从正态分布表中P值一列找不到0.45这个值,则找到0.45最接近的0.4495,它对应的Z Z=1.64,便是所求。(2)正态曲线下左尾面积为0.01对应的Z Z值与右尾0.01面积对应的Z Z值相同。右尾0.01面积对应的Z值,即是面积0.49对应的Z Z值。从正态分布表中找到与0.49最接近的0.49010,它对应的Z=2.33Z=2.33便是所求。(3)正态分布中间0.95的面积比率在Z=0Z=0处被平分,而且上下界限对应的Z Z值对称,即当P=0.475P=0.475时,查其对应的Z Z,Z=1.96Z
42、=1.96,即中间0.95面积比率上下界限对应的Z Z值为;同理 ,从正态分布表中找到与0.495最接近的值0.49506,其对应的Z=2.58Z=2.58,所以中间0.99面积比率上下界限对应的Z Z值为第50页,本讲稿共69页四、正态曲线下面积的利用四、正态曲线下面积的利用 1 1、推求考试成绩中特定区间的人数、推求考试成绩中特定区间的人数例例1 1某市600名小学生的数学竞赛成绩服从正态分布,其平均成绩为65分,标准差为15分,利用正态分布曲线下的面积推求60分以下,6070分,7080分,80分以上各段可能占总人数多大比例?并估计各分数段各有多少人?解解:由于600名学生的数学成绩服从
43、正态分布,因此我们在未分类整理统计各分数段人数之前,就可根据正态分布曲线下的面积推求各段人数。第51页,本讲稿共69页首先求出各分数区间界限的标准分数。已知 65,15,所以60分的标准分数为:70分的标准分数为:80分的标准分数为:然后查正态分布表中Z Z 值对应的面积比例P。当Z Z=0.33时,查表得P=0.12930P=0.12930;当Z Z=1时,查表得P=0.34134P=0.34134;第52页,本讲稿共69页利用正态曲线的对称性知60分以下的人数比例为0.5-0.5-0.12930=0.37070.12930=0.3707,6070分的人数比例为0.129302=0.2586
44、0.129302=0.2586,7080分的人数比例为0.34134-0.12930=0.212040.34134-0.12930=0.21204,80分以上的人数比例为0.5-0.34134=0.158660.5-0.34134=0.15866。最后用总人数乘以各分数段人数比例,求得各分数段的可能人数。由于参加考试的人数有600人,所以各分数段的人数(以整数计)为60分以下:6070分:;7080分:;80分以上:各分数段人数之和应等于参加考试的总人数,即223+155+127+95=600223+155+127+95=600第53页,本讲稿共69页2.2.推求考试成绩中某一特定人数比率的分
45、数界限推求考试成绩中某一特定人数比率的分数界限例例2 2上例中600名小学生数学成绩服从正态分布,平均成绩65分,标准差15分,如果计划选取出120名参加省里竞赛,那么选取的分数线最底应是多少?解解:将选取的人数比率作为正态分布曲线右尾部面积比率,在正态分布中找出与之对应的标准分数Z Z值,然后根据Z Z值用公式 求出原始分数的值。选取比率为:按面积比率0.5-0.2=0.3,查正态分布表,找到与0.3最接近的0.29955对应的Z=0.84Z=0.84,所以录取分数估计是:第54页,本讲稿共69页3 3确定按能力或成绩等级分组的各组人数确定按能力或成绩等级分组的各组人数*在在用用正正态态曲曲
46、线线下下的的面面积积来来确确定定各各能能力力等等级级的的人人数数时时,前前提提假假定定被被评评变变量量的的等等级级在在正正态态曲曲线线底底边边上上变变化化范范围围是是已已知知的的(),而且各等级的距离相等而且各等级的距离相等。例例3 3若若对对500500名名学学生生的的写写作作能能力力按按优优秀秀、良良好好、中中等等、及及格格、不不及及格格五五级级评评定定,已已知知学学生生写写作作能能力力服服从从正正态态分分布布,用用正正态态曲曲线线下下的面积推测一下各等级应该有多少人?的面积推测一下各等级应该有多少人?解:由于正态分布情况下,解:由于正态分布情况下,之间几乎包括了全部观测之间几乎包括了全部
47、观测值,因此可认为值,因此可认为500500名学生的写作能力等级分布在名学生的写作能力等级分布在 的范围的范围内;又由于各等级间距离相等,因此可以把内;又由于各等级间距离相等,因此可以把 区间平均分成区间平均分成五等份五等份,即每一等级占的区间长为即每一等级占的区间长为 第55页,本讲稿共69页 从从图图中中我我们们可可以以找找到到每每一一等等级级在在正正态态曲曲线线下下的的位位置置。然然后后再再查查正正态态分分布布表表,求求得得每每一一等等级级包包括括的的面面积积比比例例,就就是各等级的人数比例。是各等级的人数比例。图图中中显显示示出出优优、良良、中中、及及格格、不不及及格格各各等等级级的的
48、Z Z分分数区间,查正态分布表,求得各等级人数比例分别为:数区间,查正态分布表,求得各等级人数比例分别为:第56页,本讲稿共69页优优:0.5-0.46407=0.035930.5-0.46407=0.03593,即Z=1.8Z=1.8右侧对应的面积比例。良良:0.46407-0.22575=0.238320.46407-0.22575=0.23832,即Z=0.6Z=0.6与Z=1.8Z=1.8之间的面积比例。中中:0.22575+0.22575=0.45150.22575+0.22575=0.4515,之间的面积比例.及及格格:Z=-1.8Z=-1.8与与Z=-0.6Z=-0.6之间的面积
49、比例,它与Z=0.6Z=0.6到到Z=1.8Z=1.8之间的面积对称,所以也是0.238320.23832。不不及及格格:即Z=-1.8Z=-1.8左侧的面积比例,与Z=1.8Z=1.8右侧的面积对称,即0.03593。用被评定的总人数N=500分别乘以各等级的人数比例,便求得各等级的相应人数,即优秀和不及格的人数都是优秀和不及格的人数都是5000.03593=185000.03593=18良好和及格的人数都是良好和及格的人数都是5000.23832=1195000.23832=119中等的人数为中等的人数为5000.4515=2265000.4515=226各等级人数之和应等于总人数,即各等
50、级人数之和应等于总人数,即:182+1192+226=500182+1192+226=500注:如果不等时,将居中的那一组做适当的减少或增加。注:如果不等时,将居中的那一组做适当的减少或增加。第57页,本讲稿共69页4 4将等级评定结果转化为连续型变量将等级评定结果转化为连续型变量 由于学生的学业成绩或能力是服从正态分布的,因此对学生的学业或能力的定性等级评定,可以利用正态曲线下的面积,把等级资料转换成标准分数,以便进行合并或进行比较。例例4 4某班进行口试,有三位主试教师,每个人分别评定并记录学生的口试成绩,然后综合三个主试的评定结果确定每个学生的口试成绩。学生的成绩分为五个等级,即优、良、