《教育统计学ppt课件-6-概率与概率分布.ppt》由会员分享,可在线阅读,更多相关《教育统计学ppt课件-6-概率与概率分布.ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、心理与教育统计学心理与教育统计学第五章概率与概率分布n本章要点:n1. 概率的基本概念;n2. 二项分布;n3. 正态分布;概率与概率分布概率与概率分布1. 概率的基本概念n确定现象和随机现象确定现象和随机现象n确定现象:在一定条件下事先可以断言必然会发生某种结果的现象叫做确定性现象。确定现象又有两种情况:nA 必然现象:在一定情况下必然会发生的现象。n例如:导体通电时,必然会发热;nB 不可能现象:在一定条件下必然不会发生的现象。n例如:铁棒被蜡烛灼烧,化成铁水。n确定现象和随机现象确定现象和随机现象n随机现象:事先不能断言会出现哪种结果的现象叫随机现象。我们把对随机现象的一次观察叫做一次随
2、机试验。在随机试验中,随机现象体现出两大特点:n1. 偶然性,一次试验前,不能预言发生哪一种结果;n例如:硬币抛向空中,落地时是反面朝上还是正面朝上?n2. 必然性,相同条件下的大量重复试验会呈现出规律性;n例如:对“空中抛掷硬币”的随机现象进行观察,在1.2万次的重复观察中,正面向上有6019次;在2.4万次重复观察中,正面向上有12012次;n随机事件随机事件n随机事件:随机现象中出现的各种可能结果,叫做随机事件,简称事件。n例如:“明天的天气状况”这一随机现象的可能结果:n下雨、多云、晴天、冰雹、下雪等;n随机事件有两种极端情况:n1. 必然事件,某一事件中包含随机试验中所有可能的结果,
3、这一事件为必然事件。n例如:投掷骰子,点数小于7。n2. 不可能事件,某一事件不包含随机试验中的任何结果,这一事件为不可能事件;n例如:投掷骰子,点数大于7.n事件的频率事件的频率n为了找到某事件A发生的规律性,我们需要在N次重复试验中找到事件A发生的次数n,并计算n与试验总次数N的比值,这个比值称为事件A发生的频率,记作:( )NnFANN=5N=50N=500120.40220.442510.502230.60250.502490.498310.20210.422560.512451.00250.502530.506510.20240.482510.502620.40210.422460.
4、492740.80180.362440.488820.40240.482580.516930.60270.542620.5241030.60310.622470.494n正n正n正()NF正NF(正)NF(正)n事件的频率事件的频率n若试验满足以下条件:n1. 每次试验中某一事件发生的可能性不变,n2. 试验能大量重复,且每次试验相互独立,n此时,事件A发生的概率就是事件A发生的频率的稳定值。n概率的统计定义概率的统计定义n在大量重复的N次试验中,当N无限增大时,事件A发生的频率n/N稳定在一个确定的常数附近,我们就用这个数来表示事件发生的概率,记作:P A( )=limNnP AN( )例例
5、1:一个射手射击500次,有400次中靶,问该射手的技术水平如何?即中靶概率。n解:解: 400=0.8500P A( )n概率的古典定义(先验概率)概率的古典定义(先验概率)n概率的古典定义要求试验满足以下两种条件:n1. 如果每次试验中所可能出现的结果是有限的且互不相容的,n2. 而且这些结果出现的可能性相等,n我们把这些结果称为基本事件。n例如:抛置骰子这一随机试验的基本事件为:123456。n概率的古典定义(先验概率)概率的古典定义(先验概率)n若试验由n个有限的基本事件构成,且每个试验中每个基本事件出现是等可能的,如果事件A发生的次数为m,则该事件的概率为:A=mP An事件 包含的
6、基本事件数( )基本事件数例例2:抛掷骰子一次,所得点数小于3的概率。n解:解:A=1,2, P(A)=2/6=1/3。例例1:一个射手射击500次,有400次中靶,问该射手的技术水平如何?即中靶概率。n注:注:统计概率(后验概率)常用于随机现象不满足“基本事件等可能发生”的情况,或者某些试验不可能分为等可能的互不相交的事件。 n例例3:从放有三个红球和四个黑球的一个袋子时连续地抽取2个球,球的大小和形状一样,只颜色不同,请分别求下面三种事件的概率:A1:取出2个红球;A2:1个黑球1个红球;A3:2个黑球。n解:解:n我们将7个球进行编号,则每次抽取两个球,总体的可能情况有:n这21种可能结
7、果可以做为基本事件。nA1:nA2:nA3:277!7!7*6*5*4*3*2*1=212! 72 !2!5!(2*1)(5*4*3*2*1)C233!3*2=32! 32 !2C244!4*3=62! 42 !2C11343!4!=*=3*4=121! 3 1 ! 1! 4 1 !C Cn1. 事件的补及其概率事件的补及其概率n事件A之外的事件,称为事件A的补事件(或称逆事件),记为 。n它是中所有不属于事件A的基本事件的集合。( )( )P AP A 1AA一个试验中所有结果(基本事件)的集合,用 表示。例如:在掷一颗骰子的试验中, 1,2,3,4,5,6;在投掷硬币的试验中,正面,反面n
8、2. 互斥事件互斥事件n在试验中,两个事件有一个发生时,另一个就不能发生,则称事件A与事件B是互斥事件。An例例4. 在一所城市中随机抽取600个家庭,用以确定拥有个人电脑的家庭所占的比例。定义如下事件:nA:恰好有265个家庭拥有电脑nB:恰好有100个家庭拥有电脑nC:张三家(600个家庭中的一员)拥有电脑n说明下列各对事件是否为互斥事件,并说明你的理由n (1) A与B (2) A与C (3) B与 Cn解解:n(1) 事件A与B是互斥事件。因为你观察到恰好有265个家庭拥有电脑,就不可能恰好有100个家庭拥有电脑;n(2) 事件A与C不是互斥事件。因为张三也许正是这265个家庭之一,因
9、而事件A与C有可能同时发生;n(3) 事件B与C不是互斥事件。理由同(2)。n3. 加法定律加法定律n若两个事件A与B互斥,则事件A发生或事件B的发生概率等于这两个事件各自的概率之和,即:nP(A+B) =P(A)+P(B)n事件A1,A2,An两两互斥,则有nP(A1+A2 +An)=P(A1)+P(A2) +P(An)n4. 乘法规则乘法规则n如果A、B为互为独立的事件,那么A与B两个事件同时发生的概率nP(AB) =P(A) P(B)n例:不考虑小丑,从一副牌中抽取梅花6的概率为nP=P(6)*P(梅花)=1/13*1/4=1/52n5. 广义加法公式广义加法公式n对任意两个随机事件A和
10、B,它们和(并)的概率为两个事件各自概率的和减去两个事件交的概率,即:nP(A+B) = P(A) + P(B) - P(AB) 或nP(AB) = P(A) + P(B) - P(AB) BAn解:解:设 A = 员工离职是因为对工资不满意n B = 员工离职是因为对工作不满意n 依题意有:n P(A)=0.40;P(B)=0.30;P(AB)=0.15 n P(A+B)= P(A)+ P(B)-P(AB)=0.40+0.30-0.15=0.55n6. 条件概率条件概率n在事件B已经发生的条件下事件A发生的概率,称为已知事件B时事件A的条件概率,记为P(A|B) ()( |)( )P ABP
11、 A BP Bn解:解:n设A =顾客购买食品,B =顾客购买其他商品;n依题意有:nP(A)=0.80;P(B)=0.60;P(AB)=0.35 n例例8. 一家电脑公司从两个供应商处购买了同一种计算机配件,质量状况如下表所示n n从这200个配件中任取一个进行检查,求n(1) 取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率n(3) 已知取出一个为供应商甲的配件,它是正品的概率甲乙两个供应商提供的配件甲乙两个供应商提供的配件 正品数正品数次品数次品数合计合计供应商甲供应商甲 84690供应商乙供应商乙 1028110合计合计18614200n解:解:设 A = 取出的一个为
12、正品 n B = 取出的一个为供应商甲供应的配件 n7. 乘法公式(乘法公式(2)n以条件概率的定义为基础,用来计算两事件交的概率:n设A,B为两个事件,则nP(AB) = P(B)P(A|B); P(B)0n或P(AB) = P(A)P(B|A); P(A)0概率与概率分布概率与概率分布2. 二项分布n二项试验二项试验n首先看下面的白鼠服毒试验的例子:n如果小白鼠服毒后的死亡概率p,则生存概率为q=1-p。n现对一只小白鼠进行实验的结果为:死,概率为p;生,概率为q=1-p。n对二只小白鼠(甲乙)进行实验的结果为:n甲乙均死概率为:n一死一生的概率为 ,其中甲死乙生及乙死甲生的概率均为n甲乙
13、均生的概率为:n概率相加得:2ppp2pqpq2q222ppqq2()pqn对三只小白鼠(甲乙丙)进行实验的结果为:n均死的概率为:n两死一生的概率为 ,其中甲生乙丙死、乙生甲丙死和丙生甲乙死的概率均为 ;n一死两生的概率为 ,其中甲死乙丙生、乙死甲丙生和丙死甲乙生的概率均为n均生的概率为n概率相加得:3p23p q2p q23pq2pq3q3223p3p q3pqq3=( + )p qn依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得:1 nnnn 1xxn xnpC pqC p qq()npq1!xnnCx nx其中,n二项试验所涉及的随机现象具有如下特点:n每一次试验(如上面例子
14、中的对一只小白鼠染毒称为一次试验,对二只小白鼠同时染毒也称为一次试验,对三只小白鼠同时染毒仍称为一次试验)可以分成一些小试验(如,甲染毒是一次小试验,乙染毒也一次小试验),每一次小试验恰好有两个结果,如上面例子中的“死”与“生”,一般把两个结果称为:成功与失败。 n共进行了n次,n是一个事先预定好的正整数。n各次试验互不影响,相互独立。n每一次小试验中出现成功的概率p(A)恒定,记为p,因此失败的概率q=1-p。 n二项试验的分布规律称为二项分布(两个对立事件的概率分布),从上面例子的分析可以得出,在二项试验中出现 X 次成功的概率为:n这个式子给出的分布叫二项分布。xxn xn()C p q
15、(012,., )P Xxxn ,n对于随机变量x进行n次独立试验,如果每次实验结果只出现对立事件A与 之一,在每次试验中出现A的概率是p,则出现 的概率为1-p,记为:q=1-p,那么,在n次独立试验下,A出现次数为x的概率分布即二项分布。AAn如果小白鼠服毒后的死亡概率为0.5,在一次试验中用了10只小白鼠。请问这次试验中:n1. 没有白鼠死亡的概率为?n2. 一只白鼠死亡的概率为?n3. 两只白鼠死亡的概率为?nn10. 十只白鼠死亡的概率为?死亡白鼠个数012345678910!x!( - )!x n x!( - )!nx n xxpn xq( )p x1126241207205040
16、403203628803628800362880036288080640302401728014400172803024080640362880362880011045120210252210120451011.000000.500000.250000.125000.062500.031250.015625.007813.003906.001953.000977.000977.001953.003906.007813.015625.031250.062500.125000.250000.5000001.000000.0010.0098.0440.1172.2051.2051.2461.1172
17、.0440.0098.001010只小白鼠服毒试验的二项分布图。死亡小白鼠的个数概率n如果小白鼠服毒后的死亡概率为0.20,在一次试验中用了10只小白鼠。请问这次试验中:n1. 没有白鼠死亡的概率为?n2. 一只白鼠死亡的概率为?n3. 两只白鼠死亡的概率为?nn10. 十只白鼠死亡的概率为?死亡白鼠个数012345678910!X!(-)!XNX!(-)!NXNXXpNXq()p X1126241207205040403203628803628800362880036288080640302401728014400172803024080640362880362880011045120210
18、252210120451011.000000.200000.040000.008000.001600.000320.000064.000013.000003.000001.000000.107374.134218.167772.209715.262144.327680.409600.512000.640000.8000001.000000.10737.26844.30199.20133.08808.00551.02642.00079.00007.00000.0000010只小白鼠服毒试验的二项分布图。死亡小白鼠的个数概率n二项分布的特点二项分布的特点n二项分布的均值为np,方差为npq。n以事
19、件A出现的次数为横坐标,以概率为纵坐标,画出二项分布图,可以看出:p=q=0.5时,图象对称;pq时,呈负偏态;p时,趋近于正态分布N(np,npq),更具体的要求是n与p、q两个中最小者的乘积大于5时,也就是说n至少大于等于10时。n有正误题10题,问:完全凭猜测答对8题以上的可能性有多大?n有多选题(5个选项)10题,问:完全凭猜测答对4题以上的可能性有多大?n有多选题(5个选项)10题,问:小鸣和小亮两人均答对5题以上的概率是多少?n在统计中有一条原理称为“小概率事件原理”,它指的是“在一次试验中小概率事件(5%及以下)是不可能发生的”。n有多选题(5个选项)10题,问:答对多少题才能认
20、为某人不是完全凭猜测答题?概率与概率分布概率与概率分布3. 正态分布n正态分布是概率论中最重要的一种分布。一方面正态分布是自然界最常见的一种分布,一般来说,若影响某一数量指标的随机因素很多,而每个因素所起的作用不太大,则这个指标很可能服从正态分布。n另一方面正态分布具有许多良好的性质,许多分布可用正态分布来近似,另外一些分布又可以通过正态分布来导出 (如后面将学习到的T分布、2分布和F分布,都是由正态随机变量构造而成),因此在理论研究中,正态分布十分重要。我们要讲的推断统计的总体基本上都要求服从正态分。 n正态分布特征n正态分布曲线,前面曾有所介绍,即中间大,两端小,单峰对称,钟形。这一曲线的
21、函数表达式,也就是正态分布的概率密度函数为:22212Xye 1. 位于x轴上方,以直线x=为对称轴(为均数),对称地无限延伸,以x轴为渐进线,但始终不与x轴相交。2. 当x=时,曲线处于最高点。x=两点是拐点,当正态曲线由中央向两侧逐渐下降时,到拐点改变弯曲方向,整条曲线呈现“中间高,两边低”的形状。3. 正态曲线与x轴所围成的区域的面积是1,而x=将正态曲线分成面积均为0.5的两部分。服从正态分布的变量x在x1到x2间变化的概率( x1 x2 ),就是x= x1,x=x2两轴之间曲线下的面积。n注:注:nx为随机变量的取值-x;n为均值,表示分布的集中情况。正态分布的曲线即是以它为轴左右对
22、称,正态分布的均值、中数和众数都位于同一点;n为标准差,表示分布的离散程度。对于均值相同,标准差越大,则正态分布曲线越低阔,如果标准差越小,则正态分布曲线越高窄;不同均值不同均值()的正态分布的正态分布4. 正态分布xN(,2)是由均值和标准差唯一决定的分布。当均值和标准差不同时,正态曲线呈现的位置和形状也不同。均值决定曲线的位置。不同标准差不同标准差()的正态分布的正态分布4. 标准差决定曲线的形状,标准差越大,曲线越扁平(分布越分散),标准差越小,曲线越“瘦长”(分布越集中于平均数附近)。n正态分布实际上并不只有一个分布,而是大量基本形态相似的分布,均值与标准差任一个不同就得到一个不同的正
23、态分布。n正态分布一般记为正态分布一般记为 N(,2) ,如 N(170, 25) 表示均值为170,标准差为5(或方差为25)的正态分布。n虽然正态分布有无穷多个,但它们都可以通过标准化的方式转化为一个特殊的正态分布,那就是均值为0,标准差为1的标准正态分布,标准正态分布记为 N(0, 1)。 xzn在一般的正态分布中某一区间的概率也可以转化成标准正态分布中相应范围内的概率,所以正态分布的查表求概率只需要编制标准正态分布的概率表一个表即可。下面我们介绍标准正态分布的概率表。n标准正态分布概率表标准正态分布概率表 n本教材上的标准正态概率表的编制方法是从 Z=0 开始,逐渐变化Z值,计算从 Z
24、=0 至某一定值之间的概率,如图所示: n在本教材的标准正态分布表中除了给出 Z 值及相应的 P 值外,还给出了 Z 分数点上的曲线的纵高,记为 Y ,不过这个指标一般很少用,在本教材中只有质量相关一节里用过。由于正态分布为对称分布,故在 Z0 时的相应的Z分数所对应的概率值是相等的。 n这里值得提醒的是,在使用其它地方的标准正态分布概率表时,一定要先了解一下该正态表的编制方法,以免用错,如有的给出的即是从 - 开始到某 Z 值之间的概率。另外在不大熟练时,可以简单地画一个正态分布图以帮助查表。 n查表:nZ=1时,P为?nZ=2时,P为?nZ=3时,P为?2.1 已知X或Z,求P。1. PX
25、2. PX3. 1.961.96PZ1. PX 11PXXP 11PZ 2 01PZ2*0.341340.682682. 33 PX33 33PXXP 33PZ 2 03PZ2*0.498650.9973 1.961.962 01.96PZPZ2*0.475000.953. 1.961.96PZn由P求Z值。n2.3 已知X(Z)或P,求Y。n实例:n某地区成年男子身高服从正态分布,其均值是169cm,标准差为7cm。求满足满足以下条件的男子的比例:、155cm以下;、176cm以上;155cm176cm之间 。n解:解:题目所要求的三个概率,如下图的P1、P2、P3所示:n查正态分布,当Z=
26、2时,P=0.47725,当Z=1时,P=0.34134。所以 :nP1 = 0.5 - 0.47725 = 0.02275 = 2.275%;nP2 = 0.5 - 0.34134 = 0.15866 = 15.866%;nP3 = 0.47725 + 0.34134 = 81.859%n几个常用概率值 :n这里所给出的几个常用概率值一定要牢记,在以后的推断统计中经常会用到。其中中间有一大部分,两端各留一相等部分的称为双侧概率值,只分成左右两部分的称为单侧概率值。n双侧概率值一般用两端概率之和来称呼,如双侧的0.05和0.01,它们对应的 Z 值分别为1.96和2.58,记为 Z0.05/2
27、 = 1.96,Z0.01/2 = 2.58。n这里下标中的0.05和0.01表示的是两端概率之和,斜杠2表示双侧概率。 n单侧概率值则用较小的那一部分的概率来称呼,如图中显示了单侧0.01,它们对应的 Z 值为2.327,记为Z0.01 =2.327,这里的下标中没有斜杠2,表示单侧概率。n另外,不管单侧还是双侧概率,也不管小的一部分在左端还是在右端,给出的 Z 值都是正的,使用者则根据实际需要来决定是否加上负号。 n注意:注意:n教材中所给出的统计表只从0之间取了400个值,因此某些 Z 值或 P 值在表中可能没有,此时则用与要查值最相近的那个值来代替;n若还要得精确一点,则可以找出邻近的
28、两个值,再利用相应比率进行插值,若要查值大致界于两邻近值的中间,则可用两邻近值的平均数来代替。 n例子:要找到单侧概率值0.05所对应的Z值。n解:n我们根据编表规则,在表中查找概率值n0.5 - 0.05 = 0.45;n表中只有0.44950和0.45053这两个概率值,而无0.45;n这两个值一个比0.45小0.00050,一个比0.45大0.00053,两者的差距大致相同,所以可用这两个概率值所对应的Z值1.64和1.65的平均数1.645做为最终结果,即有Z0.05 = 1.645。n当然你也可以用插值的方法得到更精确的结果,即:0.050.051.650.450530.450.45
29、0.449501.64ZZ0.051.64485Zn正态分布在实际中的应用正态分布在实际中的应用n标准分数(Z分数)n若原始分数服从或近似服从正态分布时,标准分数有如下性质:n1. 由原始分数转换得到的Z分数的平均数为0;n2. 由原始分数转换得到的Z分数的标准差为1;n3. 若xN(,2),则xZxXZS(01)xN, xZxXZSn例:某年高考的平均分数为500分,标准差为100分的正态总体中,某考生得到600分。当年高考录取率为多少时他才能被录取?n例. 已知某班期末考试中语文平均分为80分,标准差为10分;数学的平均分为70分,标准差为15分;英语的平均分为85分,标准差为12分。某生
30、的语文成绩为90,数学成绩85,英语成绩为88,请问他的哪一科成绩最好?n例. 某市某入学考试人数2800人,只录取150人,该次考试平均分为75分,标准差为8分,问录取分数应为多少分?n例:某项能力考试考生4700人,平均成绩为57.08分,标准差为18.04分,问(1)在90分以上有多少人?(2)成绩在8090分以上有多少人?(3)成绩在60分以下有多少人?n4.5 在能力分组或等级评定时确定人数在能力分组或等级评定时确定人数n这一应用是 解决这样的问题:总共有n个被试,要将他们按某指标(能力)分成K个组,问每个组应各分多少个,才能使不同组在能力上的差异等距。其原理是,假设平均数左右3个标
31、准差(99.73%)覆盖了所有的范围,然后将之均分,对每等级查概率表计算相应的比率。例:表5-8 能力分为5组时各组人数的分布分组各组界线比率P人数分布A1.8以上以上0.03594B 0.6至至1.8 0.238424C-0.6至至 0.60.451444D-1.8至至-0.6 0.238424E-1.8以下以下0.03594n4 正态分布在实际中的应用正态分布在实际中的应用n4.6化等级评定为连续数据化等级评定为连续数据n处理等级评价时面临的问题及其解决思路n参见教材P163中表5-3和5-4,我们碰到了这样的问题:不同评价者由于各自的标准不同,在对同一个心理量进行评定时可能给出不同的等级
32、分数,如何综合评价各评价者的结果。如何比较不同被评者的心理量的差异。从例子中看出只有将不同质的等级分数转化为同质的测量分数才可以综合评价。 n4 正态分布在实际中的应用正态分布在实际中的应用n4.6化等级评定为连续数据化等级评定为连续数据n处理等级评价时面临的问题及其解决思路n转化的前提条件:被评定的心理量从意义上来说应是一个测量数据,而且服从正态分布(凭常识),只是人为地在评定时划分为等级。对于一个具体的样本来说,他们所服从的正态分布是固定的,只是不同评价者对这个正态分布的划分不一样。 n转化方法用各等级中点对应的Z分数代表该等级分数。n根据各等级被评者的数目求出各等级的人数比率。n求各等级
33、中点以下的累加比率。n用累加比率查正态表求Z分数,用Z分数代表各等级的测量值。n求各被评者所得评价等级的测量分数的算术平均数,即为综合评定分数。 n4.7 确定测验题目的难易程度确定测验题目的难易程度n难易度是表示试题的难易程度的指标,一般用答对者的比例来表示,而百分数不是等距尺度,只是顺序尺度,无法比较不同难易程度题目之间的难度距离。因此也需要将难易百分数转化为难易Z分数。 转化时为了避免出现负数,常常对Z分数进行变换,即加上5,即假设总共左右5个标准差范围,同时也使最后的数据满足10分制,符合我们的习惯。课后习题:1. C;2. B;3. D;4. A;5. D;6. A;5. 基本事件的
34、个数为4个。分别为:(1)甲效果显著,乙效果不显著;(2)甲效果显著,乙效果显著;(3)甲效果不显著,乙效果不显著;(4)甲效果不显著,乙效果显著;6. “至少有一人进行了特殊实验”的补事件是:“所有人都没有进行特殊实验”,其概率为:kn mknCC课后习题:1. C;2. B;3. D;4. A;5. D;6. A;7. C;7. “任意两件事”,意味着这两件事有可能是有交集的。设其分别为A和B。则:A()ABP AB的意思是“只有 发生, 不发生的概率”课后习题:1. C;2. B;3. D;4. A;5. D;6. A;7. C;7. “任意两件事”,意味着这两件事有可能是有交集的。设其分别为A和B。则:A()ABP AB的意思是“只有 发生, 不发生的概率”课后习题:1. C;2. B;3. D;4. A;5. D;6. A;7. C;8. A;9. B;10. D;11. B;12. ABCD; 15. “任意两件事”,意味着这两件事有可能是有交集的。设其分别为A和B。则:课后习题: