心理与教育统计学第6章 概率分布.ppt

上传人:s****8 文档编号:66860641 上传时间:2022-12-21 格式:PPT 页数:143 大小:3.66MB
返回 下载 相关 举报
心理与教育统计学第6章 概率分布.ppt_第1页
第1页 / 共143页
心理与教育统计学第6章 概率分布.ppt_第2页
第2页 / 共143页
点击查看更多>>
资源描述

《心理与教育统计学第6章 概率分布.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章 概率分布.ppt(143页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、心理与教育统计学心理与教育统计学第第6章章 概率分布概率分布6.1 概率的基本概念概率的基本概念6.2 二项分布二项分布6.3 正态分布正态分布6.4 样本分布样本分布6.1 概率的基本概念概率的基本概念在个别试验中其结果呈现出不确定性,在在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛的现象,称为随机现象。例如掷硬币、抛骰子等骰子等概率论与数理统计是研究和揭示随机现象概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。统计规律性的一门数学学科。6.1.1 什么是概率什么是概率随机事件的随

2、机事件的频率频率 当当n无限增大时,随机事件无限增大时,随机事件A的频率会的频率会稳定在一个常数稳定在一个常数P,这个常数就是随机事,这个常数就是随机事件件A的的概率概率。(一)后验概率(或统计概率)(一)后验概率(或统计概率)(6.1)(6.2)观察随机事件观察随机事件A出现的次数的方式来出现的次数的方式来决定决定A的概率,称为后验概率。的概率,称为后验概率。(二)先验概率(古典概率)(二)先验概率(古典概率)古典概率模型要求满足两个条件:古典概率模型要求满足两个条件:试验的所有可能结果(或基本事件)试验的所有可能结果(或基本事件)是有限的;是有限的;每一种基本事件出现的可能性相等。每一种基

3、本事件出现的可能性相等。n为基本事件的总数;为基本事件的总数;m为事件为事件A包含的基本事件的数目。包含的基本事件的数目。(6.3)在事件在事件A发生之前,可以通过计算确发生之前,可以通过计算确定的概率,称为先验概率。定的概率,称为先验概率。Dewey.G统计了约统计了约438023个字母,得个字母,得到的英语中特定字母的频率到的英语中特定字母的频率字母字母频率频率字母字母频率频率字母字母频率频率E E0.12680.1268L L0.03940.0394P P0.01860.0186T T0.09780.0978D D0.03890.0389B B0.01560.0156A A0.07880

4、.0788U U0.0280.028V V0.01020.0102O O0.07760.0776C C0.02680.0268K K0.0060.006I I0.07070.0707F F0.02560.0256X X0.00160.0016N N0.07060.0706M M0.02440.0244J J0.0010.001S S0.06340.0634W W0.02140.0214Q Q0.00090.0009R R0.05940.0594Y Y0.02020.0202Z Z0.00060.0006H H0.05730.0573G G0.01870.0187历史上的投掷硬币试验历史上的投掷

5、硬币试验 实验者实验者投掷投掷次数次数正面向上正面向上的次数的次数频率频率德摩根德摩根20482048106110610.51810.5181蒲丰蒲丰40404040204820480.50690.5069K.K.皮尔逊皮尔逊1200012000601960190.50160.5016K.K.皮尔逊皮尔逊240002400012012120120.50050.5005 投掷硬币的概率是统计概率与古投掷硬币的概率是统计概率与古典概率?典概率?6.1.2 概率的基本性质概率的基本性质1任何随机事件任何随机事件的概率都是在的概率都是在0与与1之间的正数,即之间的正数,即:0 P(A)12不可能事件不

6、可能事件的概率等于零,即的概率等于零,即:P(A)=0 3必然事件必然事件的概率等于的概率等于1,即,即:P(A)=1(一)概率的公理系统(一)概率的公理系统(二)概率的加法定理(二)概率的加法定理 若事件发生,则事件就一定不若事件发生,则事件就一定不发生,这样的两个事件为发生,这样的两个事件为互不相容事互不相容事件件。两互不相容事件和的概率,等于这两互不相容事件和的概率,等于这两个事件概率之和,即两个事件概率之和,即(6.4a)(6.4b)(三)概率的乘法定理(三)概率的乘法定理 若事件发生不影响事件是否发生,若事件发生不影响事件是否发生,这样的两个事件为这样的两个事件为互相独立事件互相独立

7、事件。两个互相独立事件同时出现的概率,两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即等于这两个事件概率的乘积,即(6.5a)(6.5b)例:某一学生从个试题中任意抽取例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的一题,进行口试。如果抽到每一题的概率为概率为15,则抽到试题或试题,则抽到试题或试题的概率是多少?的概率是多少?如果前一个学生把抽如果前一个学生把抽过的试题还回后,后一个学生再抽,过的试题还回后,后一个学生再抽,则个学生都抽到试题则个学生都抽到试题1的概率是多少的概率是多少?该学生抽到试题该学生抽到试题1或者试题或者试题2为不相为不相容事件:容事件:四个学

8、生均抽到试题四个学生均抽到试题1为独立事件:为独立事件:例:一个口袋装有例:一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红球,从袋中取球两次。只红球,从袋中取球两次。考虑两次取球方式考虑两次取球方式(a)放回抽样,第一次)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一只球,观察其颜色后放回,搅匀后再取一球。(取一球。(b)不放回抽样,第一次取一球)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一不放回袋中,第二次从剩余的球中再取一球。球。请问这两种情况下取到一只白球和一只红请问这两种情况下取到一只白球和一只红球的概率。球的概率。放回取样放回取样第一次取到白球,

9、第二次取到红球:第一次取到白球,第二次取到红球:第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球:取到一只白球和一只红球的概率:取到一只白球和一只红球的概率:不放回取样不放回取样 第一次取到白球,第二次取到红球:第一次取到白球,第二次取到红球:第一次取到红球,第二次取到白球:第一次取到红球,第二次取到白球:取到一只白球和一只红球的概率:取到一只白球和一只红球的概率:问题:小明的班上有问题:小明的班上有83名同学,至少有名同学,至少有一位同学与小明的生日相同的概率?一位同学与小明的生日相同的概率?(一年按(一年按365天计算)天计算)82名同学与小明的生日均不相同的概率为:名同学与

10、小明的生日均不相同的概率为:至少一位同学与小明的生日相同的概率为:至少一位同学与小明的生日相同的概率为:n n202023233030404050506464100100p p0.4110.411 0.5070.507 0.7060.706 0.8910.8910.970.970.9970.9971 1问题:问题:83人的班上,至少两人生日相人的班上,至少两人生日相同的概率为多少?同的概率为多少?“与小明生日相同与小明生日相同的概率的概率”与与“班班级人数级人数”的关系的关系“至少两人生日相至少两人生日相同的概率同的概率”与与“班级人数班级人数”的关的关系系人数人数概概率率人数人数概概率率小明

11、的小组有小明的小组有6人,(人,(1)有人与小明出生)有人与小明出生月份相同的概率为多少?(月份相同的概率为多少?(2)至少)至少2人出人出生月份相同的概率为多少?生月份相同的概率为多少?信不信?可以试一试!信不信?可以试一试!(1)(2)6.1.3 概率分布类型概率分布类型概率分布是指对随机变量取不同值时的概概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。率的描述,一般用概率分布函数进行描述。概率分布概率分布是总体的分布,而是总体的分布,而频率分布频率分布是样是样本的分布。本的分布。概率概率给出的是单个结果发生的可能性,给出的是单个结果发生的可能性,概概率分布率分布

12、是对随机变量所有可能结果的可能是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形性分布描述,通常可以写成某个函数式形式。式。分分组组区区间间组组中中值值人数人数频频率率频频率密度率密度18018110.010.003317717830.040.013317417550.060.020017117230.040.013316816950.060.020016516670.080.0267162163150.180.0600159160180.220.0733156157140.170.056715315490.110.036715015130.040.0133学生身高次数分布表学

13、生身高次数分布表 次数次数 频率频率 频率密度频率密度 150 159 168 177 150 159 168 177 150 159 168 177151 160 169 178 151 160 169 178 151 160 169 178 学生身高次数分布图学生身高次数分布图 全国学生身高概率分布图全国学生身高概率分布图 151 160 169 178 151 160 169 178 概率概率 概率密度概率密度 概率分布中的曲线高度一般为概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值;面积表示概率,横坐标为样本值;有少数情况下,曲线高度表示概率(如有少数情况下

14、,曲线高度表示概率(如P179二项分布)。二项分布)。(一)离散分布与连续分布(一)离散分布与连续分布依随机变量的类型,可将概率分布分为离依随机变量的类型,可将概率分布分为离散分布与连续分布。散分布与连续分布。当随机变量只取孤立的数值时,这种随机当随机变量只取孤立的数值时,这种随机变量称为离散随机变量,离散随机变量的变量称为离散随机变量,离散随机变量的概率分布称为离散分布。概率分布称为离散分布。连续随机变量的概率分布称为连续分布。连续随机变量的概率分布称为连续分布。心理与教育统计学中最常用的离散型分布心理与教育统计学中最常用的离散型分布是是二项分布二项分布,最常用的连续型分布是,最常用的连续型

15、分布是正态正态分布分布。(二)经验分布与理论分布(二)经验分布与理论分布依分布函数的来源,可将概率分布分为经依分布函数的来源,可将概率分布分为经验分布与理论分布。验分布与理论分布。经验分布是指根据观察或实验所获得的数经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。布往往是总体的一个样本。理论分布有两个含义,一是随机变量概率理论分布有两个含义,一是随机变量概率分布的函数(如分布的函数(如正态分布正态分布),二是按某种),二是按某种数学模型计算出的总体的次数分布(如数学模型计算出的总体的次数分布(如二二项分布项分布

16、)。)。(三)基本随机变量分布与抽样分(三)基本随机变量分布与抽样分布布依所描述的数据的样本特性,可将概率分依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取基本随机变量分布是随机变量各种不同取值情况的概率分布,如二项分布与正态分值情况的概率分布,如二项分布与正态分布。布。抽样分布是从同一总体内抽取的不同抽样分布是从同一总体内抽取的不同样本样本的统计量的统计量的概率分布,如平均数分布,方的概率分布,如平均数分布,方差分布,相关系数分布等。差分布,相关系数分布等。谢谢!谢谢!复习复习l古典概率与统计概率古典

17、概率与统计概率加法原理:加法原理:乘法原理:乘法原理:l频率与概率频率与概率l频率分布与概率分布频率分布与概率分布6.2 二项分布二项分布二项分布是一种具有广泛用途的离散二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。里创立的,所以又叫贝努里分布。二项分布是心理与教育统计中常用的二项分布是心理与教育统计中常用的一种基本随机变量分布。一种基本随机变量分布。6.2.1 二项试验二项试验二项试验又称为贝努里试验,它必须满足二项试验又称为贝努里试验,它必须满足以下几个条件:以下几个条件:1.任何一次试验恰好有两个结果,成功与

18、失任何一次试验恰好有两个结果,成功与失败。败。2.共有共有n次试验,并且次试验,并且n是预先给定的任一正是预先给定的任一正数。数。3.每次试验各自独立,各次试验之间无相互每次试验各自独立,各次试验之间无相互影响。影响。4.某种结果出现的概率在任何一次试验中都某种结果出现的概率在任何一次试验中都是固定的。是固定的。是否为二项试验?是否为二项试验?(1)投掷硬币试验投掷硬币试验(2)一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只只红球,从袋中取球两次。红球,从袋中取球两次。(a)放回抽样,第一次取一只球,观察其)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。颜色

19、后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。中,第二次从剩余的球中再取一球。6.2.2 二项分布函数二项分布函数二项定理:二项定理:项数:二项展开式中共有项数:二项展开式中共有n1项。项。指数:指数:p的指数,从的指数,从n0下降;下降;q指数从指数从0n为上升。每项为上升。每项p与与q指数之和等于指数之和等于n。系数:系数:n个元素中依次取个元素中依次取0n个元素的组个元素的组合数。合数。11 11 2 11 3 3 11 4 6 4 11 5 1 0 10 5 11 6 15 20 15 6 1杨辉三角形杨

20、辉三角形 用用 n 次方的二项展开式来表达次方的二项展开式来表达在在 n 次二项试验中成功事件出现的次二项试验中成功事件出现的不同次数(不同次数(X0,1)的概率分)的概率分布,叫做二项分布函数。布,叫做二项分布函数。二项分布是一种离散型随机变量二项分布是一种离散型随机变量的概率分布。的概率分布。设有设有n次试验,各次试验彼此独立的,每次次试验,各次试验彼此独立的,每次试验某事件出现的概率都是试验某事件出现的概率都是p,某事件不出,某事件不出现的概率都是现的概率都是q(1-p),则对于某事件出),则对于某事件出现现X次(次(0,1,2,n)的概率分布为:)的概率分布为:式中:式中:(6.6)例

21、例 10个硬币投掷一次,或个硬币投掷一次,或1个硬币投掷个硬币投掷10次,问次,问5次正面向上的概率是多少?次正面向上的概率是多少?解:根据题意,解:根据题意,n=10,p=q=0.5,X=5例例 已知某长一批产品中一级品率为已知某长一批产品中一级品率为0.2现现在从中随机地抽查在从中随机地抽查20只。问只。问20只元件中恰只元件中恰好有好有6个一级品的概率是多少?个一级品的概率是多少?解:n=20,p=0.2,q=0.8.x=6某人进行射击练习,如果每次射击某人进行射击练习,如果每次射击击中的命中率为击中的命中率为0.02,独立射击,独立射击400次,试求至少击中两次的概率。次,试求至少击中

22、两次的概率。解:击中的次数为解:击中的次数为x,其对应概率为:,其对应概率为:一个口袋装有一个口袋装有6只球,其中只球,其中4只白球、只白球、2只红只红球,从袋中取球两次。球,从袋中取球两次。放回抽样,第一次取一只球,观察其颜色放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。后放回,搅匀后再取一球。求取到一只白球与一只红球的概率。求取到一只白球与一只红球的概率。解:实验次数解:实验次数n=2,取到白球的次数,取到白球的次数x=1,白,白球的概率球的概率p=4/6,红球的概率,红球的概率q=2/6.6.2.3 二项分布的性质二项分布的性质(一)(一)二项分布是离散型分布,概率直方图二

23、项分布是离散型分布,概率直方图是阶跃式。因为是阶跃式。因为X为不连续变量,用概率条图为不连续变量,用概率条图表示更为合适。表示更为合适。1个硬币投掷个硬币投掷5次,正面向上次,正面向上0,1,2,3,4,5次次的概率分别为:的概率分别为:5次10次20次40次80次160次当当p=q时,图形是对称的。时,图形是对称的。当当n趋近于无穷大时,二项分布趋近于趋近于无穷大时,二项分布趋近于正态分布。正态分布。p=q=0.5p=0.2,q=0.8l当当pq,二项分布为负偏态。二项分布为负偏态。l当当n很大,偏态逐渐降低,最终趋近于正态。很大,偏态逐渐降低,最终趋近于正态。l当当pq时,且时,且nq5.

24、这时二二项分布分布为正正态分布的近似形。分布的近似形。5次10次20次40次80次160次(二)二项分布的平均数和标准差(二)二项分布的平均数和标准差如果二项分布满足如果二项分布满足pq且且 nq5(或者(或者pq且且 np5时,二项分布接近于正态分时,二项分布接近于正态分布。可用下面的方法计算二项分布的平布。可用下面的方法计算二项分布的平均数和标准差。均数和标准差。二项分布的平均数为二项分布的平均数为二项分布的标准差为二项分布的标准差为(67)(68)求求p=0.2,q=0.8,n=160次的二项分布的平均值次的二项分布的平均值和标准差。和标准差。解:解:np=0.2160=325,该二二项

25、分布接近正分布接近正态分布。分布。6.2.4 二项分布的应用二项分布的应用二项分布函数除了用来求成功事件恰二项分布函数除了用来求成功事件恰好出现好出现X次的概率之外,在教育中主要次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性用来判断试验结果的机遇性与真实性的界限。的界限。例如,一个学生凭猜测做例如,一个学生凭猜测做10个是非题,平个是非题,平均可以猜对均可以猜对5题。什么情况下可以说他是题。什么情况下可以说他是真会而不是猜测呢?真会而不是猜测呢?做对题数做对题数概率概率累加概率累加概率0 00.0009770.0009770.0009770.0009771 10.0097660.0

26、097660.0107420.0107422 20.0439450.0439450.0546880.0546883 30.117190.117190.171880.171884 40.205080.205080.376950.376955 50.246090.246090.623050.623056 60.205080.205080.828130.828137 70.117190.117190.945310.945318 80.0439450.0439450.989260.989269 90.0097660.0097660.999020.9990210100.0009770.0009771 1

27、做对做对8道题的道题的累加概率达累加概率达到到0.989,8道题以上即道题以上即可认为是真可认为是真会做。会做。例如,一个学生凭猜测做例如,一个学生凭猜测做10个四选一的选个四选一的选择题,什么情况下可以说他是真会而不是择题,什么情况下可以说他是真会而不是猜测呢?猜测呢?做对题数做对题数概率概率累加概率累加概率0 00.0563140.0563140.0563140.0563141 10.187710.187710.244030.244032 20.281570.281570.525590.525593 30.250280.250280.775880.775884 40.1460.1460.9

28、21870.921875 50.0583990.0583990.980270.980276 60.0162220.0162220.996490.996497 70.003090.003090.999580.999588 80.0003860.0003860.999970.999979 92.86E-052.86E-051 110109.54E-079.54E-071 1做对做对5道题道题以上即可认以上即可认为是真会做。为是真会做。统计游戏统计游戏小时候经常看到有这样的游戏,在一块倾小时候经常看到有这样的游戏,在一块倾斜的板上有斜的板上有n排钉子,在钉子的下方有排钉子,在钉子的下方有n1个格子,

29、对应的奖励。自侧方弹出一个玻个格子,对应的奖励。自侧方弹出一个玻璃球,任其自由下落,在下落的过程中让璃球,任其自由下落,在下落的过程中让小球碰到钉子时,会改变下落方向。每碰小球碰到钉子时,会改变下落方向。每碰装一次时,玻璃球向两边下落的可能性相装一次时,玻璃球向两边下落的可能性相等。一块钱可以玩等。一块钱可以玩5次,中间对应的奖励很次,中间对应的奖励很小,两侧对应的奖励可能有小,两侧对应的奖励可能有5元、元、10元。元。Galton钉板概率模型钉板概率模型请问每个格子内的概率是多少?请问每个格子内的概率是多少?0.50.510.250.50.2510.5 0.50.25 0.5 0.250.1

30、25 0.375 0.375 0.1250.0625 0.25 0.375 0.25 0.0625实践作业:实践作业:每人投掷硬币每人投掷硬币10次,记录次,记录数字向上数字向上的次数。的次数。小组收集数据后发给班长,请班长在小组收集数据后发给班长,请班长在周六周六前发给我。前发给我。谢谢!谢谢!复习复习式中:式中:(6.6)二项分布函数:二项分布函数:p=q=0.580次 160次 20次 6.3 正态分布正态分布正态分布正态分布也称为常态分布,是连续型随机也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理

31、论与实际应用中占有最重要地位的一种理论分布。论分布。心理与教育中大量的现象均按正态形式分心理与教育中大量的现象均按正态形式分布,如智力高低、成绩好坏、社会态度等。布,如智力高低、成绩好坏、社会态度等。正态分布由正态分布由棣莫弗棣莫弗于于1733年发现的。拉年发现的。拉普拉斯、高斯对正态分布的研究也做出了普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为贡献,故有时称正态分布为高斯分布高斯分布。是是圆周率周率 3.14159e是自然是自然对数的底数的底 2.71828X为随机随机变量取量取值为理论平均数;为理论平均数;为理理论标准差;准差;y为概率密度,即正概率密度,即正态分布的分布的

32、纵坐坐标。(6.7)6.3.1 正态分布的特征正态分布的特征1.正态分布的形式是对称的,它的对称轴正态分布的形式是对称的,它的对称轴是经过平均数的垂线。是经过平均数的垂线。2.正态分布的中央点(即平均数)最高,正态分布的中央点(即平均数)最高,然后逐渐向两侧下降,曲线的形式是先然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向个标准差处,曲线两端向X轴无限接近。轴无限接近。3.正态曲线下的总的面积为正态曲线下的总的面积为1,经过平均数,经过平均数的垂线将正态曲线下的面积划分为相等的两的垂线将正态曲线下的面积划分为相等的两个

33、部分,各为个部分,各为0.5。曲线下的面积为概率,可由积分公式计曲线下的面积为概率,可由积分公式计算:算:(6.8)4.正态分布是一族分布。它随随机变量的平正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位的不同而有不同均数、标准差的大小与单位的不同而有不同的分布形态。的分布形态。标准正态分布的标准正态分布的=0,=1。标准正态分。标准正态分布通常写作布通常写作N(0,1)正态分布。)正态分布。(6.9)=2,=1=0,=1=-2,=1平均数决定了正态曲线在横轴上的位置平均数决定了正态曲线在横轴上的位置=0,=0.5=0,=1=0,=2 标准差大的正态曲线低阔,标准差小标准差大的正态

34、曲线低阔,标准差小的正态曲线高窄。的正态曲线高窄。5.正态分布中各差异量数值相互间有固定正态分布中各差异量数值相互间有固定的比率。的比率。P102,P163s=1.2533AD=1.4826Qs标准差;标准差;AD平均差;平均差;Q四分位差。四分位差。6.正态分布曲线下,标准差与概率(面积)正态分布曲线下,标准差与概率(面积)有一定的数量关系。有一定的数量关系。6.3.2 正态分布表的编制和使用正态分布表的编制和使用(一)正态分布表的编制与结构(一)正态分布表的编制与结构 利用积分公式可求出正态曲线下任何区利用积分公式可求出正态曲线下任何区间的面积,但需要计算。统计学家编制了间的面积,但需要计

35、算。统计学家编制了标准正态分布表,使其使用非常方便。标准正态分布表,使其使用非常方便。使用正态分布表时,首先应该确定其编使用正态分布表时,首先应该确定其编制方法:制方法:1)从)从Z=-开始。开始。2)Z=0开始。开始。本书中采用本书中采用Z=0开始开始。P概率概率Y概率密度概率密度Z分数分数正态分布表一般分为三栏:正态分布表一般分为三栏:1)Z分数分数(X-)/,一般罗列到,一般罗列到3.99。2)概率密度)概率密度(y)某一某一Z分数对应的曲线分数对应的曲线纵坐标高度。当纵坐标高度。当Z=0时,时,y=0.39893)概率值)概率值(P)不同不同Z分数点与平均数之分数点与平均数之间的曲线下

36、的面积。间的曲线下的面积。(二)正态分布表的使用(二)正态分布表的使用1.依据依据Z分数求概率(分数求概率(p)(1)求某)求某Z分数值与平均数(分数值与平均数(Z=0)之间的)之间的概率。概率。P概率概率Z分数分数(2)求某)求某Z分数以上或以下的概率分数以上或以下的概率Z分数分数(3)求两个)求两个Z分数之间的概率。分数之间的概率。Z1Z22.从概率(从概率(p)求)求Z分数分数(1)已知从平均数开始的概率值求)已知从平均数开始的概率值求Z值。值。P概率概率Z分数分数(2)已知正态分布两端的概率值求该概率)已知正态分布两端的概率值求该概率值分界点的值分界点的Z值。值。Z分数分数P概率概率(

37、3)若已知正态曲线下中央部分的概率,)若已知正态曲线下中央部分的概率,求求Z分数分数Z分数分数P概率概率3.已知概率或已知概率或Z值,求概率密度值,求概率密度y。Z分数分数P概率概率6.3.3 次数分布的检验方法次数分布的检验方法(一)皮尔逊偏态量数法(一)皮尔逊偏态量数法MoMdMM-MdM-Mos为标准差,为标准差,SK为偏态量数;为偏态量数;当当SK=0时,分布对称;时,分布对称;当当SK0时,为正偏态;时,为正偏态;当当SK0时,分布为正偏态;时,分布为正偏态;当当g1200时,偏度系数才可靠。时,偏度系数才可靠。(7.2)峰度系数用来反映呈单峰的数据表现出峰度系数用来反映呈单峰的数据

38、表现出来的峰态情况。来的峰态情况。峰度系数:峰度系数:(7.3)g20 低阔当观测数据当观测数据N1000时,峰度系数才可靠。时,峰度系数才可靠。(三)观察直方图(三)观察直方图 (四)累加次数曲线(四)累加次数曲线 比较数据的累加频率分布曲线与累加比较数据的累加频率分布曲线与累加正态分布概率曲线。正态分布概率曲线。6.3.4 正态分布理论在测验中的应用正态分布理论在测验中的应用(一)化等级评定为测量数据(一)化等级评定为测量数据 在心理与教育评价中,对有些心理在心理与教育评价中,对有些心理量,如爱好、意志强弱等常用等级评定量,如爱好、意志强弱等常用等级评定法赋予一定的评价分数或等级分数,不法

39、赋予一定的评价分数或等级分数,不同评价者的标准可能不同,等级分数界同评价者的标准可能不同,等级分数界线宽,不一定是等距尺度。线宽,不一定是等距尺度。应该将等级评定等距化。应该将等级评定等距化。被评定的心理量为正态分布,才能将等级被评定的心理量为正态分布,才能将等级评定转化为等距数据。评定转化为等距数据。E D C B A表表1为为3位教师对位教师对100名学生的学习能力所作等级名学生的学习能力所作等级评定的结果。表评定的结果。表2为为3名学生从名学生从3位老师那里获得位老师那里获得的评定等级,试将其转化为的评定等级,试将其转化为Z分数。分数。评定等级评定等级等级等级教师甲教师甲教师乙教师乙教师

40、丙教师丙A A5 510102020B B252520202525C C404040403535D D252520201515E E5 510105 5总数总数100100100100100100学生学生教师甲教师甲教师乙教师乙教师丙教师丙1 1B BA AA A2 2A AB BA A3 3D DC CC C表表1 教师对学生的评定结果教师对学生的评定结果表表2 教师对教师对3名学生的评定结果名学生的评定结果学生学生教师甲教师甲教师乙教师乙教师丙教师丙平均分平均分1 10.940.941.651.651.281.281.291.292 21.961.960.840.841.281.281.3

41、61.363 3-0.94-0.940 0-0.32-0.32-0.42-0.42(二)确定测验题目的难易度(二)确定测验题目的难易度 题目难易度一般用答对者的百分数确定题目难易度一般用答对者的百分数确定,但是百分数不是等距尺度,有时要比较不同难但是百分数不是等距尺度,有时要比较不同难易度题目之间的难度距离,需要将难易百分数易度题目之间的难度距离,需要将难易百分数根据正态分布概率转换为难度分数。根据正态分布概率转换为难度分数。题号题号通过率通过率未通过率未通过率Z Z分数分数Z+5Z+51 10.990.990.010.01-2.331-2.3312.6692.6693 30.950.950.

42、050.05-1.645-1.6453.3553.3555 50.850.850.150.15-1.035-1.0353.9653.965用未通过率计算用未通过率计算Z分数分数(三)划分等级分数线(三)划分等级分数线公司对新员工工作绩效进行考核。设全体公司对新员工工作绩效进行考核。设全体员工的绩效得分呈正态分布,平均得分员工的绩效得分呈正态分布,平均得分80分,标准差分,标准差12分。现根据考核结果分。现根据考核结果“奖优奖优罚劣罚劣”:对得分最高的:对得分最高的10%员工提升工资员工提升工资和职位,对得分最低的和职位,对得分最低的30%员工实行换岗员工实行换岗再培训。已知甲、乙两名员工的考核

43、得分再培训。已知甲、乙两名员工的考核得分分别是分别是90和和60分,问他们是否得到提升或分,问他们是否得到提升或换岗?换岗?查表Z2=-0.52,Z1=1.2890分的员工不能升职,分的员工不能升职,60分的员工会轮岗分的员工会轮岗由得:谢谢!谢谢!6.4 样本分布样本分布样本分布指样本统计量的分布,在科学研样本分布指样本统计量的分布,在科学研究中,一般是通过一个样本进行分析,只究中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依有知道了样本统计量的分布规律,才能依据样本对总体进行推论。据样本对总体进行推论。在谈及样本统计量的分布时,首先要保证在谈及样本统计量的分布时,首先

44、要保证各个样本是独立的,各个样本都服从同样各个样本是独立的,各个样本都服从同样的分布。的分布。样本的取样方法应该用随机抽样的方法。样本的取样方法应该用随机抽样的方法。研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可从两方面着手:(1)抽样分布:从总体到样本,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布;(2)统计推断:从样本到总体,这就是统计推断(statistical inference)问题。统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对

45、样本的抽样分布有所了解。我们知道,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同而有所不同,因而样本统计量也是随机变量,也有其概率分布。我们把统计量的概率分布称为抽样分布。由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。复置抽样:指每次抽出一个个体后,这个个体应返回原总体;不复置抽样:指每次抽出的个体不返回原总体。对于无限总体,返回与否都可保证各个体被抽到的机会相等。对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。导言一、抽样的目的一、抽样的目的 运用样本推断总体运用样本推断总体试验测

46、定所得 样本数据样本数据;试验目的 获得总体信息总体信息因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息总体信息总体总体 导言总体总体 二、样本平均数及其分布:二、样本平均数及其分布:许多许多 Si 形成形成样本样本标准差抽样分布。标准差抽样分布。许多许多 形成形成样本平均数抽样分布。样本平均数抽样分布。由样本平均数构成由样本平均数构成的总体称为的总体称为样本平均数的抽样总体。样本平均数的抽样总体。和一个标准差和一个标准差Si。每一个样本有一个样本平均数每一个样本有一个样本平均数样本平均数样本平均数 抽样分布抽样分布 样本平均数分布样本平均数分布1511641531571611

47、82178175172175151164153164161182157161172156平均值169163原始数据的分布原始数据的分布样本平均数分布图示样本平均数分布图示n=2n=3n=4n=5n=6随机抽样1000次1.总体分布为正态,方差已知,样本平均总体分布为正态,方差已知,样本平均数的分布为正态分布。数的分布为正态分布。平均数分布的平均数;平均数分布的标准差,一般称为标准误,可用SE表示。(7.4a)(7.4b)2.总体分布为非正态,方差已知,总体分布为非正态,方差已知,这时样这时样本足够大时本足够大时,样本平均数的分布为渐近正,样本平均数的分布为渐近正态分布。态分布。(7.5a)(7

48、.5b)6.4.2 样本标准差和方差分布样本标准差和方差分布151164153157161182178175172175151164153164161182157161172711.367.77标准差标准差分布图示标准差分布图示n=2n=3n=4n=5n=6随机抽样1000次的标准差 自正态分布的总体中抽取容量为自正态分布的总体中抽取容量为n的样本,的样本,当样本量足够大时当样本量足够大时(n30),样本方差及标,样本方差及标准差分布趋近于正态分布。准差分布趋近于正态分布。(7.6a)(7.6b)(7.6c)二、样本平均数及其分布:二、样本平均数及其分布:抽样分布总体与原总体有什么关系抽样分布

49、总体与原总体有什么关系?与与?与与?抽样分布总体与原总体关系如下抽样分布总体与原总体关系如下:1、样本平均数分布的平均数等于原总体、样本平均数分布的平均数等于原总体平平2、样本平均数分布的标准差等于原总体标、样本平均数分布的标准差等于原总体标即即(标准误)(标准误)准差准差除以除以均数,即均数,即标 准 误标 准 误(平均数抽样总体的标准差)的大小反映样本平均数 的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之,小,说明各样本平均数 间的差异程度小,样本平均数的精确性高。的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体

50、抽样,因为是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于:样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1 ,x2 ,xn,变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。样本标准误是样本平均数 ,的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 S,用以说明所考察性状或指标的优良性与稳定性。对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 ,用 以表示 所考察性状或

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁