《心理统计学重要知识点(1).docx》由会员分享,可在线阅读,更多相关《心理统计学重要知识点(1).docx(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、,I62等级差数法简化公式:”二一 N(N? 一)如果等级(即名次)变量中有相同的等级名次,需用下面校正 公式计算:等级差数法校正公式:Zx2 +“2YR(r =2g2)R),加2、*2计算方法参见教材125页3 .肯德尔W系数(肯德尔和谐系数):描述多个名次变量一 致性程度的统计量数。适用于描述和分析不同评价者(如主考、阅卷者)对同一组 个体(考生或答卷)评价结果(名次)的一致性程度,在心理测 量与教育评价中称为评分信度。例如,5位阅卷老师对10篇论文 评分排名的一致性。如果评价者给出的不是个体的水平名次,而 是分数(或等第、符号),可先将其转换成名次,然后再计算W系 数。校正公式:w=11
2、2v2(1X)2i N12公式中:n为每个名次变量中相同名次的数目。4 .点二歹!|相关(point-biserial correlation):用于描述一列续性变量和一列真正二分变量(或非正态二分变 量)之间的相关。真正二变量:指按某种性质或标准将个体划分为两种结果的 变量,如对、错,男、女等。Excel统计函数CORREL5 .二列相关(biserial correlation):用于描述由一个正态 连续变量人为划分成的二分变量与另外一个正态连续变量之间的 相关。或者说,用于描述一正态二分变量与一正态连续变量之间 的相关。人为二分变量?是指由连续变量转换而来的二分变量,例 如,将测验或考试
3、分数区分为及格和不及格,80分以上和80分以 下;按中考(或高考)成绩,将考生区分为录取、未录取。正态二分变量?如果二分变量是根据正态连续变量转换而 来,那么,可称之为正态二分变量。y为将正态分布面积画分为P、q两局部的纵线的高度。y的计算方法:利用Excel统计函数计算标准正态分布区间点函数NORMSINV(p值)一区间点Z值正态分布函数NORMDIST (区间点Z值,0, 1,0) - Z值的概率密 度y.相关(系数):”, .一姐+ b)(c + da + c)(b + d)用于描述两个真正二分变量的相关程度,也用于描述一个人 为二分变量和真正二分变量的相关。注意:相关计算公式是由皮尔逊
4、积差相关计算公式转换来 的。因此,如果两列二分变量转换为0、1 (或1、2)的数值变量时,可以用Excel统计函数 CORREL计算中系数。第六章概率分布.正态分布的特征(见教材)1 . Excel软件中正态分布函数和正态分布区间点函数的应用标准正态分布函数NORMSDIST的应用:(1) P(Z=?=1-NORMSDIST=(3) PVXV二?二NORMSDIST-NORMSDIST二正态分布函数NORMDIST的应用例如:某次测验的分数呈正态分布,平均分为75分,标 准差为10分,试计算:(1)低于80分的考生占多大比例,P(XV80分)二?(2) 80分以上的考生占多大比例,P(XN80
5、分)二?(3) 80分以上,低于90分的考生占多大比例,P(80X 90) = ?P(X80 分): JN0RMDIST, 75, 10, 1) ” 二P (XN80 分):NORMDIST, 75, 10, 1) ” =P(80X90) : JNORMDIST, 75, 10, 1)-NORMDIST, 75, 10, 1) ” 二标准正态分布区间点函数NORMSINV的应用根据给定的向上累积概率P(Za),标准正态分布的临界值 a二?a二NORMSINV(p 值)例如:P(Z=正态分布区间点函数NORMINV的应用根据正态变量X的平均数、标准差和向上累积概率P(Xa), 计算临界值a二?例
6、:某次大规模招聘考试分数呈正态分布,平均分为55 分,标准差为12分。现准备录取10%的考生进行面试,录取分数 线大致是多少?P(X?)二,即 P(XV?)二二,二NORMINV, 55, 12)二,最低分数线应为70分。3 .测验分数、测评等级的正态化:根据被试样本原始分或等级的简单次数分布表,计算各个不 同分数或等级的正态标准分数(1)计算每个不同分数X (或等级)以下累计次数Fb;(2)计算每个不同分数X (或等级)中点以下累积比率CP:X N(3)利用Excel统计函数NORMSINV,计算CP对应的正态Z 分数。(4)根据需要,将正态Z分数转为其他标准分数形式:T分数、CEEB分数、
7、托福考试分数、离差智商IQ等,7 = 10Z + 50 , CEEB = 100Z + 500 , TOEFL = 70Z + 500, /。= 15Z + 100.偏态系数(SK)和峰态系数(Kurt)的计算与应用偏态系数:Excel统计函数SKEW; 峰态系数:Excel统计 函数KURTo偏态系数SK=O,对称分布;SK0,正偏态分布;SKV0,负 偏态分布。峰态系数Kurt = 0,正态分布的峰态;Kurt0,次数分布的 峰度比正态分布峰度低阔;Kurt0,次数分布峰度比正态分布峰度高狭。偏态系数和峰态系数都等于0或接近0时,变量的分布为正 态分布。4 .二项分布的定义二项分布是二项试
8、验验结果的概率分布。进行n次二项试 验,各次试验彼此独立,每次试验时某事件出现的概率都是P,该 事件不出现的概率为q (=l-p),那么该事件出现x次的概率分布 为:P(X = x) = b(x9 n. p,) = c: pX qf二项分布的Excel统计函数:BINOMDIST5 .二项分布函数BINOMDIST的应用对20道四选一的单项选择题,如果完全凭猜想答题,那么(1)猜对5道题的概率是多少?(2)猜对5题以下概率是多少?(3)猜对6题以上的概率是多少?n =20,每题猜对的概率为p =(1)猜对 5 道题的概率 P(X=5) =BINOMDIST (5, 20, , 0)二(2)猜对
9、5题以下的概率P(XW5)二BINOMDIST (5,20, , 1)二(3)猜对6题以上的概率P(X26)=1-P(XW5)=1-BINOMDIST (5, 20, , 1)二.二项分布的形态:随n、p的变化具有不同的分布形态(1)当PF时,二项分布是对称分布。(2)当p=q, npN5时,接近正态分布。(3)当pWq, np/100 x 0.5 x 0.5 = 520道四选一的单项选择题,如果完全凭猜想答题,那么,猜对题数的平均数为u =np=20X 1/4=5猜对题数的理论标准差为7 = 120x1/4x3/4=1.94O第七章总体参数估计1 .常用的点估计:总体均数U的点估计:用样本平
10、均数又,Excel统计函数为 AVERAGE总体方差。2的点估计:用样本标准差S3,或 1。总体标准差。的点估计:用样本标准差sT,或s后。2 .总体平均数的区间估计.假设样本均数的抽样分布为正态分布,总体均数的置信区间为:一一SXZM5/2SE=X.96x=7 n 1总体均数的置信区间为:-SX Z0012S 二 X 2.58 X =J一 1.假设样本均数的抽样分布为df二nT的t分布,那么,总体均数的置信区间为:-_ -SX to.O5/2SE又=X ?005/2 X /7 n -1总体均数的置信区间为:X 土 0.0l/2Y = X /00|/2自由度 df=nT, %。5/2二? ,
11、。5/2二?,可用 Excel 统计函数 TINV 计算。也可查教材453页t值表.总体方差与标准差的区间估计总体方差,的置信区间为:nS2 2 旅2 -2 、Zo.O25Zo.975 ,或cr -总体方差,的置信区间为:nS2 2 反2 -2 、%0.005Zo.995 ,或(一 1)S;_( l)S3- 2b 30o.单个样本t检验主要用途:用于分析单个样本均数元与的总体均数U。的 差异,适用条件:(1)总体呈正态分布,总体方差。2未知,样本容 量5.两独立样本比率差异Z检验主要用途:根据两个独立样本的比率向一由,推断两总体比率 Pl P2有无显着差异适用条件:两个样本相互独立,一, n2
12、p2,n2a2都255 .两独立样本方差齐性检验主要用途:根据相互独立的两个样本的方差,推断两个总体 的方差是否相等或是否有显着差异。二大的一小的一 2s力(2-1)分子方差的自由度df=n-l,分母方差的自由度df二n2T双侧显着性概率P值:=FDIST (F值,分子自由度,分母自由 度)*2.相关样本t检验主要用途:(1)根据一组被试前、后两次测评结果,推断两次测验结果 的总体均数有无显着差异。(2)根据实验组和配对对照组测评结果,推断实验组和对照 组的总体均数有无显着差异。适用条件:两个样本的数据有一一对应关系,且有可比性; 两总体数据呈正态分布。6 .独立样本Z检验主要用途:根据两个独
13、立样本的均数差异用-冗,推断两总体 均数小%有无显着差异。适用条件:(1)两总体为正态分布,总体方差短、食, 不管样本大小(2)两总体非正态分布,总体方差苏、勇,T30, 230(3)两总体非正态分布,总体方差短、犬未知,-N30,%230 时总体短、总体短、说时:总体短、员未知时:7 .独立样本等方差假设t检验主要用途:根据两个独立样本的均数差异用-无,推断两总体 均数外出有无显着差异?适用条件:(1)两总体为正态分布,总体肾、食未知,且 武二区,不管样本大小(2)两总体非正态分布,总体淄、矍未知,且淄二。,4 30, % 2 30 时两总体方差、犬是否相等,需要先做方差齐性检验。注意:大多
14、数情况下,两总体方差基本相等。8 .独立样本异方差假设t检验主要用途:根据两个独立样本的均数差异区-元,推断两总体 均数小也有无显着差异?适用条件:(1)两总体为正态分布,总体淄、吠未知,且 端三房,不管样本大小(2)两总体非正态分布,总体土、其未知,且一H4 2 30, 4 2 30 时且+ 1当=% = 时,df = n-.当尸时,(邑 /1 + $2 /21一 1 n2 -1.积差相关显着性t检验主要用途:根据一对变量的样本数据及其积差相关系数r,推 断两变量有无显着关系。适用条件:两变量为连续性数值变量,且总上正态分布。第十四章抽样原理及方法(参见教材)复式条形图:用于描述和比拟两个或
15、多个样组的类别(或等级) 数据的次数分布。形图(circle graph) 饼图(pie graph):用于直观描述类别数据或等级数据的分布情况。线形图(line graph):用于直观描述不同时期的开展成就 的变化趋势;第三章集中量数 集中趋势和离中趋势是数据分布的两个基本特征。 集中趋势:就是数据分布中大量数据向某个数据点集中的趋 势。 集中量数:描述数据分布集中趋势的统计量数。 离中趋势:是指数据分布中数据分散的程度。 差异量数:描述数据分布离中趋势(离散程度)的统计量数 常用的集中量数有:算术平均数、众数(Mo) 中位数 (MD.算术平均数(简称平均数,M、灭、F): Excel 统计
16、函数 AVERAGE算术平均数的重要特性:(1) 一组数据的离均差(离差)总和为0,即23一元)=。(2)如果变量X的平均数为幻 将变量X按照公式 =法转 换为Y变量后,那么,变量Y的平均数门“+位1 .中位数(median, Md):在一组有序排列的数据中,处于 中间位置的数值。中位数上下的数据出现次数各占50%。2 .众数(mode, Mo): 一组数据中出现次数最多的数据。3 .算术平均数、中数、众数之间的关系。4 .加权平均数:M叼+. + 与吗=匕,叫小 + W2 HF Wn Zwj6.调和平均数(harmonic mean, MH): 一组数值倒数的平均数的 倒数。111、r 1十
17、十+) E- 再/ 居/ 王Excel统计函数HARMEAN(1)用于描述同一个体(或一组个体)不同时间段的平均学习 速度、平均工作效率。(2)用于描述不同能力水平个体的平均学习速度、平均工作效率。7.几何平均数(geometric mean, Mg)是指n个观察值连乘 积的n次方根.(1) 一组数据中少局部偏大(或偏小),数据分布呈偏态时, 几何平均数比算术平均数更能反映数据的集中趋势。Mg =依5 XX”Excel统计函数GEOMEAN(2)用于计算平均学习进步速度、平均开展速度(平均开展 倍数),即环比的几何平均数。(再、吃、,为各个时间段的成果数据)平均增长率:此7第四章第四章差异量数
18、差异量数:描述一组数据离散程度(离中趋势)的统计量 数。差异量数较大,说明数据分布得比拟分散,数据之间的差异 较大;差异量数较小,说明数据分布的比拟集中,数据间的差异 较小。差异量数还能反映平均数对一组数据的代表性。差异量数越 小,平均数的代表性越好;差异量数越大,平均数的代表性越 差。常用的差异量数是标准差、标准差S: V 定样本总体的标准偏差)标准差SiI本的标准偏差)d = Z(X.-2 方差心 一%一定样本总体的方差),/ /一打方差%I: T W-1 本的方差)方差、差异系数Excel统计函数STDEVP (给方差、差异系数Excel统计函数STDEVP (给Excel统计函数STD
19、EV (给定样Excel统计函数VARP (给Excel统计函数VAR (给定样cv -差异系数(又称变异系数、离散系数、相对标准差):一斤(1)用于比拟不同观测工具测量结果(数据单位不同)的离 散程度,例如,身高离散程度大,还是体重离散程度大?(2)用于比拟用同一观测工具测得的、均数差异较大的不同 样本数据的离散程度。例如:7岁组儿童和13组岁儿童的体重离 散程度,哪个较大?标准差的重要特性:如果变量X的标准差为枭,将变量X按 照公式片版转换为Y变量后,那么,变量Y的标准差Sy=bSx相对位置量数:反映个体(数据)在团体中相对位置的统计量 数。主要有标准分数及其线性转换分数(Z分数、T分数)
20、、百分 等级(PR)、正态化标准分数等。1 .标准分数的计算与应用:或: 丁,r = 10Z + 50 , CEEB = 100Z + 500Z分数的特点:Z分数的平均数为0,即z=。,标准差为1,即=1T分数的平均数=50,标准差为% =1。CEEB分数的平均数=?,标准差二?(1)可用于比拟个体各方面水平高低(横向比拟,个体内差 异评价)。(2)对被试多方面的测量结果进行综合,如对高考各科成绩 的综合,各分测验分数的综合。(3)可用于对个体或样组某方面水平进行前后比拟(纵向比 较),判断其水平是提高了,退步了,还是没有变化。2 .原始分数X的百分等级的含义与计算根据简单次数分布表计算:%二
21、竺八x N根据分组次数分布表计算:PRy =!X100x N第五章相关关系相关关系的描述方法(1)相关散点图:适用于直观描述两个连续性数值变量(等 距数据、比率数据)之间的关系。可用Excel图表向导中的“XY 散点图”绘制。(2)双向次数分布表(交叉表、列联表):适用于描述两个 等级变量(或称名变量、类别变量)之间的关系。可用Excel数据 透视表编制列联表)。(3)相关系数(相关关系的特征值)。 相关系数:描述两个变量相关关系的统计量数,在之间取 值,绝对值越大,越接近1,说明两个变量之间的关系程度越密 切;绝对值越小,越接近3说明两个变量的关系程度越低。 常用的相关系数:1.积差相关:井=Z(x,-5)(一刃 ns%Excel统计函数CORREL适用条件:(1)X、Y两个变量都是连续性变量(等距数据或 比率数据);(2) X、Y两个变量总体上为正态分布或接近正态分布。2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相 关。对数据变量的分布形态没有要求。(1)等级积差相关法(名次积差相关法)。(Rx-Rx)(Ry-Ry)RnSr srKx kyExcel统计函数CORREL公式中的Rx和Ry是分别代表两变量中每个数据在变量中的名 次。(2)等级差数法(名次差数法)。如果每个等级(即名次)变量中没有相同的等级名次,可用下 面公式计算: