《心理统计学重点分析.pdf》由会员分享,可在线阅读,更多相关《心理统计学重点分析.pdf(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 心理统计学重点分析 一描述统计一描述统计(一)统计图表 1)统计图 次数分布图:直方图:用以矩阵的面积矩阵的面积表示连续性连续性随即变量次数分布的图形。次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。累加次数分布图:分为:累加直方图累加直方图和累加曲线图累加曲线图;其中累加曲线的形状大约有三种:一种是曲线的上枝长于下枝(正偏态正偏态),另一种是下枝长于上枝(负偏态负偏态),第三种是上枝,下枝长度相当(正态分布正态分布)。其他统计图其他统计图:条形图:用于离散型数据资料;圆形图:用于间断性资料;线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系,或描述某种现象在时
2、间上的发展趋势,或一种现象随另一种现象变化的情况,用这种方法比较好。散点图:2)统计表 简单次数分布表 分组次数分布表 相对次数分布表:将次数分布表中各组的实际次数转化为相对次数,即用频数比率表示。累加次数分布表 双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布。(二)集中量数 1)算术平均数 M 1niiXXN 优点优点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;缺点缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数;计算和运用平均数的原则原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差。方差相结合原则;性
3、质:性质:在一组数据中每个变量与平均数之差的总和等于零 在一组数据中,每一个数都加上一个常数 C,所得的平均数为原来的平均数加常数 C 在一组数据中,每一个数都乘以一个常数 C,所得的平均数为原来的平均数乘以常数 C 2)中数:Md 按顺序排列在一起的一组数据中居于中间位置的数,即这组数据中,一般数据比它大,一般数据比它小。注意计算方法;3)众数:Mo 是指在次数分布中出现次数最多的那个数值;三者的关系三者的关系:正偏态分布中,MMdMo 1/13 负偏态分布中,MMdj格中的择优分数。当完全一致时 U=1.当完全不一致时,U=-1/K(K 为奇数)U=-1/(K-1)(K 为偶数)4)点二列
4、相关与二列相关(1)点二列相关 适用适用于一列数据为等距或等比数据,而且其总体分布为正态,另一列为离散型二分称名变量。多用于评价是非类测验题组成的测验的内部一致性等问题;pqpbtXXrpsq pX是与二分称名变量的一个值对应的连续变量的平均数,qX是与二分称名变量的另一个值对应的连续变量的平均数,p与q是二分称名变量两个值各自所占的比率,st是连续变量的 4/13 标准差(2)二列相关 适用于两列变量都是正态等距变量正态等距变量,但其中一列变量被人为地分成两类人为地分成两类。pqbtXXpqrsy 注:两者之间的区别:两者之间的区别:二分变量是否为正态分布,总的原则是,如果不是十分明确,观测
5、数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真正的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关;5)相关5)相关 适 用 于 两 个 变 量 都 是 只 有 两 个 点 值 或 只 表 示 某 些 质 的 属 性。adbcrabacbdcd 其中 a、b、c、d 分别为四格表中左上、右上、左下、右下的数据 具体见卡方检验卡方检验 二推断统计 二推断统计(一)推断统计的数学基础(略)(二)参数估计 1)点估计,区间估计,与标准误(1)一个良好估计量的标准:(1)无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均
6、值为 0;例如,用样本平均数作为总体平均数的估计值,就是无偏性;因为无限多个样本平均数X与的偏差之和为零;但方差S2不是2的无偏估计,2 2 的无偏估计是:无偏估计是:S S2 2n-1n-1=x2/(N-1)(2)有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异量小者有效性高,变异大者有效性底,即方差越小越好;例如的估计量有 Mo,Md,X但是,只有 X 是变异量最小。(3)一致性:即当样本无限增大,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐接近于真值;即当N,X,S S2 2n-1n-12 2;(4)充分性:指一个容量为 n 的样本统计量,是否充分地反映了全
7、部 n 个数据所反映的总体信息。例如 X 能反映所有数据所代表的总体的信息,故 X 的充分性高;二 Mo,Md 只反映了部分数据所反映的总体信息,充分性低;(2)区间估计:区间估计的原理是根据样本分布理论,应样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率;2)总体平均数的估计 3)标准差与方差的估计(可以先算出方差的区间,再求标准差的区间)(三)假设检验 1)假设检验的原理:(1)两类假设 5/13 备则假设 备则假设:因变量的变化、差异却是是由于自变量的作用 往往是我们对研究结果的预期,用用H H1 1表示表示。虚无假虚无假设:实际上什么也没有发生,我们所预计的改变、差异
8、、处理效果都不存在观察到的差异只是随机误差在起作用,用用H H0 0表示。表示。(2)小概率原理 小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的。两类错误 两类错误 型错误型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫错误错误。型错误型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫错误错误。两类检验的关系两类检验的关系+不一定等于 1 在其他条件不变的情况下,与不可能同时减小或增大(4)检验的方向性 单侧检验单侧检验:强调某一方向的检验,显著性的百分等级为 双侧检验双侧检验:只强调差异不强调方向性的检验,显著性百分等级为/2 2)样本与总体平均数差异的检验
9、3)两样本平均数差异的检验 4)方差齐性的检验:(1)样本方差与总体方差 当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从2分布:2220ns由自查由度df1n2表,依据显著性水平判断(2)两个样本方差之间 独 立 样 本22sFs大小其 中 当 两 样 本 自 由 度 相 差 不 大 时 可 用代 替查 表 时(nsn-1s11221,1dfndfn双侧检验双侧检验)相关样本 221222212412ssts srn其中 2dfn5)相关系数的显著性检验 积差相关 a.当=0 时:212rtrn其中2dfn b.当0 时:先通过查表将r和转化为费舍Zr和Z然后进行Z
10、检验。13rZZZn 6/13 (四)方差分析 1)方差分析的原理与基本过程 方差分析的基本假定(1)总体正态分布总体正态分布,也就是要求样本必须来自正态分布的总体;(2)变异的相互独立性变异的相互独立性,总变异可以分解成为几个来源不同的部分,这几个部分的来源必须明确,而且彼此要相互独立;(3)各实验处理内的方差要一致,各实验处理内的方差彼此应无显著差异,这是方差分析中最为重要最为重要的基本假定。方差分析中的方差齐性检验:Fmax=S2max/S2min (07 年考过大题)2)完全随机设计的方差分析 自由度计算:111TBWdfNdfkdfk nNk BWMSFMS式中查表示的分子与分母的自
11、由度就是dfB和dfwdfB和dfw的自由度;查F表时查单侧表 查F表时查单侧表 注意利用样本统计两进行方差分析的例子 3)随机区组设计的方差分析 组内差异组间差异个体差异随机误差总差异 总差异 自由度的计算:dfT=N-1;dfB=k-1 dfw=dfR+dfE drR=n-1;dfE=(k-1)(n-1);注意SSR的公式注意SSR的公式 4)事后检验 为什么不能用 t 检验?会使错误错误的概率明显增加。使用的方法 N-K 检验法;HSD 检验法;详见甘怡群P135 和张厚粲P290;5)二因素分析(1)基本概念:一个 2*3 的两因素实验设计,A 因素有两个水平,B 因素有三个水平;当忽
12、略 b 因素个水平的差异,只取 A 因素的 A1 水平和 A2 水平计算方差时,得到 A 因素的主效应;同理 B 因素的主效应;当一个因素的不同水平在另一个因素不同水平上的变化趋势不一致时,就产生了交互作用;(2)事后比较 对二因素方差分析进行事后比较,其中主效应的检验与单因素方差分析原理相同,但是交互 7/13 作用的事后比较,则包含事后整体检验和事后多重比较两种情况;第一,二因素方差分析主效应显著后,不一定要进行事后多重比较,进行事后多重比较的前提前提是有三个以上的水平是有三个以上的水平;第二,多因素交互效应显著后,对主效应必须进行事后比较;这里的多因素是指 3 个或三个以上的水平,由于不
13、能确定是哪几个水平建有显著差异,因此必须进行事后比较;另外,对主效应的进一步解释,需要通过多重比较分析;主效应的检验主效应的检验是在忽略其他因素的情况下检验一个因素的处理效应;第三,交互效应的事后比较,包括限定提条件的主效应的整体比较(单纯主效应比较,上面说到了),和达到显著性水平后,该限定条件的主效应的事后多重比较(了解)注:交互作用不显著,检验每个因素的主效应就很重要,但若交互作用显著,则对每个因素注:交互作用不显著,检验每个因素的主效应就很重要,但若交互作用显著,则对每个因素的主效应的检验,意义就不大了;的主效应的检验,意义就不大了;另外,主效应的事后比较与主效应的检验是两回事;主效应的
14、事后比较 另外,主效应的事后比较与主效应的检验是两回事;主效应的事后比较是指一个因素不同水平间(一般至少 3 个)确定到底哪几个间存在显著差异;主效应的检验,主效应的检验,就和单因素的检验原理相同;(五)回归分析 1)一元线性回归分析(1)最小二乘法:?YabX 其中:2XXYYbXX,aYb X(2)回归系数与相关系数的关系:r=yxxybb (3)线性回归的基本假设:线性关系假设:X,Y 在总体上具有线性关系;正态性假设:Y 服从正态分布;独立性假设:有两个意思:一个是某一个 X 对应的一组 Y值和与另一个 X 对应的一组 Y 值之间没有关系,彼此独立;另一个就是,误差项独立,不同的 X
15、所产生的误差之间应相互独立,且与自变量也应独立;误差等分散性假设:特定 X 水平的误差,除了呈随机化的常态分布,其变异量也应相等,称为误差等分散性;2)一元线性回归方程的检验 1)方差分析法REMSFMS 8/13 其中222TYSSYYYn而其1Tdfn?2222RXSSYYbXn其1Rdf ETSSSSSSR2Edfn其(2)回归系数检验bbtSE其中2YXbXsSESS 而?22XYYYsn,它的意义是一个统计量,表示以为中心值上下波动的标准差?YY(在知道相关系数时21XYYssr)3)测定系数TRRRSSYYYYr222 就是说相关系数的平房等于回归平方和在总平方和中所占的比例,如果
16、说2r=0.64,表明变异量 Y 的变异中有 64%是由变量 X 引起的,或者说有 64%可以由 X 的变异解释。所以2r叫做测定系数;4)一元线性回归方程的应用 回归分析的目的,就是在测定自变量 X 与因变量 Y 的关系为显著相关后,借助于你和的较优回归模型来预测在自变量 X 为一定值时因变量 Y 的发展变化。当我们根据给出的 X 值而预测得到点估计 Y 时,Y 只代表了预测值的中点,而计算在特定置信区间内的区间估计则依靠以下公式:22211PpXYiXXYtsnXX根号部分当 n 很大时近似为 1 其中 t 的自由度取 n-2,为对应该pYPX的方程解出的点估计 Y 值;一般计算时使用YX
17、pStY2,其中?22XYYYsn;(六)卡方检验 卡方检验的假设卡方检验的假设:(1)分类相互排斥,互不包容;(2)观测值相对独立;(3)期望次数的大小:每个单元格中期望次数至少在 5 以上,分类中不超过 20%的类别的理论次数可以小于 5。单元格人数过少时处理方单元格人数过少时处理方法:(1)单元格合并法 9/13 (2)增加样本数 (3)去除样本法 (4)使用校正公式 基本公式基本公式 22oeefff 其中of为观察次数;ef为理论期望次数 公式的适用范围要求观察彼此之间独立,并且单位格的理论期望次数不能小于 5单位格的理论期望次数不能小于 5(小于 5 时可与相邻的组合并)1)拟合度
18、检验 2匹配度检验是用样本数据来检验总体分布的形状或比率,以确定与假设的总体性质的匹配度。1dfC其中C为分类数 2)独立性检验 2独立性检验帮助我们考察多种因素的不同分类之间是否独立。它是检验行和列两个变量彼此有无关联的一种统计方法,适用于命名型变量和顺序型变量。1dfCR1其中C和R分别为行列分类数(七)非参数检验 1)独立样本均值差异的非参数检验 1)秩和检验法 两样本容量均小于 10 将容量较小的样本的各数据等级求和,T 值检验表中的临界值比较。两样本容量均大于 10 TTTZ 其中11112Tn nn而1212112Tn nnn(2)中数检验法 将两个样本数据混合从小到大排列 求混合
19、排列的中数 分别找出每个样本中大于和小于中数的数据的个数,列成四格表(中数本身不在内)对四格表卡方检验公式进行计算 2)相关样本均值差异的非参数检验(1)符号检验法 对子数小于 25(实得r值大于表中r的临界值时,说明差异无统计学意义实得r值大于表中r的临界值时,说明差异无统计学意义;)对于样本每对数据之差来记录符号,求出正负号分别的个数,用其中较小的个数作为观 10/13 测值 r 对照临界值表检验 对子数大于 25 rZ其中12n而2N(2)维尔克松检验法(符号等级检验法)实得T值大于表中T的临界值时,说明差异无实得T值大于表中T的临界值时,说明差异无统计学意义统计学意义 对子数小于 25
20、 时 a.把相关样本对应数据之差值按照绝对值从小到大排列 b.在各等级前加上原来差值的正负号 c.分别求出正号等级和负号等级的秩和,取其中较小的值作为 T d.由 n 值查表检验 T 对子数大于 25 时 TTTZ 其中14Tn n而12124Tn nn 11/13 18、【华东师大 04 年】填充:(1)常见的抽样方法有()抽样、()抽样、()抽样和()抽样。(2)当二项分布接近于正态分布时,在 n 次二项试验中成功事件出现次数的平均数为(),其标准差分别为()。(3)拒绝真实的零假设,就是()错误;保留不真实的零假设,就是()错误。(4)实验中的自变量称为();自变量的不同情况称为(),它
21、包括()或()两类情况;按各种条件进行的重复实验称为各种()。(5)质与量的相关包括()相关、()相关与()相关。(6)对一元线性回归方程的检验有三种等效的方法:()、()和()。(7)若智商与语文成绩的相关系数为 0.8,则智商的变动中有()是由语文成绩的变动造成的。19、【华东师大 04 年】现有 10 名男生进行射击训练,训练前后各进行一次测验,结果如下表所示。序号 训练后 训练前 1 95 76 2 70 74 3 90 80 4 66 52 5 80 63 6 78 62 7 89 82 8 84 85 9 70 64 10 73 72 试对上述数据进行相应的统计分析。20、【华东师
22、大 03 年】填充题:2、以_理论为依据,按照_的要求,有_来估计_,称为总体参数的区间估计。3、随即区组设计的方差分析将总平方和分解为_、_和 _,如果区组差异不显著,表明_或_。4、相关系数抽样分布的形态随着总体相关系数和样本容量 n 的大小而变化,当_时,样本 r 的抽样呈正态分布;当_时,r 的抽样分布接近于正态分布;当_或_时,r 的抽样分布呈偏态。21、【华东师大 03 年】为了了解某校三年纪 480 名学生的学习成绩,首先将他们的成绩分为上、中、下三层,各层人数分别为 120、300、60,各层的标准差估计为 10、12、13,假如要求从全年级中抽取 60 人,请用最优配置法计算
23、各层应抽取的人数(6)22、【华东师大 03 年】五位教师对甲乙丙三篇作文分别排定名次如下表:教师 序号 名次 甲 乙 丙 1 3 1 2 2 3 2 1 3 3 1 2 4 1 3 2 12/13 13/13 5 1 3 2 请对上述数据进行相应的统计分析。24、【华东师大 02 年】什么是相关样本?请列举相关样本显著性检验的各种情况。25、【华东师大 02 年】如果有一个相关系数 r=0.5,请将其转换为等距单位的 Zr 值。26、【华东师大 02 年】有 5 名女生,物理测验成绩分别是 68,69,70,71,72;另有 7 名男生,成绩分别是 40,50,60,70,80,90,100
24、。现需要知道男女生成绩是否方差齐性,请计算相应的检验统计量(不需要查表)。27、【华东师大 02 年】某小学根据各方面条件基本相同的原则将 32 名学生配成 16 对,然后把每对学生随机分入实验组和对照组,实验组的 16 名学生参加课外科研活动,对照组的 16名学生不参加此活动,一学期后,统一进行理解能力测验。结果发现,有 9 对学生的理解能力测验成绩明显拉开了距离,其中 8 对是实验组学生得到“及格”,对照组学生得到“不及格”;1 对是对照组学生得到“及格”,实验组学生得到“不及格”。问:参加课外科研活动对理解能力测验有无显著影响?28、【华东师大 00 年】什么是标准分数?使用标准分数有什
25、么好处?29、【华东师大 00 年】方差分析是逻辑是什么?30、【华东师大 00 年】如果有两个样本,一个是实验组,另一个对照组,分别施以两种教学方法,后期测验后如何对其成绩(百分制)进行统计检验,以确定两种教学方法有无显著差异?31、【华东师大 00 年】有一个双因素方差分析实验,A 因素为教材,共 3 种;B 因素为教法,共 4 种。交叉分析后得到 12 种处理,假定每个处理中有 2 名被试。经过教学后进行测验,得到一个方差分析表,请完成它。注:不必说明有无显著意义等。(答案按照 1-12 填写在答题纸上)差异来源 平方和 自由度 方差 F A 因素 187 (2)(6)(10)B 因素 343 (3)(7)(11)AB 3038 (4)(8)(12)组内 135 (5)(9)总差异 (1)32、【华东师大 00 年】研究人员对 10 个家庭的儿童的问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价,结果如下:家庭 1 2 3 4 5 6 7 8 9 10 儿童得分 72 40 52 87 39 95 12 64 49 46 母亲得分 79 62 53 89 81 90 10 82 78 70 求 X 与 Y 的相关系数。注:X 与 Y 的总体均不为正态分布。