《2022年心理学考研之心理统计学笔记.docx》由会员分享,可在线阅读,更多相关《2022年心理学考研之心理统计学笔记.docx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022年心理学考研之心理统计学笔记 心理统计学笔记 (1)基本概念 总体:具有某些共同的、可观测特征的一类事物的全体,构成总体的每个基本单元称为个 体 样本:由于不能或没必要对整个总体进行探讨,我们只能从总体中选择出一些个体代表总 体,这些个体的集合叫样本 变量:本身是改变的或者对于不同个体有不同值得特征或条件 常量:本身不变且对不同的个体的值也相同 参数:描述总体的数值,它可以从一次测量中获得,也可以从总体的一系列测量中推论得 到 比例:全组中取值为 X 的比例, p=f/N 插值法:一种求两个已知数值之间中间值的方法,其假设所求解点旁边数据呈线性改变 统计量:描述样本的数值,与参数的获得
2、方式相同 随机取样:从总体抽取样本的一种策略,要求总体中的每一个个体被抽到的机会均等 取样误差:样本统计量与相应的总体参数之间的差距 偏态分布:分数积累在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应 次数分布:一批数据在某一量度的每一个类目所出现的次数状况 离散型变量:由分别的、不行分割的范畴组成,接近范畴之间没有值存在 连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成 部分 (2)学习建议 将留意放在概念上,心理统计应当是一门概念性的科学,而非纯数学。 肯定要将统计方法与心理学探讨的情景结合起来学习。 弄懂一个概念再起先学习下一个,心理统计中的概念应
3、用性较差却是之后做题的基础。 做题根据举荐格式能避开出错几率。 (3)统计检验总表 数据类 单样本 独立样 相关样 多组样本的比较 相关问 型 问题 本比较 本比较 独立样 重复测 题 本 量 等 总体 Pearson 单样本 独立样 相关样 独立样 重复测 距 正态 t/z 本 t/z 本 t 本方差 量方差 积差相关 型 分布 检验 检验 检验 分析 分析 分布 大样本 大样本 大样本 转化为依次型 转化为顺 形态 下的相 下的相 下的相 序型 未知 应的 t/z 应的 t/z 应的 t 检 检验 检验 验 曼- 惠特 克- 瓦氏 Spearman 依次型 符号检 维尔克 弗里德 验法 尼
4、 松 单向 曼双向 等级相关 U 检验 T 检验 方差分 等级方 析 差分析 命名型 χ 2 匹配 2 χ 独立 符号检 χ 2 独立性检验 χ 2 独立 度检验 性检验 验法 性检验 一、描述统计 描述统计是指用来整理、概括、简化数据的统计方法,侧重于描述一组数据的全貌,表达 一件事物的性质。 (一)统计图表 统计表和统计图简洁明确、生动直观地表达数量关系,具有一目了然、整齐美观、简单理 解等特点。它们是对数据进行初步整理,以简化的形式加以表现的两种最简洁的方式。 在 制定统计图表之前,一般首先要对数据进行以下两种初步整理: 数据排序:根据某种标准,对收集到的
5、杂乱无章的数据根据肯定依次标准进行排列 统计分组:依据被探讨对象的特征,将所得到数据划分到各个组别中去 1 统计图 统计图:用点、线、面的位置、升降或大小来表达统计资料数量关系的一种陈设形式 组成:坐标轴、图号、图题、图目、图尺、图形、图例、图注 分类:条形图、圆图、线性图、直方图、散点图、茎叶图 2 统计表 统计表:将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表 现形式 组成:隔开线、表号、名称、标目、数字、表注 分类:简洁表、分组表、复合表 (二)集中量数 集中量数又叫集中趋势,是体现一组数据一般水平的统计量。它能反映频数分布中大量数 据向某一点集中的状况。 1 算
6、数平均数 (1)定义 算数平均数:即全部视察值的总和与总频数之商, 简称为平均数或均数 平均数一般与标准差、方差相结合运用。 (2)特点 在一组数据中每个变量与平均数之差的总和等于零 在一组数据中,每一个数都加上一个常数 C,所得的平均数为原来的平均数加常数 C 在一组数据中,每一个数都乘以一个常数 C,所得的平均数为原来的平均数乘以常数 C (3)意义 算数平均数是应用最普遍的一种集中量数,它在大多状况下是 真值 最好的估计值。 (4)优缺点 优点:反应灵敏、计算严密、计算简洁、简明易解、适合于进一步用代数方法盐酸、较少 受抽样变动的影响 缺点:易受极端数据的影响、不能在出现模糊数据时计算
7、2 中数 (1)定义 中数:按依次排列在一起的一组数据中居于中间位置的数,在这组数据中,有一半数据比 它大,一般数据比它小, 等价于一百零一分位数是 50 的那个数。 (2)算法 数列总个数为奇数时,第 (n+1)/2 个数就是中数 数列总个数为偶数时,可取位于中间的两个数的平均数作为中数 分布中有相等的数时,将重复的数字看成一个连续体,利用中间分数的精确上下限运用 插值法 (3)优缺点 优点:计算简洁、简单理解、不受极端值影响、能在有模糊数据状况下运用、可在依次型 数据时运用 缺点:代表性低、不够灵敏、稳定性低、须要排序、不能进一步做代数运算 3 众数 (1)定义 众数:在次数分布中出现次数
8、最多的那个数的数值 众数可能不只一个。在正偏态分布时,平均数最靠近尾端,中数位于其与众数之间。 (2)优缺点 优点:能在数据不同质的状况运用,能避开极端值干扰 缺点:不稳定、代表性差、不够灵敏、不能做进一步的代数运算 (三)差异量数 差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离 散量数。 1 离差与平均差 离差:分布中的某点到均值得距离,其符号表示了某分属于均值之间的位置关系而数值表 示了它们之间的肯定距离 离差之和始终为零。 平均差:次数分布中全部原始数据与平均数肯定离差的平均值 2 方差与标准差 和方:每一个离差值平房求和 由于离差正负值相互抵消无法代表离
9、中趋势我们引入和方的概念 (1)总体的方差和标准差 方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数 2 作为样本统计量用符号 s 2 表示,作为总体参数用符号 σ 表示,也叫均方。 标准差:方差的平方根 作为样本统计量用符号 s 表示,作为总体参数用符号 σ 表示。 (2)样本的方差和标准差 样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算 样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计 : (3)性质 每一个观测值都加一个相同的常数 C 之后,计算得到的标准差等于原来的标准差 每一个观测
10、值都乘以一个相同的常数 C,所得到的标准差等于原标准差乘以这个常数 (4)意义 方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最 常用的差异量数, 它们的优点有: 反应灵敏、计算严谨、计算简单、适合代数运算、受抽样变动影响小、意义简洁明白 3 变异系数 当遇到下列状况时,不能用肯定差异量来比较不同样本的离散程度,而应当运用相对差异 量数,最常用的就是差异系数。 两个或两个以上样本所运用的观测工具不同,所测的特质相同 两个或两个以上样本运用的是同种观测工具,所测的特质相同,但样本间水平差异较大 差异系数:一种最常用的相对差异量,为标准差对平均数的一百零一分比 (四)
11、相对量数 1 一百零一分位数 一百零一分位数:在整个分布中,在某一值之下或等于该值的分数的一百零一分比,所对应的分数 一百零一分位数和一百零一分等级是同一操作定义的两端。当我们求累计次数占总体的一百零一分 比是,所对应的分数和一百零一分比的值分 别为一百零一分位数和一百零一分等级。 2 一百零一分等级 一百零一分等级:常模团体中低于该分数的人所占总体的一百零一分比 一百零一分等级肯定要对应分数区间的精确上限。一百零一分等级和一百零一分位数都可以由已知 数据用差值法求解。 3 标准分数 (1)定义 标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫 Z 分数 离平均数有
12、多远,即表示原始分数在平均数以上或以下几个标准差的位置。 (2)性质 Z 分数 无实际单位,是以平均数为参照点,以标准差为单位的一个相对量 一组原始分数转换得到的 Z 分数 可正可负,全部原始分数的 Z 分数 之和为零 原始数据的 Z 分数 的标准差为 1 若原始分数呈正态分布,则转换得到的全部 Z 分数均值为 0,标准差为 1 的标准正态分 布 (3)优点 可比性 不同性质的成果,一经转换为标准分数,就可在同一背景下比较 可加性 不同性质的原始数据具有相同的参照点,因此可相加 明确性 知道了标准分数,利用分布寒暑表就能知道其一百零一分等级 稳定性 转换成标准分数之后,规定了标准差为 1,保证
13、了不同性质分数在总分数中 权重一样 (4)应用 比较几个分属性质不同的观测值在各自数据分布中相对位置的凹凸 计算不同质的观测值得总合或平均值,以表示在团体中的相对位置 若标准分数中有小数、负数等不易被人接受的问题, 可通过 Z=aZ+b 的线性公式将其转 化成新的分数(如韦氏成人智力气表) (五)相关量数 由于试验法适用范围的限制,有的时候我们只能对变量间进行相关探讨,也就是看两者是 否有相互跟随的改变关系。相关探讨所得到的是一种描述统计,我们仅仅能用其描述两个 变量相互跟随的程度大小, 至于他们之间是否有因果关系或者是共变关系则不行妄下定论。 相关系数:两列变量间相关程度的数字表现形式 作为
14、样本的统计量用 r 表示,作为总体参数一般用 ρ 表示。 正相关: 两列变量变动方向相同 负相关: 两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向 相反的变动 零相关: 两列变量之间没有关系,各自根据自己的规律或无规律改变 1 积差相关 也就是 Pearson 相关。 (1)前提 数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它 对子相互独立 两列变量各自总体的分布都是正态的,至少接近正态 两个相关的变量是连续变量,也即两列数据都是测量数据 两列变量之间的关系应是直线性的 (2)公式 r 也就等于 X 和 Y 共同改变的程度除以 X 和 Y 各
15、自改变的程度。 2 等级相关 也就是 Spearman 相关 (1)适用范围 当探讨考察的变量为依次型数据时,若原始数据为等比货等距,则先转化为依次型数据 当探讨考察的变量为非线性数据时 (2)公式 将原始数据转化为依次型数据,仍旧用 Pearson 相关公式计算即可。 3 肯德尔等级相关 (1)肯德尔 W 系数 也叫肯德尔和谐系数,原始数据资料的获得一般采纳等级评定法,即让 K 个被试对 N 件实 物进行等级评定。 其原理是评价者评价的一样性除以最大变异可能性。 R i 代表评价对象获得的 K 个等级之和 N 代表等级评定的对象的树木 K 代表等级评定者的数目 (2)肯德尔 U 系数# 其与
16、肯德尔 W系数所处理的问题相同,但评价者采纳对偶比较法,即将 N 件事物两两配对 分别进行比较 r ij 为对偶比较记录表中 i>j 格中的择优分数 4 点二列相关与二列相关 (1)点二列相关 适用于一列数据为等距正态变量,另一列为离散型二分变量。 X 是与二分称名变量的一个值对应的连续变量的平均数 p X 是与二分称名变量的另一个值对应的连续变量的平均数 q p 与 q 是二分称名变量两个值各自所占的比率 s t 是连续变量的标准差 (2)二列相关 适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。 y 为标准正态曲线中 p 值对应的高度,查正态分布表能得到 5 相关 适
17、用于两个变量都是只有两个点值或只表示某些质的属性。 其中 a、b、c、d 分别为四格表中左上、右上、左下、右下的数据 二、推断统计 推论统计就是指运用一系列的数学方法,将从样本数据中获得的结果推广到样本所在的总 体。进行推论统计的关键在于所抽取的样本要能够尽量接近所要探讨的总体。 (一)推断统计的数学基础 1 概率 概率:表明随即时间出现可能性大小的客观指标 概率的定义包含以下两种,当观测次数够多时他们是相等的。 后验概率 :对随机事务进行 n 次视察,某一事务 A 出现的次数 m 与观测次数 n 的比 值在 n 趋近无穷时所稳定在的常数 p 先验概率 :在满意试验可能结果数有限且每一种结果出
18、现的可能性相等的条件下, 随机事务包含的结果数除以结果总数 2 正态分布 当样本量足够大时,我们会发觉生活中很多变量的分布都近似于正态曲线 ,因此有上帝 偏爱正态分布一说。 (1)特点 正态曲线的形态就像一口挂钟,呈对称分布,其均值、中数、众数事实上对应于同一个 数值 大部分的原始分数都集中分布在均值旁边,极端值相对而言比较少 曲线两端向靠近横轴处不断延长,但始终不会与横轴向交 正态分布曲线转化为 z 分数后人以 z 分数与零点对应曲线下面积固定 (2)用法 依据 Z 分数求概率,即已知标准分数求面积 从概率求 Z 分数,即从面积求标准分数值 已知概率或 Z 值,求概率密度,即正态曲线的高 3
19、 二项分布 二项分布:对于一个事务有两种可能 A 和 B,但我们对这一事务视察 n 次,事务 A 发生的 总次数的概率分布就是二项分布 二项分布的均值为 pn 方差公式为 2 npq 标准差的公式为 npq 4 抽样原理与抽样方法 (1)抽样原理 抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体 是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大 的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样 本中得以发觉,从而保证由样本推论总体。 (2)抽样方法 简洁随机取样法 系统随机取样法 分层随机取样法 多段随机
20、取样法 5 抽样分布 样本分布:样本统计量的分布,是统计推论的重要依据 (1)正态分布及渐近正态分布 样本统计量为正态分布或者接近正态分布的状况都可依据正态分布的概率进行统计推论。 总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布 样本平均数分布的平均数和方差与母体的平均数和方差有如下关系: 样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下 关系: (2)t 分布 t 分布是一种与方差无关而与自由度有关的分布, 很类似正态分布, 我们可以将正态分布看 作 t 分布当自由度为正无穷时的特例。 总体分布为正态,方差未知时,样本平均数的分布为 t 分布:
21、 X s n 1 n 其中 s 1 n SS n 1 2 (3)χ 分布 2 分布的构造是从一个听从正态分布的总体中每次抽去 n 个随机变量, 计算其平方和之后 χ 标准化的一个分布。 分布曲线下的面积都是 1,但伴随着 n 取值的不同,自由度变更,曲 线分布形态不同, 而当自由度趋近于正无穷时 χ 2 分布即为正态分布, 因此其于 t 分布一样 都是一族分布,而正态分布都是其中的特例。 (4)F 分布 2 假如有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出 χ ,则: 更多状况下,我们所计算的 F 两样本取自相同总体,此时可将上式化简为: (二)
22、参数估计 当在探讨中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计, 也就是如 何从局部结果推论总体的状况,称为总体参数估计。 总体参数估计问题可以分为点估计与 区间估计。 1 点估计、区间估计与标准误 良好估计量的标准 无偏性 用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零 有效性 当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变 异大者有效性低,即方差越小越好 一样性 当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数 充分性 样本的统计量是否充分地反映了全部 n 个数据所反映总体的信息 点估计:用样本统计量来估计总体参数,因为样本统计
23、量为数轴上某一点值,估计结果也 以一个点的数值表示 区间估计:依据估计量以肯定牢靠程度推断总体参数所在的区间范围, 这个区间就叫做 置信区间 ,相应的概率成为 置信度, 这两个量是共通改变的, 置信区间越大,置信度越高; 区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的 概率。 标准误:样本平均数分布的标准差 总体方差未知时用估算的总体方差计算标准误。 2 总体平均数的估计 当总体方差未知时,则运用 t 分布对应置信度 3 标准差与方差的区间估计 (1)标准差的区间估计 (2)方差的区间估计 (三)假设检验 可以说,每一个试验的存在,仅仅是为了给事实一个反对虚无假设的机会。
24、 1 假设检验的原理 假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,推断 总体参数之间是否存在差异 假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结 果在肯定概率上正确的,而不是全部。 (1)两类假设 对于任何一种探讨而言,其结果无外乎有两种可能 , 即是否符合我们预期。 一般来说证伪一 件事情比证明一件事简单,在行为科学的探讨中,由于我们无法了解总体中除样本以外的 个体状况,因此尝试拒绝虚无假设的方法优于证明备择假设。 备则假设:因变量的改变、差异却是是由于自变量的作用 往往是我们对探讨结果的预期,用 H1 表示。 虚无假设:事实上什么也没有发
25、生,我们所预料的变更、差异、处理效果都不存在 视察到的差异只是随机误差在起作用,用 H 0 表示。 (2)小概率原理 小概率原理:小概率事务在一次试验中几乎是不行能发生的 至于什么就算小概率事务,那就是我们在计算前明确的决策标准,也就是显著性水平 α。 在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误 差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率 原理来拒绝虚无假设。 (3)两类错误 (本部分内容请参照实心信号检测论比照来看。 MJ 注) 型错误:当虚无假设正确时,我们拒绝了它所犯的错误, 也叫 α 错误
26、探讨者得出了处理有效果的结论,而事实上并没有效果,即所谓无中生有 型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误, 也叫 β 错误 假设检验未能侦查到实际存在的处理效应,即所谓失之交臂 两类检验的关系 α+β 不肯定等于 1 在其他条件不变的状况下, α 与 β 不行能同时减小或增大 (4)检验的方向性 单侧检验:强调某一方向的检验,显著性的一百零一分等级为 α 双侧检验:只强调差异不强调方向性的检验,显著性一百零一分等级为 α/2 对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此假
27、如 差异发生在该方向,单侧检验犯 β 错误的概率较小,我们也说它的检验效力更高。 (5)假设检验的步骤 依据问题要求,提出虚无假设和备择假设 选择适当的检验统计量 确定检验的方向性并规定显著性水平 计算检验统计量的值 将统计量的值与临界值对比做出决策 2 样本与总体平均数差异的检验 (1)总体正态分布且方差已知 X 0 z 其中 obs X 0 X n 0 和 0 分别为总体的平均数和方差 (2)总体正态分布而方差未知 t obs X s X 0 其中 s X S n 而 S SS n 1 S 为用样本和方估算出的总体方差 3 两样本平均数差异的检验 X X 1 2 Z t 这是两样
28、本平均数检验的通用公式,所不同的仅在于标准误的计算 obs obs D X (1)总体方差已知 独立样本 相关样本 D X 2 2 1 2 2r 1 2 n 其中 r 为两组变量之间的相关系数 (2)总体方差未知 独立样本 ( 方差差异不显著时 ) 相关样本 2 d 2 d n a. 相关系数未知: 其中 d 为每一对对应数据之差 D X n n 1 b. 相关系数已知: D X 2 2 s 1 s 2 2rs 1 s 2 n 1 4 方差齐性检验 (1)样本方差与总体方差 2 当从正态分布的总体中随机抽取容量为 n 的样本时,其样本方差与总体方差比值听从 χ 分布: 2 2 ns 2
29、 0 由自由度 df n 1 查 χ 2 表,依据显著性水平推断 (2)两个样本方差之间 独立样本 F 2 s 大 2 s 小 其中当两样本自由度相差不大时可用 s n 代替 s n-1 查表时 df1 n1 1,df2 n2 1 相关样本 t 2 2 s s 1 2 2 2 2 4s s 1 r 1 2 其中 df n 2 n 2 5 相关系数的显著性检验 积差相关 r a. 当 ρ=0 时: t 其中 df n 2 2 1 r n 2 b. 当 ρ≠0 时:先通过查表将 r 和 ρ 转化为费舍 Z r 和 Z ρ 然后进行 Z 检验 等级相关和
30、肯德尔 W系数 在总体相关系数为零时:查各自的相关系数表,判定样本相关显著 (四)方差分析 1 方差分析的原理与基本过程 (1)方差分析的概念 方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异 是否有统计意义。当我们用多个 t 检验来完成这一过程时,相当于从 t 分布中随机抽取多 个 t 值,这样落在临界范围之外的可能大大增加,从而增加了 型错误 的概率。我们可以 把方差分析看作 t 检验的增加版。 (2)方差的可分解性 方差分析依据的基本原理就是方差的可加性原则。作为一种统计方法,方差分析把试验数 据的总变异分解为若干个不同来源的重量。数据的变异由两部分组成:
31、组内变异:由于试验中一些希望加以限制的非试验因素和一些未被有效限制的未知因素造 成的变异, 如 个体差异 、 随机误差 组内变异是详细某一个处理水平之内的,因此在对总体变异进行估计的时候不 涉及探讨的处理效应。 组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的试验处理不同造成 的影响 假如探讨数据的总变异是由处理效应造成的,那么组间变异在总变异中应当占 较大比例。 MS 表示组间方差, B MS B SS B df B , dfB k 1 , k 表示试验条件的个数 MS 表示组内方差, W MS W SS W df W , dfW k n 1 , n 表示每种试验条件中的被试个
32、数 (3)方差分析的基本假定 样本必需来自正态分布的总体 每次视察得到的几组数据必需彼此独立 各试验处理内的方差应彼此无显著差异 为了满意这一假定,我们可采纳最大 F 比率法 2 s max F max 2 s min ,求出各样本中方差最大值与最 小值的比,通过查表推断。 (4)方差分析的基本步骤 求平方和 总平方和是全部观测值与总平均数的离差的平方总和 SS X T 2 2 G N 其中 G 表示全部数据的总合, N 表示总共的数据个数 组间平方和是每组的平均数与总平均数的离差的平方再与该组数据个数的乘积的总 和 2 2 2 T G SS n X G n N , G 为数据总均值, i B
33、 i T 为每组数据和, ni 为该组数据 i i 个数 组内平方和是各被试的数值与组平均数之间的离差的平方总和 (注: SS SS SS 举荐用于检验之前的计算,而不是被当作快捷计算的方式) T B W 计算自由度 计算均方 计算 F 值 查 F 值表进行 F 检验并做出推断 陈设方差分析表 2 完全随机设计的方差分析 陈述假设 确定显著水平 确定检验自由度 确定 F 临界值 计算 F 视察值 比较 F 值得出结论 3 随机区组设计的方差分析 随机区组设计中同质被试参与全部水平下测试,因此,组间变异不包括个体差异的影响。 而每一个水平之内仍旧是由不同被试共同完成的,于是 我们仍旧将总体变异分
34、为组间变异 和组内变异,但须要进一步将组内变异分为被试间变异和误差引起的变异。 这样,我们就可以在 F 检验时,将被试间变异从组内变异中去除,使得检验结果更灵敏。 总差 组内差异 组间差异 个体差异 随机误差 个体误差用 SSR 表示,而随机误差用 SSE 表示,它们的和等于组内差异 SS W F MS B MS E 其中 MS E SS E df E 而 S SE SSW SSR ; dfE k 1 n 1 SS R 2 n R i 1 k 2 G N 其中 R 为同一区组的数据之和, 或者同一被试在不同处理下的乘积 的和 让我们回忆一下两个相关样本平均数假设检验,可以发觉那里出现的状况和这
35、里的多样本 方差分析相仿。也就是说,对于同样的试验数据,当我们把它看作是由独立样本得出或相 关样本得出时,就要采纳不同的检验方法,从而有可能得出不同的结论。在假定为相关样 本的数据得出的显著性差异假如换作背景是独立样本就可能只能接受虚无假设。这事实上 是因为相关状况下样本之间差异的减小使得对应检验要运用的统计量变大,检验也就更加 灵敏了。 4 两因素方差分析 在两因素试验设计中,探讨者同时用两种影响因素作为自变量探讨它们对某一因变量的影 响,其试验结果比单因素设计更实际。 (1)交互作用与主效应 主效应:某个自变量的不同水平对因变量所造成的影响的差异 交互作用:一个因素对因变量的影响因另一个因
36、素的不同水平而不同 假如两个因素彼此独立,即不管其中一个因素处于哪个水平,另一个因素的不 同水平均值间的差异都保持一样,则 不会产生交互作用。 (2)统计原理 为了看清各因素独立作用和交互作用的影响,我们进一步将组间差异分解: 其中 SS 与 SSb 分别表示 a 因素与 b 因素的组间平方和, SS a b 表示交互作用的平方和 a df a ; dfb b 1 ; 1 1 1 df a b ; dfW N a b a a b (3)F 的计算(这里探讨独立样本) F a MS a MS W 其中 MS a SS a df a 这里的 SS 是假定全体数据只依据 a 因素分为两组所计算的组间
37、差 a 异 F b MS b MS W 其中 MS b SS b df b 这里的 SS 也同样为假设只依据 b 因素分组所计算的组间差异 b F a b MS a b MS W 其中 MS a b SS a b df a b 这里的 SS a b 为总体组间差异减去 SSa 和 SSb 得到 5 事后检验 由方差分析只能得到显著差异的结果,事后检验使我们能够比较各组,发觉差异详细产生 在什么地方。 事后检验采纳成对比较的方式,每次比较两个组的差异。这里我们只介绍常 用的 红丝带检验 而不是过气的 内裤检验 。 HSD 检验法 把要比较的各个平均数从小到大作等级排列 处理条件的数目 k ,自由
38、度 dfE 查表得到相应显著性的 q 值 计算作为临界值的 HSD q MS n (当为随机区组时用 MSE 代替 MSW ) W 把要比较的两个平均数的差与临界值比较,若超过则认为差异显著 (五)回来分析 1 一元线性回来分析 (1)基本概念 回来分析:通过大量的观测发觉变量之间存在的统计规律性,并用肯定的数学模型表示变 量相关关系的方法 只有一个自变量并且统计量成大体一次函数的线性关系的回来分析叫一元线性 回来分析。 在一元线性回来中,我们用 Y a bX 作为回来方程,代表 X 与 Y 的线性关系 其中: a 表示该直线在 Y 轴的截距 b 表示该直线的斜率也就是 Y 的改变率 X 为自
39、变量,通常是探讨者事先选定的数值 Y 为对应于 X 对变量 Y 的估计值 (2)最小二乘法 所谓最小二乘法,就是假如散点图中每一点沿 Y 轴方向到直线的距离的平方和最小,则认 为这条直线的代表性最好 ,即运用其作为回来方程。 这样我们使得 2 总误差 Y Y 最小。 其中 b X X Y Y 2 X X ; a Y bX 2 一元线性回来方程的检验 (1)方差分析法 其中 2 SS Y Y Y T 2 2 Y n 而其 1 df n T 2 2 2 SS Y Y b X R 2 X n 其 1 df R SS SS SS 其 dfE n 2 E T R (2)回来系数检验 t b SE b 其
40、中 SE b 2 s YX SS X 而 s XY 2 Y Y n 2 ,它的意义是一个统计量,表示以 Y 为中心 Y 值上下波动的标准差 (在知道相关系数时 2 s s 1 r ) XY Y 3 一元线性回来方程的应用 回来分析的目的,就是在测定自变量 X 与因变量 Y 的关系为显著相关后,借助于你和的较 优回来模型来预料在自变量 X 为肯定值时因变量 Y 的发展改变。当我们依据给出的 X 值而 预料得到点估计 Y 时,Y 只代表了预料值的中点, 而计算在特定置信区间内的区间估计则依 靠以下公式: Y t s p XY 2 1 X X 1 P n X X i 2 2 根号部分当 n 很大时近
41、似为 1 其中 t 的自由度取 n-2 , Y 为对应当 X P 的方程解出的点估计 Y 值 p (六)卡方检验 f f 2 o e f e 2 其中 f 为视察次数; f e 为理论期望次数 o 公式的适用范围要求视察彼此之间独立,并且 单位格的理论期望次数不能小于 5(小于 5 时可与相邻的组合并) 1 拟合度检验 2 匹配度检验是用样本数据来检验总体分布的形态或比率, 以确定与假设的总体性质的匹 χ 配度。 df C 1 其中 C 为分类数 2 独立性检验 2 χ 独立性检验帮助我们考察多种因素的不同分类之间是否独立。 它是检验行和列两个变量 彼此有无关联的一种统计方法,
42、适用于命名型变量和依次型变量。 df C 1 R 1 其中 C 和 R 分别为行列分类数 (七)非参数检验 1 独立样本均值差异的非参数检验 (1)秩和检验法 两样本容量均小于 10 将容量较小的样本的各数据等级求和, T 值检验表中的临界值比较。 两样本容量均大于 10 其中 T n 1 n 1 n 1 1 2 而 T n1 n 2 n 1 n 2 1 12 (2)中数检验法 # 将两个样本数据混合从小到大排列 求混合排列的中数 分别找出每个样本中大于和小于中数的数据的个数,列成四格表(中数本身不在内) 对四格表卡方检验公式进行计算 2 相关样本均值差异的非参数检验 (1)符号检验法 对子数
43、小于 25 对于样本每对数据之差来记录符号,求出正负号分别的个数,用其中较小的个数作为观测 值 r 比照临界值表检验 对子数大于 25 其中 1 2 n 而 N 2 (2)维尔克松检验法 对子数小于 25 时 a. 把相关样本对应数据之差值根据肯定值从小到大排列 b. 在各等级前加上原来差值的正负号 c. 分别求出正号等级和负号等级的秩和,取其中较小的值作为 T d. 由 n 值查表检验 T 对子数大于 25 时 其中 T n n 4 1 而 T n n 1 2n 1 24 更多心理学考研: 【圣男时代】倾情奉献 第29页 共29页第 29 页 共 29 页第 29 页 共 29 页第 29 页 共 29 页第 29 页 共 29 页第 29 页 共 29 页第 29 页 共 29 页