SPSS参数估计与假设检验.pptx-淘文阁

资源描述

《SPSS参数估计与假设检验.pptx》由会员分享，可在线阅读，更多相关《SPSS参数估计与假设检验.pptx（106页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、主要内容主要内容5.1 参数估计5.2 假设检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第1页/共106页5.1 统计推断与假设检验5.1.1 点估计简介1.基本概念点估计用样本统计量的值直接作为总体参数的估计值。如用样本均值直接作为总体均值的估计值，用样本方差直接作为总体方差的估计值等。2.2.常用的点估计方法（1）矩估计法（2）极大似然估计法（3）稳健估计法第2页/共106页5.1 统计推断与假设检验5.1.2 区间估计简介因为点估计直接用样本估计值作为总体参数的估计值，没有提供关于估计精度的任何信息，存在抽样标准误差，故提

2、出了未知参数的区间估计法。给出两个数，指出总体参数以一定概率位于两数所确定的区间内，这种估计叫做参数的区间估计。区间估计是在点估计的基础上，给出总体参数估计的一个范围，所以区间估计相对于点估计更加精确，要优于点估计。第3页/共106页5.1 统计推断与假设检验5.1.3 参数估计SPSS实例分析【例5-15-1】从一个正态总体中随机抽取容量为8的样本，各样本值分别为10，8，12，15，6，13，5，11；求总体均值在95%的置信区间。分析：这是一个求总体均值的区间估计问题，进行总体均值的区间估计可以采用探索分析或单样本T检验，本例中采用探索分析，具体分析步骤同例4-3。第4页/共106页主要

3、内容主要内容5.1 参数估计5.2 假设检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第5页/共106页5.2 假设检验5.2.1 基本概念及统计原理基本概念及统计原理原假设：原假设：被检验的假设，通过检验可能被接受，也可能被否定；在很多情况下，我们给出一个统计假设仅仅是为了拒绝它。例如，如果我们要判断给定的一枚硬币是否均匀，则假设硬币是均匀的（即p，其中p是正面出现的概率）；类似地，如果我们要判断一种方法是否优于其他的方法，则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设，记为。备择假设：备择假设：与原假设对应的假设，

4、只有在原假设被否定后才可接受的假设；例如，如果零假设是，则备择假设是。备择假设记为。拒绝域、临界点：拒绝域、临界点：当检验统计量取某个区域中的值时，拒绝原假设，则称该取值区域为拒绝域，称拒绝域的边界点为临界点。第6页/共106页5.2 假设检验5.2.1 基本概念及统计原理基本概念及统计原理2.2.显著性水平与置信水平显著性水平与置信水平显著性水平显著性水平:在作假设检验时，我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为，通常抽样前就指定好，这样得到的结果才不会影响我们的选择。在实际问题中，显著性水平可以有多种选择，但最为普通的是或。例如，如果设计一个决策法则选择的显著性

5、水平是（5%），那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说，我们大约有95%的把握作出正确的决策。此时，我们说拒绝假设的显著性水平为，即犯拒绝本应接受的假设这类错误的概率是。置信水平：置信水平：1-为置信度或置信水平；第7页/共106页5.2 假设检验5.2.1 基本概念及统计原理基本概念及统计原理3.3.假设检验的两类错误假设检验的两类错误第一类错误：第一类错误：在假设检验中拒绝了本来是正确的原假设。第二类错误：第二类错误：在假设检验中没有拒绝错误的原假设。4 4概率概率P P值值 P值是当原假设正确时，观测到的样本信息出现的概率。通常用P值与预先设定的显著性水平值比较

6、，若P值小于显著性水平，则认为该概率值足够小，应拒绝原假设。5 5单侧检验与双侧检验单侧检验与双侧检验双侧检验双侧检验：只强调差异而不强调方向性的检验叫双侧检验。单侧检验：单侧检验：强调某一方向的检验叫单侧检验。第8页/共106页5.2 假设检验5.2.2 小概率事件原理在概率论中我们把发生概率小到接近于0的事件称为小概率事件（即在大量重复试验中出现的频率非常低）。在统计学上，把小概率事件看成在一次特定的抽样中不可能发生的事件，称为“小概率事件实际不可能原理”。这是统计学上进行假设检验（显著性检验）的基本依据。根据这一原理，若某事件在理论上被认为在原假设成立的情况下是个小概率事件，它不会出现

7、，而在实际中出现了，我们就推翻原来的假设，认为原假设不成立，从而接受备择假设。第9页/共106页5.2 假设检验5.2.3 假设检验的一般步骤第1 1步给出检验问题的原假设；根据检验问题的要求，将需要检验的最终结果作为零假设。例如，需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样，都为75,由此可做出零假设，第2 2步选择检验统计量；在统计推断中，总是通过构造样本的统计量并计算统计量的概率值进行推断，一般构造的统计量应服从或近似服从常用的已知分布，例如均值检验中最常用的t分布和F分布等。第3 3步规定显著性水平;第10页/共106页5.2 假设检验5.2.3 5.2.3 假设检验

8、的一般步骤第4 4步计算检验统计量的观测值及其发生的概率值；在给定零假设前提下，计算统计量的观测值和相应概率p值。概率p值就是在零假设成立时检验统计量的观测值发生的概率，该概率值间接地给出了样本值在零假设成立的前提下的概率，对此可以依据一定的标准来判断其发生的概率是否为小概率。第11页/共106页5.2 假设检验5.2.3 5.2.3 假设检验的一般步骤第5 5步在给定显著性水平条件下，做出统计推断结果。这里的显著性水平指的是当假设正确时被拒绝的概率，即弃真概率，一般取或。当检验统计量的概率p值小于显著性水平时，则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平，即低于预先给定的水平，

9、也就是说犯错误的概率小到我们能容忍的范围，这时可以拒绝零假设；反之，如果检验统计量的概率p值大于显著性水平，如果拒绝零假设，犯弃真错误的概率大于预先给定的容忍水平，这时不应该拒绝零假设。第12页/共106页主要内容主要内容5.1 参数估计5.2 假设检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第13页/共106页 5.3 参数检验及非参数检验5.3.1 参数检验简介参数检验的总体分布形式是已知的或假定的，只是一些参数的取值或范围未知，分析的主要目的是估计参数的取值范围，或对其进行某种统计检验。如正态总体的均值是否与某个值存在显著差

10、异，两个总体的均值是否有显著差异等。主要包括:单样本T检验：检验单个变量的均值与假设检验值之间是否存在差异；独立样本T检验：检验两组来自独立总体的样本，其独立总体的均值或中心位置是否一样；配对样本T检验：检验两个相关的样本是否来自具有相同均值的总体。第14页/共106页 5.3 参数检验及非参数检验5.3.2 非参数检验简介非参数检验是在总体分布未知的情况下，利用样本数据对总体分布形态等进行推断的方法，在推断过程中不涉及有关总体分布的参数，而是检验总体某些有关的性质，如总体的分布位置、分布形状之间的比较等。与参数检验的原理相同，非参数检验过程也是先根据问题提出原假设，然后利用统计学原理构造出

11、适当的统计量，最后利用样本数据计算统计量的概率P值，与显著性水平进行比较，得出拒绝或者接受原假设的结论。非参数检验包括单样本（O）、独立样本（I）、相关样本（R）的非参数检验。第15页/共106页 5.3 参数检验及非参数检验5.3.3 参数检验及非参数检验比较 1参数检验和非参数检验的区别参数检验和非参数检验最本质的区别是：参数检验需要事先确定或假定总体的分布，非参数检验则不需要假定总体的分布，而是直接用样本来推断总体的分布。除此之外，二者之间还可以从很多方面来区分。研究的对象和目标不同。研究的统计量有所不同。第16页/共106页主要内容主要内容5.1 参数估计5.2 假设检验5.3 参数

12、检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第17页/共106页 5.4 单样本T检验5.4.1 基本概念及统计原理基本概念及统计原理1.单样本单样本T检验的概念检验的概念单样本T检验利用来自某总体的样本数据，推断该总体的均值与指定的检验值之间是否存在显著性差异，它是对总体均值的假设检验。为此，给出检验均值，原假设：=，其中为总体均值，即认为总体均值与检验值之间无显著性差异。例如，从新生的入学成绩的抽样数据推断平均成绩是否为75分；在人口普查中，某地区职工今年的平均收入是否和往年的平均收入有显著差异。第18页/共106页5.4 单样本T检验

13、5.4.1 基本概念及统计原理2.单样本T检验的检验统计量单样本T检验的前提是总体服从正态分布，其中为总体均值，为总体方差。如果样本容量为n,样本均值为，则仍服从正态分布，即：。在零假设成立的条件下，均值检验使用t统计量，构造的t统计量为：其中，用代入，t统计量服从自由度为n-1的t分布，S为样本标准差。在给定原假设的前提下，SPSS将检验值代入t统计量，得到检验统计量观测值，以及根据T分布的分布函数计算出的概率P值。第19页/共106页5.4 单样本T检验5.4.1 基本概念及统计原理3.单样本T检验的步骤在给定样本来自正态总体的假设下，单样本T检验作为假设检验的一种方法，其基

14、本步骤与假设检验的步骤是一样的。第20页/共106页 5.4 单样本T检验5.4.2 单样本T检验SPSS实例分析【例5-2】某生产食盐的生产线，其生产的袋装食盐的标准质量为500 g，现随机抽取10袋，其质量分别为495 g，502 g，510 g，497 g，506 g，498 g，503 g，492 g，504 g，501 g。假设数据呈正态分布，请检验生产线的工作情况。分析:这是一个典型的比较样本均值和总体均值的T检验问题;第1步数据组织：首先建立SPSS数据文件，只需建立一个变量“Weight”，录入相应的数据即可，建立的数据文件存入文件中。第21页/共106页 5.4 单样本T检

15、验5.4.2 单样本T检验SPSS实例分析第2步单样本T检验分析设置选择菜单“分析比较均值单样本T检验（S）”，打开“单样本T检验”对话框，将变量“weight”移入”检验变量”列表框,并输入检验值500;打开“单样本T检验：选项”对话框,设置置信区间为95%(缺省为95%);第22页/共106页 5.4 单样本T检验5.4.2 单样本单样本T检验检验SPSS实例分析实例分析第第3步步主要结果及分析主要结果及分析:单样本统计量表单样本T检验结果表 N均值标准差均值的标准误weight10500.80005.391351.70489检验值=500tdfSig（双侧）均值差值差分的 95

16、%置信区间下限上限weight.4699.650.80000-3.05674.6567本例置信水平为95%，显著性水平为，从上表中可以看出，双尾检测概率P值为，大于，故原假设成立，也就是说，抽样袋装食盐的质量与500克无显著性差异，有理由相信生产线工作状态正常下表给出了单样本T检验的描述性统计量，包括样本数（N）、均值、标准差、均值的标准误。第23页/共106页主要内容主要内容5.1 参数估计5.2 假设检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第24页/共106页5.5 独立样本T检验5.5.1 基本概念及统计原理基本概念及统

17、计原理1.独立样本独立样本T检验的概念检验的概念单样本T检验是检验样本均值和总体均值是否有显著性差异，而两独立样本T检验的目的是利用来自某两个总体的独立样本，推断两个总体的均值是否存在显著差异。其原假设H0为，即假设两总体均值相等，备择假设为，即假设两总体均值不等。例如，为比较两种牧草对奶牛的饲养效果，随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量，根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。第25页/共106页5.5 独立样本T检验5.5.1 基本概念及统计原理2独立样本T检验的检验统计量独立样本 T检验的前提是两个独立的总

18、体分别服从和和。在零假设成立的条件下，独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1）当样本方差相等时，t统计量定义为：其中和分别为两样本容量，,和分别为两样本标准差。该统计量服从自由度为的t分布。第26页/共106页5.5 独立样本T检验5.5.1 基本概念及统计原理2独立样本T检验的检验统计量 2）当样本方差不等时，t统计量定义为：可见，独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前，首先应对两总体方差是否相等进行检验，也称之为方差齐性检验。第27页/共106页5.5 独立样本T检验5.5

19、.1 基本概念及统计原理3.方差齐性检验方法利用Levene F方差齐性检验方法检验两总体方差是否存在显著差异；首先提出原假设；执行检验过程中，若概率p 值小于给定的显著性水平（一般为），则拒绝原假设，认为两个总体的方差不等；否则认为两个总体的方差无显著性差异。4.独立样本T检验的一般步骤在两样本来自正态总体且相互独立的假设下，独立样本T检验作为假设检验的一种方法，其基本步骤与假设检验的步骤是一样的。第28页/共106页5.5 独立样本T检验5.5.2 独立样本T检验SPSS实例分析【例5-3】为比较两种不同品种的玉米的产量，分别统计了8个地区的单位面积产量，具体数据见表。假定样本服从正态

20、分布，且两组样本相互独立，试比较在置信度为95%的情况下，两种玉米产量是否有显著性差异。第29页/共106页5.5 独立样本T检验5.5.2 独立样本T检验SPSS实例分析第1步数据组织:在SPSS数据文件中建立两个变量，分别为“品种”、“产量”，度量标准分别为“名义”、“度量”，变量“品种”的值标签为：a品种A，b品种B，录入数据后，保存名为的SPSS数据文件;第2步独立样本T检验设置:选择菜单“选择比较均值独立样本T检验”，打开“独立样本T检验”对话框，将“产量”作为要进行T检验的变量，将“品种”字段作为分组变量，定义分组变量的两个分组分别为“a”和“b”。打开“独立样本T检验：选项

21、”对话框，具体选项内容及设置与单样本T检验相同。第30页/共106页5.5 独立样本T检验5.5.2 基本概念及统计原理基本概念及统计原理第第3步步运行结果及分析：运行结果及分析：独立样本独立样本T检验的基本描述统计量检验的基本描述统计量玉米品种N均值标准差均值的标准误单位面积产量品种A881.250011.804964.17368品种B875.750010.024973.54436 上表给出了本例独立样本T检验的基本描述统计量，包括两个样本的均值、标准差和均值的标准误。第31页/共106页5.5 独立样本T检验5.5.基本概念及统计原理基本概念及统计原理独立样本独立样本T检验结果表检验结

22、果表独立样本检验独立样本检验方差方程方差方程的的 Levene Levene 检验检验均值方程的均值方程的 t t 检验检验F FSigSig.t tdfdfSig.Sig.(双双侧侧)均值差均值差值值标准误标准误差值差值差分的差分的 95%95%置置信区间信区间下限下限上限上限单位面积单位面积产量产量假设方差相假设方差相等等.10.104 4.75.752 21.0041.0041414.332.3325.5005.50000005.475605.47560-6.24396.24398 817.24317.2439898假设方差不假设方差不相等相等1.0041.00413.6413.642

23、 2.333.3335.5005.50000005.475605.47560-6.27296.27297 717.27217.2729797 根据上表“方差方程的 Levene 检验”中的sig.为0.752，远大于设定的显著性水平0.05，故本例两组数据方差相等。在方差相等的情况下，独立样本T检验的结果应该看上表中的“假设方差相等”一行，第5列为相应的双尾检测概率（Sig.（双侧）为，在显著性水平为的情况下，T统计量的概率p值大于，故不应拒绝零假设,，即认为两样本的均值是相等的，在本例中，不能认为两种玉米品种的产量有显著性差异。第32页/共106页主要内容主要内容5.1 参数估计5.2 假设

24、检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第33页/共106页5.配对样本T检验5.6.1 基本概念及统计原理基本概念及统计原理1配对样本T检验的概念配对样本T检验用于检验两个相关样本是否来自相同均值的正态总体，即推断两个总体的均值是否存在显著差异。其零假设为，其中和分别为第一个总体和第二个总体的均值。配对的概念是指两个样本的各样本值之间存在着对应关系，配对样本的两个样本值之间的配对是一一对应的，并且两个样本的容量相同。配对样本T检验与独立样本T检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”、“后”两种状

25、态下某属性的两种状态，也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的，而是互相关联的。第34页/共106页5.配对样本T检验5.6.1 基本概念及统计原理基本概念及统计原理2配对样本T检验的数学思想配对样本T检验须求出每对观测值之差，所有样本值的观测值之差形成一个新的单样本，显然，如果两个样本的均值没有显著差异，则样本值之差的均值应该接近零，这实际上转换成了一个单样本的T检验。所以，配对样本T检验就是检验差值所来自的总体其均值是否为零，这就要求差值来自的总体服从正态分布。第35页/共106页5.5 配对样本T检验5.6.1 基本概念及统计原理3配对样本T检验的检验统计量

26、在配对样本T检验中，设、分别为配对样本。其样本差值，此时检验统计量为：其中为的均值，S为的标准差，n为样本数，当时，t统计量服从自由度为n-1的t分布。第36页/共106页5.配对样本T检验5.6.2 5.6.2 配对样本T T检验SPSSSPSS实例分析【例5-4】以下是某大学跆拳道选手15人的平衡训练的数据，统计实验前、后平衡训练成绩是否有差异。训练前：86，77，59，79，90，68，85，94，66，72，75，72，69，85，88训练后：78，81，76，92，88，76，93，87，62，84，87，95，88，87，80第1步数据组织：首先建立SPSS数据文件

27、，建立两个变量：“训练前”、“训练后”，录入相应数据。第2步配对样本T检验设置：选择菜单“分析比较均值配对样本T检验”，弹出“配对样本T检验”对话框，同时选中“训练前”及“训练后”字段，将其加入“成对变量“列表框；打开“选项”对话框，指定置信水平和缺失值的处理方法；具体方法在前面已有讲述，可以参考前文第37页/共106页5.配对样本T检验5.6.2 5.6.2 配对样本配对样本T T检验检验SPSSSPSS实例分析实例分析第第3步步运行结果及分析：运行结果及分析：配对样本T检验的基本描述统计量配对样本相关性检验成对样本统计量成对样本统计量均值均值N N标准差标准差均值的标准误均值的标准误对

28、对 1 1训练前训练前77.6777.67151510.10410.1042.6092.609训练后训练后83.6083.6015158.4338.4332.1772.177成对样本相关系数成对样本相关系数N N相关系数相关系数Sig.Sig.对对 1 1训练前训练前&训练后训练后1515.407.407.132.132 左表是配对样本T检验的简单相关关系检验结果。表中显示训练前和训练后两样本的相关系数为0.407，相关系数的检验P值为0.132显著性水平，接受原假设，可以认为训练前后的成绩没有明显的线性关系。第38页/共106页5.配对样本T检验5.6.2 5.6.2 配对样本配对样本T T

29、检验检验SPSSSPSS实例分析实例分析第第3步步运行结果及分析：运行结果及分析：配对样本T检验结果上表是配对样本T检验的最终结果。sig.(双侧)为双尾检验概率p值在置信水平为95%时，显著性水平为0.05，由于概率p值为0.041，小于0.05,拒绝零假设，可以认为训练前后对成绩有显著效果。成对样本检验成对样本检验成对差分成对差分t tdfdfSig.(Sig.(双侧双侧)均值均值标准标准差差均值的标准均值的标准误误差分的差分的 95%95%置信置信区间区间下限下限上限上限对对 1 1训练前训练前 -训练训练后后-5.935.933 310.1810.187 72.6302.630-1

30、1.57511.575-.292-.292-2.2562.2561414.041.041第39页/共106页主要内容主要内容5.1 参数估计5.2 假设检验5.3 参数检验与非参数检验5.4 单样本T检验5.5 独立样本T检验配对样板T检验单样本的非参数检验第40页/共106页 5.7 单样本的非参数检验5.7.1 5.7.1 基本概念及统计原理基本概念及统计原理单样本非参数检验使用一个或多个非参数检验方法来识别单个总体的分布情况，不需要待检验的数据呈正态分布。SPSS的单样本非参数检验方法包括卡方检验、二项分布检验、游程检验、K-S检验及Wilcoxon符号检验五种。在SPSS 19中

31、，所有单样本的非参数检验有一些共同的设置。单样本非参数检验的对话框有三个选项卡，分别为“目标”、“字段”和“设置”，具体设置如下：第41页/共106页 5.7 单样本的非参数检验5.7.1 5.7.1 基本概念及统计原理基本概念及统计原理（1）“目标”选项卡：用于设置非参数检验的目标，每个不同的选项对应于“设置”选项卡上不同的默认配置，如下图所示。第42页/共106页 5.7 单样本的非参数检验5.7.1 5.7.1 基本概念及统计原理基本概念及统计原理（2）“字段”选项卡：用于设定待检验变量。第43页/共106页 5.7 单样本的非参数检验5.7.1 5.7.1 基本概念及统计原理基本概念及

32、统计原理（3）“设置”选项卡：用于设定检验方法及对应的选项，如下图所示。第44页/共106页5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验1卡方检验的概念也称卡方拟合优度检验，它是给出的一种最常用的非参数检验方法，用于检验观测数据是否与某种概率分布的理论数值相符合，进而推断观测数据是否是来自于该分布的样本的问题。第45页/共106页5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验1卡方检验的概念也称卡方拟合优度检验，它是给出的一种最常用的非参数检验方法，用于检验观测数据是否与某种概率分布的理论数值相符合，进而推断观测数据是否是来自于该分布的样本的问题。2统计原理为检

33、验实际分布是否与理论分布（期望分布一致），可采用卡方统计量，典型的卡方统计量是Pearson卡方统计量，其公式为：第46页/共106页 5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验分析步骤第1 1 步提出零假设：卡方检验的零假设H0是“总体服从某种理论分布”，其对立假设H1是“总体不服从某种理论分布”。第2 2步选择检验统计量：卡方分布选择的是Pearson卡方统计量。已证明，当n充分大时，它近似地服从自由度为k-1的卡方分布。第3 3步计算检验统计量的观测值和概率p p值。3.3.第4 4步给出显著性水平，作出决策。第47页/共106页5.7 单样本的非参数检验5.7.

34、2 5.7.2 卡方检验4卡方检验SPSS实例分析【例5-5】某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中，随机抽取了90件次品的原始记录，其结果如下表，问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中？（）工作日12345次品数251581626第48页/共106页5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验第1 1步分析：由于考虑的是次品是否服从均匀分布的问题，故用卡方检验。第2 2步数据组织：建立SPSS数据文件，建立两个变量：“工作日”、“次品数”，录入相应数据，保存为文件。第3 3步“次品数”字段加权处理：通过分析“工作日”

35、及“次品数”两个字段的含义及度量标准，确定“工作日”为被分析字段，而“次品数”表示各工作日出现的频数，所以应该对“次品数”进行加权处理。执行“数据”“加权个案”，打开“加权个案”对话框，按图5-10所示进行设置。第49页/共106页5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验第4 4步单因素的非参数检验设置：选择菜单“分析非参数检验单样本”，在“目标”选项卡选择“自定义分析”；在“字段”选项卡中选择“使用定制字段分配”，并将“工作日”字段选入“检验字段”；“设置”选项卡中选择“自定义检验”，并选中“比较观察可能性和假设可能性（卡方检验）”，“检验选项”及“用户缺失值”保持默认选

36、项。第5 5步卡方检验的选项设置：打开“卡方检验选项”对话框，选择”所有类别概率相等（V）“选项。第50页/共106页5.7 单样本的非参数检验5.7.2 5.7.2 卡方检验卡方检验第第6 6步步运行结果及分析运行结果及分析：卡方检验的假设检验数据摘要给出了卡方检验的原假设为“工作日的类别以相同的概率发生”，其相伴概率值Sig.=，说明应拒绝原假设，因此图5-12的“决策者”给出“拒绝原假设”的决策，认为工作日的类别是以不同概率发生的，即认为该企业一周内出现的次品数不是均匀分布在一周的五个工作日中。第51页/共106页5.7.3 5.7.3 二项分布检验1基本概念基本概念二项分布检验正

37、是要通过样本数据检验样本来自的总体是否服从指定的概率为p的二项分布，其零假设H0是：样本来自的总体与指定的二项分布无显著性差异。2统计原理二项分布检验在样本小于等于30时，按下式计算概率值：5.7 单样本的非参数检验第52页/共106页5.7 单样本的非参数检验5.7.3 5.7.3 二项分布检验在大样本的情况下，计算的是Z统计量，认为在零假设下，Z统计量服从正态分布，其计算公式如下：当x小于n/2时，取加号；反之取减号，p为检验概率，n为样本总数。第53页/共106页5.7 单样本的非参数检验5.7.3 5.7.3 二项分布检验3分析步骤分析步骤二项分布检验亦是假设检验问题，检验步骤同前。

38、SPSS会自动计算上述精确概率和近似概率值。如果概率值小于显著性水平，则拒绝零假设，认为样本来自的总体与指定的二项分布有显著差异，反之样本来自的总体与指定的二项分布无显著差异。第54页/共106页5.7 单样本的非参数检验5.7.3 5.7.3 二项分布检验SPSSSPSS实例分析【例5-7】有20名学生经过新型教学法后测试成绩如下表，以90分及以上为优秀，请检验这20名同学的优秀率是否达到了10%。成绩 78 75 84 76 89 93 94 88 95 87 88 73 84 82 80 84 87 91 95 83第1步分析：由于成绩分为优秀与非优秀两种状态，故应用二项分布检验。第2

39、步数据的组织：数据分成一列，其变量名为“成绩”，输入数据并保存。第55页/共106页5.7 单样本的非参数检验5.7.3 5.7.3 二项分布检验SPSSSPSS实例分析第3步单因素的非参数检验设置：选择菜单“分析非参数检验单样本”：将“目标”选项卡选择“自定义分析”；在“字段”选项卡中选择“使用定制字段分配”，并将“成绩”字段选入“检验字段”；在“设置”选项卡中选择“自定义检验”，并选中“比较观察二分类可能性和假设可能性（二项式检验）（O）”，“检验选项”及“用户缺失值”保持默认选项；第4步进行二项分布检验选项设置：打开“二项式选项”对话框，设置“假设比例”为0.9，选择“定义连续字

40、段的成功值”中的“定制割点”选项，并设置割点为99。第56页/共106页5.7 单样本的非参数检验 5.7.3 5.7.3 二项分布检验SPSSSPSS实例分析第5步主要结果及分析：二项式假设检验数据摘要单尾检测的相伴概率Sig.=0.043 （）说明应该接受H0假设（即方差相等）。故下面就用方差相等的检验方法。第77页/共106页6.2 单因素方差分析猪重Sum of SquaresdfMean SquareFSig.Between Groups20538.69836846.233157.467.000Within Groups652.1591543.477Total21190.858

41、18几种饲料的方差检验（ANOVA）结果上表是几种饲料方差分析的结果，组间（Between Groups）平方和（Sum of Squares）为，自由度（df）为3，均方为；组内（Within Groups）平方和为，自由度为15，均方为；F统计量为。由于组间比较的相伴概率Sig.（p值），故应拒绝H0假设（四种饲料喂猪效果无显著差异），说明四种饲料对养猪的效果有显著性差异。第78页/共106页6.2 单因素方差分析第4步多重比较分析：通过上面的步骤，只能判断4种饲料喂猪效果是否有显著差异。如果想进一步了解究竟是哪种饲料与其他组有显著性的均值差别（即哪种饲料更好）等细节问题，就需要在多个

42、样本均值间进行两两比较。由于第3步检验出来方差具有齐性，故选择一种方差相等的方法，这里选LSD方法；显著性水平默认取；第79页/共106页6.2 单因素方差分析第5步运行主要结果及分析：多重比较（Multiple Comparisons）结果猪重 LSD(I)饲料品种(J)饲料品种Mean Difference（I-J）Std.ErrorSig.95%Confidence IntervalLower BoundUpper Bound12-18.68000*4.17024.000-27.5687-9.79133-56.36000*4.17024.000-65.2487-47.47134-87

43、.41500*4.42321.000-96.8428-77.98722118.68000*4.17024.0009.791327.56873-37.68000*4.17024.000-46.5687-28.79134-68.73500*4.42321.000-78.1628-59.30723156.36000*4.17024.00047.471365.2487237.68000*4.17024.00028.791346.56874-31.05500*4.42321.000-40.4828-21.62724187.41500*4.42321.00077.987296.8428268.73500*

44、4.42321.00059.307278.1628331.05500*4.42321.00021.627240.4828*.The mean difference is significant at the 0.05 level.从整个表反映出来四种饲料相互之间均存在显著性差异，从效果来看是第4种最好，其次是第3种，第1种最差。第80页/共106页6.2 单因素方差分析均值折线图上图为几种饲料均值的折线图，可以看出均值分布比较陡峭，均值差异也较大。第81页/共106页主要内容主要内容6.1 方差分析简介6.2 单因素方差分析6.3 多因素方差分析6.4 协方差分析第82页/共106页6.3

45、多因素方差分析6.3.1 基本概念及统计原理基本概念多因素方差分析用来研究两个及两个以上的控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个控制因素对观测变量的影响，也能够分析多个控制因素的交互作用对观测变量产生影响，进而最终找到利于观测变量的最优组合。多因素方差分析不仅需要分析多个控制变量独立作用对观测变量的影响，还要分析多个控制变量的交互作用对观测变量的影响，及其他随机变量对结果的影响。因此，需要将观测变量总的离差平方各分解为3个部分：多个控制变量单独作用引起的离差平方和；多个控制变量交互作用引起的离差平方和；(1)其他随机因素引起的离差平方和。第83页/共106页6.

46、3 多因素方差分析(2)统计原理以两个控制变量为例，多因素方差分析将观测变量的总离差平方和分解为：SST=SSA+SSB+SSAB+SSE 设控制变量A有k个水平，变量B有r个水平，则SSA的定义为（SSB的定义类似）：其中，为因素A第i个水平和因素B第j个水平下的样本观测值个数，为因素A第i个水平下观测变量的均值。其中，是因素A、B在水平i、j下的观测变量均值。第84页/共106页6.3 多因素方差分析在固定效应模型中，各F统计量为：在随机效应模型中，统计量不变，其他两个F统计量分别为：第85页/共106页6.3 多因素方差分析(3)分析步骤第1步提出零假设：多因素方差分析的零假设H0是

47、：各控制变量不同水平下观测变量各总体均值无显著差异，控制变量各效应和交互作用效应同时为0，即控制变量和它们的交互作用对观测变量没有产生显著性影响。第2步构造检验统计量：多因素方差分析采用的是F统计量，根据效应模型选择。第3步计算检验统计量的观测值和概率p值：SPSS会自动将相关数据代入各式，计算出检验统计量的观测值的概率p值（也称相伴概率值Sig.）。第4步给出显著性水平，作出决策。第86页/共106页6.3 多因素方差分析6.3.2 SPSS实例分析【例6.2】研究一个班三组不同性别的同学（分别接受了三种不同的教学方法）在数学成绩上是否有显著差异，数据如下表。姓名数学组别性别姓名数学组

48、别性别张青华990m郭晓艳992m王洁云880f李福利702f吴凌风990m罗帆892m刘行890m宋丽君551f马萌940f辛瑞晶501m单玲玲900m王滢滢671f罗超波792m蔡春江671m尹珣562f武佳琪561f张敏892m陈雪吟561m第87页/共106页6.3 多因素方差分析第1步分析：需要研究不同教学方法和不同性别对数学成绩的影响。这是一个多因素(双因素)方差分析问题。第2步数据组织：如上表的变量名组织成4列数据。第3步变量设置：按“分析|一般线性模型|单变量”的步骤打开单变量对话框。并将“数学”变量移入因变量框中，将“组别”和“性别”移入固定因子中，如下图：第88页/共

49、106页6.3 多因素方差分析第4步设置方差齐性检验：由于方差分析要求不同组别数据方差相等，故应进行方差齐性检验，单击“选项”按钮，选中“方差齐性检验”，显著性水平设为默认值。第5步设置控制变量的多重比较分析：单击“两两比较”按钮，如下图，在其中选出需要进行比较分析的控制变量，这里选“组别”，再选择一种方差相等时的检验模型，如LSD。第89页/共106页6.3 多因素方差分析第6 6步选择建立多因素方差分析的模型种类：打开“模型”对话框，本例用默认的全因子模型。第7 7步以图形方式展示交互效果：设置方式如下图。第90页/共106页6.3 多因素方差分析第8 8步对控制变量各个水平上

50、的观察变量的差异进行对比检验：选择“对比”对话框，对两种因素均进行对比分析，用“简单”方法，并以最后一个水平的观察变量均值为标准。第9 9步主要结果及分析表示了各控制因素的个案数，即分组描述情况。是对数学进行方差齐性检验的结果，可以看出方差无显著差异，应用前面的LSD方法的结果。第91页/共106页6.3 多因素方差分析该表是进行多因素方差分析的主要部分，由于指定建立全因子模型，因此总的离差平方和分为3个部分：多个控制变量对观察量的独立作用、交互作用及随机变量的影响。第92页/共106页6.3 多因素方差分析这是组别变量的均值比较结果，可以看第1，2组与第3组比较的均值差异均显著。第93页

展开阅读全文