《spss卡方检验与相关分析报告.ppt》由会员分享,可在线阅读,更多相关《spss卡方检验与相关分析报告.ppt(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、相关分析之一有关与无关v寻找变量间的关系是科学研究的首要目寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即的。变量间的关系最简单的划分即: :有关有关与无关。与无关。v在统计学上,我们通常这样判断变量之在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二量的变化不引起另一个变量的变化则二者无关。者无关。 1 通通过过考考试试 2 未未通通过过考考试试 1 男男性
2、性 40% 60% 2 女女性性 40% 60% 总总计计 40% 60% 性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。 每每月月工工资资平平均均数数 N 1 男男性性 752.40 452 2 女女性性
3、 601.97 409 总总计计 680.95 861 统计结果显示,当性别取值不同时,收入变量统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。的取值发生了变化,因此性别与月收入有关。自变量自变量因变量因变量变量关系的统计类型变量关系的统计类型 定定类类 定定序序 定定距距 定定类类 列列联联 cross-tabulate 列列联联 cross-tabulate 方方差差分分析析 (分分组组平平均均数数) compare means 定定序序 列列联联 cross-tabulate 积积差差相相关关 spearman correlation 积积差差相相关关 s
4、pearman correlation 积积矩矩相相关关 pearson correlation 定定距距 积积矩矩相相关关 pearson correlation 回回归归 regression 相关分析之二关系强度n变量关系强度的含义变量关系强度的含义:指两个变量相关程度指两个变量相关程度的高低。统计学中是以准实验的思想来分的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析:析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。)两变量是否相互独立。 B)两变量是否有共变趋势。)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量)一变量的变化多大程度
5、上能由另一变量的变化来解释。的变化来解释。变量关系强度测量的主要指标变量关系强度测量的主要指标相关分析之三关系性质n直线相关与曲线相关直线相关与曲线相关n正相关与负相关正相关与负相关n完全相关与完全不相关完全相关与完全不相关一、列联相关(第四章已讲)一、列联相关(第四章已讲)n(一)列联分析的基本原理(一)列联分析的基本原理n自变量发生变化,因变量取值是否也自变量发生变化,因变量取值是否也发生变化。发生变化。n比较边缘百分比和条件百分比的差别。比较边缘百分比和条件百分比的差别。n卡方测量用来考察两变量是否独立卡方测量用来考察两变量是否独立(无关无关)。jiijPPP.二、二、相关分析相关分析(
6、Correlate)(一)简介n相关分析用于描述两个变量间联系的密切相关分析用于描述两个变量间联系的密切程度,其特点是变量不分主次,被置于同程度,其特点是变量不分主次,被置于同等的地位。检验的原假设为相关系数为等的地位。检验的原假设为相关系数为0。可选择是单尾检验还是双尾检验。可选择是单尾检验还是双尾检验。n在在Analyze的下拉菜单的下拉菜单Correlate命令项中命令项中有三个相关分析功能子命令有三个相关分析功能子命令Bivariate过程过程(二变量相关分析二变量相关分析)、Partial过程(偏相关分过程(偏相关分析)、析)、 Distances过程(距离分析)。过程(距离分析)。
7、(二)相关分析类型(二)相关分析类型nBivariate过程用于进行两个或多个变量间的过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的相关分析,如为多个变量,给出两两相关的分析结果。分析结果。nPartial过程,当进行相关分析的两个变量的过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。其他变量影响后的相关系数。nDistances过程用于对同一变量各观察单位间过程用于对同一变量各观察单位间的数值或各个不同变量间进
8、行相似性或不相的数值或各个不同变量间进行相似性或不相似性分析,一般不单独使用,而作为因子分似性分析,一般不单独使用,而作为因子分析等的预分析。析等的预分析。(三)(三)Bivariate相关分析相关分析n在进行相关分析时,散点图是重要的工具,在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否线趋势,以及数据中是否存在异常点。否则可能得出错误结论。则可能得出错误结论。nBivariate相关分析的步骤:相关分析的步骤:输入数据后,
9、依输入数据后,依次单击次单击AnalyzeCorrelateBivariate,打开打开Bivariate Correlations对话框对话框Bivariate Correlations 对话框对话框nPearson复选框 选择进行积差相关分析,即最常用的相关分析,其计算连续变量或等间隔测度变量间的相关系数。计算该相关系数时,不仅要求两相关变量均为正态变量,而且样本数(N)一般不应少于30。 nKendalls tau-b复选框 计算Kendalls等级相关系数,其计算定序变量间的线性相关关系。(有打结现象时) nSpearman复选框 计算Spearman相关系数。也是计算等级相关系数(定
10、序与定序)。最常用的非参数相关分析(秩相关),适用于连续等级资料。 (无打结现象) 以上三种相关分析可以选择其中之一,也可以同时多选。如果参与分析的变量是连续变量,选择Kendalls tau-b或Spearman相关,则系统自动对连续变量的值先求秩,再计算其秩分数间的相关系数。 nFlag significant correlations n用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P0.05的系数值旁会标记一个*,P0.01的则标记两个*。 Options 对话框对话框对每一个变量输对每一个变量输出均值、标准差出均值、标准差和无缺省值的观和无缺省值的观测数。测数。
11、对每一个变量输对每一个变量输出交叉距阵和协出交叉距阵和协方差距阵。方差距阵。计算某个统计量时,在这一对变量计算某个统计量时,在这一对变量中排除有缺省值的观测值。中排除有缺省值的观测值。对于任何分析,有缺省值的观测值对于任何分析,有缺省值的观测值都会被排除。都会被排除。n一般,如果r的绝对值大于0.8,则认为两变量之间具有较强的线性相关关系;如果r小于0.3,则认为两变量之间具有较弱的线性相关关系。当然,相关关系的程度与样本的容量大小也有很大的关系。 例1:为研究高等院校人文社会科学研究中立项课题数会受哪些因素影响,收集1999年31个省市自治区部分高校有关社科方面的数据,研究立项课题数(当年)
12、与投入的具有高级职称的人年数(上年)、发表论文数(上年)之间是否具有较强的线性关系。可以画散点图先进行判断。Graphs-legacy-scatterAnalyze-correlate-Brivariate例例2 2:定序变量的:定序变量的SpearmanSpearman分析实例分析实例 为了研究集团迫使个人顺从的效应,为了研究集团迫使个人顺从的效应,一些研究者用量表和为测量地位欲而设计一些研究者用量表和为测量地位欲而设计的一种量表对的一种量表对1212名大学生进行调查。欲知名大学生进行调查。欲知道对权威主义的评分之间相关的信息,数道对权威主义的评分之间相关的信息,数据如下。据如下。学生学生A
13、 B CDEFGHIJKL权威主义权威主义 265110983412711地位欲地位欲342181110671259权威主义和地位欲评秩权威主义和地位欲评秩1)输入数据,依次单击)输入数据,依次单击AnalyzeCorrelateBivariate,打开,打开Bivariate Correlations对话框对话框2)选择)选择power和和position 变量进入变量进入 Variables框中。框中。3)在)在Correlation Coefficients栏内选择栏内选择Spearman。4)在)在Test of Significance栏选择栏选择Two-tailed。5)选择)选择
14、Flag significant correlation。6)单击)单击Options按钮,选择按钮,选择Mean and standard deviations、Cross-product deviations and covariances、Exclude cases pairise选项。选项。7)单击)单击OK。分析步骤:分析步骤: 从表中可看出,权威主义和地位欲的相关系数从表中可看出,权威主义和地位欲的相关系数为为0.818,这表明权威主义越高的人地位欲也越高。,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为权威主义与地位欲不相关的假设检验值为0.001,否,
15、否定假设,即权威主义与地位欲是相关的。定假设,即权威主义与地位欲是相关的。C Co or rr re el la at ti io on ns s1.000.818*.0011212.818*1.000.001.1212Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N权威主义地位欲Spearmans rho权威主义地位欲Correlation is significant at the .01 level (2-tailed).*. 结果分析:结果分析:C Co or rr re el
16、la at ti io on ns s1.000.667*.0031212.667*1.000.003.1212Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N权威主义地位欲Kendalls tau_b权威主义地位欲Correlation is significant at the .01 level (2-tailed).*. 例例3:定序变量的:定序变量的Kendall分析实例分析实例 仍用前例中的数据(数据文件:权威(仍用前例中的数据(数据文件:权威(Spearman相相关)关).
17、sav) 。操作过程相同,只是在第。操作过程相同,只是在第3)步在)步在Correlation Coefficients栏内选择栏内选择Kendalls选项。结果如下:选项。结果如下: 权威主义和地位欲的相关系数为权威主义和地位欲的相关系数为0.667,这表明权,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为相关的假设检验值为0.003,否定假设,即权威主义与,否定假设,即权威主义与地位欲是相关的。结果类似于地位欲是相关的。结果类似于Spearman分析。分析。(四)Partial过程 n相关分析计算两个变量间的相关系数,
18、分析两个变量间线性关系的程度。但是往往因为第三个变量的作用,使相关系数不能真正反映两个变量间线性程度。例如,可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关程度,这就是偏相关分析。例:立项课题数与发表论文数之间的净相关系数研究。n立项课题数与发表论文数之间有较强的正线性相关系数。但是,这种关系可能掺入了投入高级职称的人年数的影响。投入高职称的人年数与论文数(上年发表)、立项课题数的简单相关系数分别为0.953和0.944,因此,可以把这个变量控制起来,研究立项课题数与发表论文数之间的净相关系数,进行偏相关分析。n【Variables框】用于选入需要进行偏相关分析的变量,
19、至少需要选入两个。可多选。n【Controlling for框】用于选择需要在偏相关分析时进行控制的协变量,如果不选入,则进行的就是普通的相关分析。n【Display actual significince level复选框】用于确定是否在结果中给出确切的P值,一般选中。【Options钮】nZero-order correlations 给出包括协变量在内所有变量的相关方阵。 说明,上年发表的论文数对当年的立项课题数的线性影响非常弱。前面的是属于虚假相关。上机作业五上机作业五n1、以实验、以实验3中保存的中保存的“数据数据8.sav”为例,完为例,完成以下任务:成以下任务:n求出性别与工资等
20、级的列联表,要求按性别求出性别与工资等级的列联表,要求按性别输出百分比,求出相关系数,并进行卡方检输出百分比,求出相关系数,并进行卡方检验,理解所得结果。验,理解所得结果。n2、对居民储蓄数据中的多选项进行列联表、对居民储蓄数据中的多选项进行列联表分析。(要求先定义多选项变量集,用分类分析。(要求先定义多选项变量集,用分类法做频数分析,再选择一个变量,做列联表法做频数分析,再选择一个变量,做列联表分析)分析)n3、试以、试以spss自带的某一个数据文件为例自带的某一个数据文件为例(建议使用(建议使用1991U.S.General Social Survey数据)进行分析,了解变量是否相数据)进行分析,了解变量是否相关,发掘数据中变量间的规律性。关,发掘数据中变量间的规律性。