《SPSS第7单元相关分析课件.ppt》由会员分享,可在线阅读,更多相关《SPSS第7单元相关分析课件.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第7单元 相关分析 描述变量之间线性相关程度的强弱,描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程为相并用适当的统计指标表示出来的过程为相关分析。可根据研究的目的不同,或变量关分析。可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。的类型不同,采用不同的相关分析方法。本章介绍常用的相关分析方法:二元定距本章介绍常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分变量的相关分析、二元定序变量的相关分析、质与量的相关、品质相关和偏相关分析、质与量的相关、品质相关和偏相关分析。析。6.1 相关分析的基本概念相关分析的基本概念 任何事物的变化都与其他事物是相
2、互联任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间变量之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数的关系归纳起来可以分为两种类型,即函数关系和统计关系。关系和统计关系。当一个变量当一个变量x x取一定值时,另一变量取一定值时,另一变量y y可以可以按照确定的函数公式取一个确定的值,记按照确定的函数公式取一个确定的值,记为为y=f(x)y=f(x),则称,则称y y是是x x的函数,也就时的函数,也就时说说y y与与x x两变量之间存在函数关系。又如,两变量之间存在函
3、数关系。又如,某种商品在其价格不变的情况下,销售额某种商品在其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:和销售量之间的关系就是一种函数关系:销售额销售额=价格价格销售量。销售量。函数关系是一一对应的确定性关系,比较函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。间的关系往往并不那么简单。相关系数的取值范围在相关系数的取值范围在 1 1和和+1+1之间,即之间,即 1r+11r+1。其中:。其中:若若0 0r1r1,表明变量之间存在正相关,表明变量之间存在正相关关系,即两个变量的相随变动方向相
4、同;关系,即两个变量的相随变动方向相同;若若 1r1r0 0,表明变量之间存在负相,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;关关系,即两个变量的相随变动方向相反;为了判断为了判断r r对对的代表性大小,需要对相关系的代表性大小,需要对相关系数进行假设检验。数进行假设检验。(1 1)首先假设总体相关性为零,即)首先假设总体相关性为零,即H0H0为为两总体无显著的线性相关关系。两总体无显著的线性相关关系。(2 2)其次,计算相应的统计量,并得到)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平,则拒绝
5、于指定的显著性水平,则拒绝H0H0,认为两总体,认为两总体存在显著的线性相关关系;如果相伴概率值大存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝于指定的显著性水平,则不能拒绝H0H0,认为两,认为两总体不存在显著的线性相关关系。总体不存在显著的线性相关关系。在实际中,因为研究目的不同,变量的类型在实际中,因为研究目的不同,变量的类型不同,采用的相关分析方法也不同。比较常不同,采用的相关分析方法也不同。比较常用的相关分析是二元定距变量的相关分析、用的相关分析是二元定距变量的相关分析、二元定序变量的相关分析、质与量相关、品二元定序变量的相关分析、质与量相关、品质相关和偏相关
6、分析。质相关和偏相关分析。6.2 6.2 二元定距变量的相关分析二元定距变量的相关分析 二元变量的相关分析是指通过计算变量间二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相变量类型不同,又可以分为二元定距变量的相关分析和二元定序变量的相关分析。关分析和二元定序变量的相关分析。在二元变量的相关分析过程中比较常用的在二元变量的相关分析过程中比较常用的几个相关系数是几个相关系数是PearsonPearson简单相关
7、系数、简单相关系数、SpearmanSpearman和和Kendalls tua-bKendalls tua-b等级相关系数。等级相关系数。定义:二元定距变量的相关分析是指通过定义:二元定距变量的相关分析是指通过计算定距变量间两两相关的相关系数,对两个计算定距变量间两两相关的相关系数,对两个或两个以上定距变量之间两两相关的程度进行或两个以上定距变量之间两两相关的程度进行分析。分析。定距变量又称为间隔(定距变量又称为间隔(intervalinterval)变量,)变量,它的取值之间可以比较大小,可以用加减法计它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,算出差异的大小。例如,“年
8、龄年龄”变量、变量、“收收入入”变量、变量、“成绩成绩”变量等都是典型的定距变变量等都是典型的定距变量。量。6.2.1 统计学上的定义和计算公式统计学上的定义和计算公式 Pearson Pearson简单相关系数用来衡量定距变量简单相关系数用来衡量定距变量间的线性关系。如衡量国民收入和居民储蓄存间的线性关系。如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。间的线性相关关系。计算公式如下。计算公式如下。PearsonPearson简单相关系数计算公式为简单相关系数计算公式为 对对PearsonPearson简单相关系数的
9、统计检验是计简单相关系数的统计检验是计算算t t统计量,公式为统计量,公式为 t t统计量服从统计量服从n n 2 2个自由度的个自由度的t t分布。分布。6.2.2 SPSS中实现过程中实现过程 研究问题研究问题 某班级学生数学和化学的期末考试成绩如某班级学生数学和化学的期末考试成绩如表表6-16-1所示,现要研究该班学生的数学和化学所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。成绩之间是否具有相关性。表表表表6-16-1学生的数学和化学成学生的数学和化学成学生的数学和化学成学生的数学和化学成绩绩绩绩人 名数 学化 学hxh99.0090.00yaju88.0099.00yu65
10、.0070.00shizg89.0078.00hah94.0088.00smith90.0088.00watet79.0075.00jess95.0098.00wish95.0098.00laly80.0099.00john70.0089.00chen89.0098.00david85.0088.00caber50.0060.00marry87.0087.00joke87.0087.00jake86.0088.00herry76.0079.00 实现步骤实现步骤图图图图6-1 6-1 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“Bivariate”“Bivariate”命令命令命令命令图
11、图图图6-2 “Bivariate Correlations”6-2 “Bivariate Correlations”对话框(一)对话框(一)对话框(一)对话框(一)图图图图6-3 “Bivariate Correlations6-3 “Bivariate Correlations:Options”Options”对话框对话框对话框对话框6.2.3 结果和讨论结果和讨论6.2.4 绘制相关散点图绘制相关散点图 如果对变量之间的相关程度不需要掌握得如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。直接判断
12、。仍以上例来说明。图图图图6-4 6-4 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“Scatter/Dot”“Scatter/Dot”命令命令命令命令 实现步骤实现步骤图图图图6-5 “Scatter/Dot”6-5 “Scatter/Dot”对话框对话框对话框对话框图图图图6-6 “Simple Scatterplot”6-6 “Simple Scatterplot”对话框对话框对话框对话框图图图图6-7 6-7 散点图散点图散点图散点图 结果和讨论结果和讨论6.3 6.3 二元定序变量的相关分析二元定序变量的相关分析6.3.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义
13、:定序变量又称为有序(定义:定序变量又称为有序(ordinalordinal)变量、顺序变量,它取值的大小能够表示观测变量、顺序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),对象的某种顺序关系(等级、方位或大小等),也是基于也是基于“质质”因素的变量。例如,因素的变量。例如,“最高学最高学历历”变量的取值是:变量的取值是:11小学及以下、小学及以下、22初中、初中、33高中、中专、技校、高中、中专、技校、44大学专科、大学专科、55大大学本科、学本科、66研究生以上。由小到大的取值能研究生以上。由小到大的取值能够代表学历由低到高。够代表学历由低到高。Spearman
14、Spearman和和Kendalls tua-bKendalls tua-b等级相关系等级相关系数用以衡量定序变量间的线性相关关系,它们数用以衡量定序变量间的线性相关关系,它们利用的是非参数检验的方法。利用的是非参数检验的方法。计算公式如下。计算公式如下。Spearman Spearman等级相关系数为等级相关系数为 对对SpearmanSpearman等级相关系数的统计检验,一等级相关系数的统计检验,一般如果个案数般如果个案数n30n30,将直接利用,将直接利用SpearmanSpearman等等级相关统计量表,级相关统计量表,SPSSSPSS将自动根据该表给出对将自动根据该表给出对应的相伴
15、概率值。应的相伴概率值。对对Kendalls tua-bKendalls tua-b等级相关系数的统计等级相关系数的统计检验,一般如果个案数检验,一般如果个案数n30n30,将直接利用,将直接利用Kendalls tua-bKendalls tua-b等级相关统计量表,等级相关统计量表,SPSSSPSS将将自动根据该表给出对应的相伴概率值。自动根据该表给出对应的相伴概率值。6.3.2 SPSS中实现过程中实现过程 研究问题研究问题 某语文老师先后两次对其班级学生同一篇某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量作文加以评分,两次成绩分别记为变量“作文作文1”1”和和“
16、作文作文2”2”,数据如表,数据如表6-26-2所示。问两次所示。问两次评分的等级相关有多大,是否达到显著水平?评分的等级相关有多大,是否达到显著水平?表表表表6-26-2学生作文两次的得分情况学生作文两次的得分情况学生作文两次的得分情况学生作文两次的得分情况人 名作 文 1作 文 2hxh86.0083.00yaju78.0082.00yu62.0070.00shizg75.0073.00hah89.0092.00smith67.0065.00watet96.0093.00jess80.0085.00wish77.0075.00laly59.0065.00john79.0075.00chen
17、68.0070.00david85.0080.00caber87.0075.00marry75.0080.00joke73.0078.00jake95.0090.00herry88.0090.00 实现步骤实现步骤图图图图6-8 “Bivariate Correlations”6-8 “Bivariate Correlations”对话框(二)对话框(二)对话框(二)对话框(二)6.3.3 结果和讨论结果和讨论6.4 6.4 质与量的相关和品质相关质与量的相关和品质相关6.4.16.4.1概述概述积距相关适用于两个等距变量或比率变量,等级积距相关适用于两个等距变量或比率变量,等级相关适用于两个
18、顺序变量,而对于一个变量为等相关适用于两个顺序变量,而对于一个变量为等距或比率变量,另一个变量为顺序变量,此时如距或比率变量,另一个变量为顺序变量,此时如果选用等级相关进行分析,由于在计算等级相关果选用等级相关进行分析,由于在计算等级相关时需对等距货比率变量求秩,必然会影响相关分时需对等距货比率变量求秩,必然会影响相关分析的灵敏度和精确度,所以应该选用析的灵敏度和精确度,所以应该选用质与量相关质与量相关进行分析。在教育与心理研究中还常常需要计算进行分析。在教育与心理研究中还常常需要计算两个称名变量或一个为称名变量、另一个为顺序两个称名变量或一个为称名变量、另一个为顺序变量的相关,这时需要用变量
19、的相关,这时需要用品质相关品质相关。品质相关是指两个变量均为称名变量或一个为称名变品质相关是指两个变量均为称名变量或一个为称名变量、另一个为顺序变量的相关。如计算性别(男、女)量、另一个为顺序变量的相关。如计算性别(男、女)与等级制的学科成绩(优、良、中、合格、待合格)与等级制的学科成绩(优、良、中、合格、待合格)的相关,计算学校类别(重点、非重点)与对新学制的相关,计算学校类别(重点、非重点)与对新学制的态度(拥护、反对)的相关等等。的态度(拥护、反对)的相关等等。鼠标单击鼠标单击AnalyzeDescriptive AnalyzeDescriptive StatisticsCrosstab
20、sStatisticsCrosstabs菜单项,打开菜单项,打开CosstabsCosstabs主对话框,主对话框,在左侧变量框中选择一个或多个变量进入在左侧变量框中选择一个或多个变量进入RowRow(s s)框,)框,作为交叉表中的行变量;选择一个或多个变量进入作为交叉表中的行变量;选择一个或多个变量进入ColumnColumn(s s)框,作为交叉表中的列变量。)框,作为交叉表中的列变量。单击单击StatisticsStatistics按钮,打开按钮,打开StatisticsStatistics对话框,对于质对话框,对于质与量的相关,可在与量的相关,可在Nominal by Interva
21、lNominal by Interval栏中选栏中选EtaEta复选复选项,并选中项,并选中CorrelationsCorrelations复选项。而对于品质相关,则复选项。而对于品质相关,则要在要在NominalNominal栏中选栏中选Contingency coefficientContingency coefficient复选项和复选项和Phi and Cramers VPhi and Cramers V复选项。复选项。6.5 6.5 偏相关分析偏相关分析 二元变量的相关分析在一些情况下无法较二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,为真实准确地反映
22、事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。剔除其他相关因素影响的条件下计算相关系数。偏相关
23、分析正是用来解决这个问题的。偏相关分析正是用来解决这个问题的。定义:偏相关分析是指当两个变量同时与定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。只分析另外两个变量之间相关程度的过程。偏相关分析的工具是计算偏相关系数偏相关分析的工具是计算偏相关系数r r1212,3 3。6.4.1 统计学上的定义和计算公式统计学上的定义和计算公式6.4.2 SPSS中实现过程中实现过程 研究问题研究问题 某农场通过试验取得某农作物产量与春季某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如
24、表降雨量和平均温度的数据,如表6-36-3所示。现所示。现求降雨量对产量的偏相关。求降雨量对产量的偏相关。表表表表6-36-3 早稻早稻早稻早稻产产产产量与降雨量和温度之量与降雨量和温度之量与降雨量和温度之量与降雨量和温度之间间间间的关系的关系的关系的关系产 量降 雨 量温 度150.0025.006.00230.0033.008.00300.0045.0010.00450.00105.0013.00480.00111.0014.00500.00115.0016.00550.00120.0017.00580.00120.0018.00600.00125.0018.00600.00130.0020.00 实现步骤实现步骤图图图图6-9 6-9 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“Partial”“Partial”命令命令命令命令 图图图图6-10 “Partial Correlations”6-10 “Partial Correlations”对话框对话框对话框对话框 图图图图6-11 “Partial Correlations6-11 “Partial Correlations:Options”Options”对话框对话框对话框对话框 6.4.3 结果和讨论结果和讨论