SPSS课件第八章相关分析.ppt

上传人:叶*** 文档编号:66111894 上传时间:2022-12-14 格式:PPT 页数:29 大小:261.50KB
返回 下载 相关 举报
SPSS课件第八章相关分析.ppt_第1页
第1页 / 共29页
SPSS课件第八章相关分析.ppt_第2页
第2页 / 共29页
点击查看更多>>
资源描述

《SPSS课件第八章相关分析.ppt》由会员分享,可在线阅读,更多相关《SPSS课件第八章相关分析.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、SPSS课件第八章相关分析一、相关分析的概念一、相关分析的概念相关分析是研究变量间密切程度的一种常用统计方法。线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,通常用r表示。相关系数r没有单位;其值在-1+1之间。当数值愈接近-l或+1之间时,关系愈紧密,接近于0时,关系愈不紧密。对其数值可以从小到大排列的数据才能计算其相关系数。例如不能计算宗教信仰与颜色喜好之间的关系。二、相关系数二、相关系数积矩相关系数(Pearson相关系数)Spearman和Kendall秩相关系数 偏相关系数 1、积矩相关系数(、积矩相关系数(Pearson相关系数)相关系数)l

2、积矩相关系数(又称积差相关系数)适用于等间隔测度,相关系数采用Pearson积矩相关。2、Spearman和和Kendall秩相关系数秩相关系数 Spearman和Kendall秩相关系数是一种非参测度,是根据秩而不是根据实际值计算的秩相关适用于下列资料l不服从双变量正态分布;l总体分布型未知;l用等级表示的资料。Spearman和和Kendall秩相关系数秩相关系数Spearman相关系数是Pearson相关系数的非参形式。是根据数据的秩而不是根据实际值计算的。也就是说,先对原始变量的数据排秩,根据各秩使用相关系数公式进行计算。它适合有序数据或不满足正态分布假设它适合有序数据或不满足正态分布

3、假设的等间隔数据的等间隔数据。相关系数的值范围也是在-1+1之间。绝对值越大表明相关越强。相关系数的符号也表示相关的方向。这两种相关系数的计算必须对连续变量值排秩,对离散变量排序。Spearman和和Kendall秩相关系数秩相关系数l例如,我们可以将一组学生按入学考试成绩和第一学年结业成绩的顺序排队。如果将入学考试成绩的评秩记为X1,X2,Xn,而学年结业成绩的评秩记为Y1,Y2,Yn,我们就可以用秩相关度量来决定X和Y之间的相关性。Ri为第i个X值的秩,Si为第i个Y值的秩。Spearman和和Kendall秩相关系数秩相关系数Kendalls tau-b也是一种对两个有序变量或两个秩变量

4、间的关系程度的测度,因此也属于一种非参测度。以一个例子来进行Kendall秩相关系数的计算。如果两位鉴定家各自以吸引力的大小将7幅抽象派画评定了秩,那么可能知道这些秩评定之间的相符的程度。l依次取观测2(鉴别家2)给出的秩,数出每一个右面在秩次上比自己小的个数,并将这些个数加起来。例如抽象画2的秩为2,其个数是1,因为其右边的只有抽象画5的秩比它小。6个数依次为1,1,0,0,1和0,所以总和为Q3,Kendall秩相关系数则为:R=1-4Q/n(n-1)=1-12/42=0.714 画 号2651437鉴别家11234567鉴别家223146573、偏相关系数、偏相关系数偏相关系数描述的是当

5、控制了一个或几个另当控制了一个或几个另外的变量的影响条件下两个变量间的相关性外的变量的影响条件下两个变量间的相关性。例如:可以控制年龄和工作经验两个变量的影响,估计工资收入与受教育程度之间的相关关系。控制了变量Z,变量X与 Y之间的偏相关,和控制了两个变量 Z1、Z2,变量 X与Y之间的偏相关系数计算公式不同。相似性与不相似性相似性与不相似性 两个或若干变量之间或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度相似性测度用大数值表示很相似,较小的数值表明相似性小。不相似性不相似性使用距离或不相似性来描述。大值表示相差甚远。三、相关系数统计意义的检验三、相关系数统计意义的检验四

6、、相关分析的四、相关分析的 SPSS过程过程 lBivarate(相关分析)命令项调用Correlations过程,按指定项显示变量的描述统计量。计算指定的两个变量间的相关系数,可以选择Pearson相关、Spearman和Kendalls tau-b 相关;同时对相关系数进行检验。检验的零假设是:相关系数为0。可以对检验进行单尾或双尾的选择。给出相关系数为0的概率。lPartial(偏相关分析)命令项调用Partial Corr过程,计算两个变量间在控制了其他变量的影响下的相关系数。可以选择单尾或双尾显著性检验。检验的零假设是:偏相关系数为零。还可以要求计算其他描述统计量。相关分析的相关分析

7、的 SPSS过程过程lDistance(距离分析)命令项调用Proximities 过程,对变量或观测量进行相似性或不相似性测度。因此分析的变量可以是连续变量、表示频数分布的变量,某些测度还可以适用于二值变量。可以对原始数据和计算出的距离数据进行标准化。相关分析的相关分析的 SPSS过程过程说明说明如果需要确定两个变量或若干自变量与因变量具体的函数关系,使用相关分析不能达到目的,必须使用回归分析。如果要将观测量或变量归到确定的类中,必须使用聚类分析中的观测量聚类或变量聚类的相应过程。(一)两个变量间的相关分析(一)两个变量间的相关分析 本节介绍两变量间的相关。包括两个连续变量间的相关和两个等级

8、变量间的秩相关。这两种相关使用同一个命令项Bivarate调用,通过选择不同的分析方法调用不同的分析过程。选择哪一种分析方法要看具体的数据类型。对于连续变量和等级变量选择不同的分析方法。两个变量间的相关分析两个变量间的相关分析Pearson调用correlation过程计算连续变量或等间隔测量的变量间的相关系数。Kendalls tau-b调用Nonpar corr过程计算分类变量间的秩相关。Spearman调用Nonpar corr过程计算斯皮尔曼秩相关。如果参与分析的变量是连续变量,选择Kendalls tau-b或Spearman相关,则系统自动对连续变量的值先求秩,再计算其秩分数间的相

9、关系数。使用系统默认值进行相关分析使用系统默认值进行相关分析 l9621988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的相关分析为例,说明使用系统默认值进行连续变量相关分析的方法。数据编号数据编号data1001。变量包括:income国民收入(亿元),deposit城乡居民储蓄存款余额,number序号,year年份。例一例一Data09-03是银行雇员数据,要求分析起始工资、当前工资、与雇员年龄、受教育水平、工作经验职务等之间是否存在线性关系。例二例二10名学生两科课程的名次排列,要求求出其等级相关系数,检验其显著性。Data1003练习题练习题某妇幼保健医院对33名产妇进行产前检

10、查并得到婴儿体重的原始观测值包括髂前上棘间径(x1),髂脊间径(x2),耻骶外径(x3),坐骨间径(x4),血红蛋白(x5),婴儿体重(X6)等6个指标。试分析各指标的相关系数。Hong1.sav练习题练习题l从下表所给资料分析血小板和出血症的关系。试分析上述资料有无相关关系。病例号123456789101112血小板数12013016031042054074010601260123014402000出血症状Spearman.sav(二)偏相关分析(二)偏相关分析相关分析计算两个变量间的相关系数,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间线性程度。

11、偏相关分析偏相关分析例如身高、体重与肺活量之间的关系。使用使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线均存在较强的线性关系。关系。但实际上实际上,如果对体重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?是否身高值越大,肺活量越大呢?结论是否定的。正是因为身高与体重有着线性关系,体重与肺活量存在线性关系,因此,得出身高与肺活量之间存在较强的线性关系的错误结论。偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。例一分析身高、体重、肺活量间的关系分析身高、体重、肺活量间的关系数

12、据编号数据编号data1004分别调用分别调用bivariate和和partial过程,比较其结过程,比较其结例二四川绵阳地区四川绵阳地区3年生中山柏的数据。年生中山柏的数据。分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度四个气候因素哪个因素有关。Month:月份,hgrow:生长量,temp:月平均气温,rain:月降雨量,hsun:月平均日照时数,humi:月平均湿度。数据编号数据编号data10-05分析变量:hgrow(生长量)与hsun(月平均日照时数)控制变量:humi(月平均湿度)、rain(月降雨量)、temp(月平均气温)练习题练习题289名肝炎患者的检测结果见数据文件“patial_corr.sav,5个变量分别为:“group(肝硬化分类)、“ha(透明质酸)、“ln”(层粘连蛋白)、“hpc3”(三型前胶原)和“ivc”(四型胶原)。其中变量“group”为分类变量,4个变量“ha”、“ln”、“hpc3”和“ivc为定量变量。4个定量变量中,试在固定变量“ln”(层粘连蛋白)和“ivc(四型胶原)的情况下,分析“ha(透明质酸)与“hpc3”(三型前胶原)的相关关系。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 文案大全

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁