《第7章SPSS相关分析课件.ppt》由会员分享,可在线阅读,更多相关《第7章SPSS相关分析课件.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第7章SPSS相关分析第1页,此课件共53页哦7.1.1 相关的基本概念7.1.1.1 函数关系和相关关系 函数关系是指事物或现象之间存在着严格的依存关系,其主要特征是它的确定性,即对一个变量的每一个值,另一个变量都具有惟一确定的值与之相对应。变量之间的函数关系通常可以用函数式Y=f(x)确切地表示出来。例如,圆的周长C对于半径r的依存关系就是函数关系:C=2r。相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会环境与人民健康的关系等等,都反映出客观现象中存在的相关关系。7.1
2、相关分析概述第2页,此课件共53页哦7.1.1.2相关关系的类型(1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和无相关。(2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。(3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。(4)根据研究变量的多少,可分为单相关、复相关。7.1 相关分析概述第3页,此课件共53页哦7.1.2.1相关分析的作用(1)判断变量之间有无联系(2)确定选择相关关系的表现形式及相关分析方法(3)把握相关关系的方向与密切程度(4)相关分析不但可以描述变量之间的关系状况,而且用来进行预测。(5)相关分析还可以用来评价测量量具的信度、效度以及项
3、目的区分度等。7.1.2 相关分析第4页,此课件共53页哦 相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母表示。相关系数的数值范围是介于1与+1之间(即1 r 1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。如果其绝对值等于零1,则表示两个变量完全直线相关。如果其绝对值为零,则表示两个变量完全不相
4、关(不是直线相关)。7.1.2.2相关系数7.1.2 相关分析第5页,此课件共53页哦 变量相关的方向通过相关系数r所具有的符号来表示,“+”号表示正相关,即0r1。“”表示负相关,即0 r 1。在使用相关系数时应该注意下面的几个问题:(1)相关系数只是一个比率值,并不具备与相关变量相同的测量单位。(2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的数据,计算相关系数的方法也不相同。7.1.2.2相关系数7.1.2 相关分析第6页,此课件共53页哦 简单相关分析是研究两个变量之间关联程度的统计方法。它主要
5、是通过计算简单相关系数来反映变量之间关系的强弱。一般它有图形和数值两种表示方式。1、相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重要方法。利用直角坐标系第一象限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,这就是相关图 7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第7页,此课件共53页哦2、相关系数 虽然相关图能够展现变量之间的数量关系,但这也只是种直观判断方法。因此,可以计算变量之间的相关系数。对不同类型的变量应当采取不同的相关系数来
6、度量,常用的相关系数主要有:皮尔逊(Pearson)相关系数 常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。它的计算公式为:利用相关系数r的大小可以判断变量间相关关系的密切程度,具体见表所示。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第8页,此课件共53页哦7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第9页,此课件共53页哦对皮尔逊简单相关系数的统计检验是计算t
7、统计量,具体公式是:t统计量服从n-2个自由度的t分布。SPSS会自动计算r统计量和t值,并依据t分布表给出其对应的相伴概率值。斯皮尔曼等级相关系数。斯皮尔曼等级相关系数用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:两个变量的变量值是以等级次序表示的资料。一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第10页,此课件共53页哦 从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出
8、优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。斯皮尔曼等级相关系数常用符号 来表示。其基本公式为:式中:D是两个变量每对数据等级之差,n是两列变量值的对数。斯皮尔曼相关系数计算公式可以完全套用皮尔逊相关系数的计算公式,但公式中的x和y用它们的秩次代替即可。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第11页,此课件共53页哦 肯德尔等级相关系数:它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。显然,如果两变量具有较强的正相关,则一致对数
9、目U应较大;但若两变量相关性较弱,则一致对数目U和非一致对数目V应大致相等。故按照此思想,可得其定义为:SPSS将自动计算它的相关系数、检验统计量和对应的概率P值。7.2.1 简单相关分析的基本原理7.2 SPSS在简单相关分析中的应用第12页,此课件共53页哦7.2.2 简单相关分析的SPSS操作详解 Step01:打开主菜单 选择主菜单中的【分析】【相关】【双变量】命令,弹出【双变量相关】对话框,如图7-1所示,这是简单相关检验的主操作窗口。7.2 SPSS在简单相关分析中的应用第13页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第14页,此课件共53页哦Step02:选择检验
10、变量 在【双变量相关】对话框左侧的候选变量中选择两个个或两个以上变量将其添加至【变量】列表框中,表示需要进行简单相关分析的变量。Step03:选择相关系数类型 图中的【相关系数】复选栏可以选择计算简单相关系数的类型。皮尔逊:系统默认项,即积差相关系数,计算连续变量或是等间距测度的变量间的相关分析。肯德尔:等级相关,计算分类变量间的秩相关。斯皮尔曼:等级相关,斯皮尔曼相关系数。对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用
11、斯皮尔曼 或肯德尔相关。7.2 SPSS在简单相关分析中的应用第15页,此课件共53页哦 Step04:假设检验类型选择 在图中的【显著性检验】复选栏可以选择输出的假设检验类型,对应有两个单选项。双尾检验:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相关)时选择此项。单尾检验:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【标记显著性相关)】项。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.2 SPSS在简单相关分析中的应用第16页,此课件共53页哦St
12、ep05:其他选项选择 单击选项按钮,弹出如图7-2所示的【选项】对话框,该对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。统计量:选择输出统计量。均值和标准差:将输出选中的各变量的观测值数目、均值和标准差。叉积偏差和协方差:输出反映选中的每一对变量之间的叉积离差矩阵和协方差矩阵。缺失值:用于设置缺失值的处理方式。它有两种处理方式:按对排除个案:系统默认项。剔除当前分析的两个变量值是缺失的个案。按列表除个案:表示剔除所有含缺失值的个案后再进行分析。7.2 SPSS在简单相关分析中的应用第17页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第18页,此课件共53页哦St
13、ep06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,弹出对话框,在此可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的bootstrap 估计。相关性表支持相关性的bootstrap 估计。选项具体功能请参看本书3-1节的相关部分说明。7.2 SPSS在简单相关分析中的应用第19页,此课件共53页哦Step07:单击确定按钮,结束操作,SPSS软件自动输出结果。7.2 SPSS在简单相关分析中的应用第20页,此课件共53页哦7.2.3 实例分析:股票指数之间的联系1 实例内容 道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 500)都
14、被用做股市全面动态的测度。DJIA是基于30种股票的价格动态;S&P 500是由500种股票组成的指数。有人说S&P 500是股票市场功能的一种更好的测度,因为它基于更多的股票。表7-2显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们DJIA和S&P 500之间的关系是怎样的?7.2 SPSS在简单相关分析中的应用第21页,此课件共53页哦2 实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图(图7-4)可见它们呈显著的线性相关,因此可以采用皮尔逊
15、相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的肯德尔和斯皮尔曼相关系数。7.2 SPSS在简单相关分析中的应用第22页,此课件共53页哦7.2 SPSS在简单相关分析中的应用第23页,此课件共53页哦3 实例结果及分析(1)描述性统计分析表执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果表7-3。可以看到样本容量都等于10,道琼斯工业平均指数和标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。同时,两者的方差差距也很明显。均值均值标准差标准差NDJIA7743.60197.32610SP945.1019.947107.2 SPSS在简单相
16、关分析中的应用第24页,此课件共53页哦(2)皮尔逊相关系数表 接着SPSS列出了道琼斯工业平均指数和标准普尔指数的皮尔逊相关系数表7-4。可以看到,两种指数的皮尔逊系数值高达0.995,非常接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明两者高度正线性相关。DJIASPDJIAPearson 相关性10.995*Sig.(双侧)0.000N1010SPPearson 相关性0.995*1Sig.(双侧)0.000N10107.2 SPSS在简单相关分析中的应用第25页,此课件共53页哦(3)非参数相关系数表 表7-5列出了两种股票指数的肯德尔和斯皮尔曼相关系数,分别等于0.
17、994和0.985;同时它们的概率P值也远小于显著性水平。但本案例中,斯皮尔曼相关系数和肯德尔相关系数都小于皮尔逊相关系数,显然这是由于在秩变换或数据按有序分类处理时损失信息所导致的。所以,通过以上分析看到,道琼斯工业平均指数和标准普尔指数具有高度正相关性,一个指数的上涨或上跌时,另一个指数也会伴随着上涨或下跌。7.2 SPSS在简单相关分析中的应用第26页,此课件共53页哦表7-5 非参数相关系数表DJIASP相关系数1.0000.944*Kendalls tau_bDJIASig.(双侧)0.000N1010相关系数0.944*1.000SPSig.(双侧)0.000N1010相关系数1.
18、0000.985*Spearmans rhoDJIASig.(双侧)0.000N1010相关系数0.985*1.000SPSig.(双侧)0.000N10107.2 SPSS在简单相关分析中的应用第27页,此课件共53页哦7.3.1 偏相关分析的基本原理1、方法概述 简单相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。例如身高、体重与肺活量之间的关系,如果使用皮尔逊相关计算其相关系数,可以得出肺活量、身高和体重均存在较强的线性相关性质。但实际上呢,
19、对体重相同的人而言,身高值越大其肺活量也不一定越大。因为身高与体重有着线性关系,肺活量与体重有着线性关系,因此得出了身高与肺活量之间存在较强的线性关系的错误结论。偏相关分析就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。7.3 SPSS在偏相关分析中的应用第28页,此课件共53页哦2、基本原理 偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。偏相关系数在计算时可以首先分别计算三个因素之间的相关系数,然后通过这三个简单相关系数来计算偏相关系数,公
20、式如下:上式就是在控制了第三个因素的影响所计算的第一、第二个因素之间的偏相关系数。当考虑一个以上的控制因素时的公式类推。7.3 SPSS在偏相关分析中的应用第29页,此课件共53页哦7.3.2 偏相关分析的SPSS操作详解 Step01:打开主菜单 选择主菜单中的【分析】【相关】【偏相关】命令,弹出【偏相关】对话框,如图7-9所示,这是偏相关检验的主操作窗口。7.3 SPSS在偏相关分析中的应用第30页,此课件共53页哦 Step02:选择检验变量 在【偏相关】对话框左侧的候选变量中选择两个或两个以上变量将其添加至【变量】列表框中,表示需要进行偏相关分析的变量。Step03:选择控制变量 在【
21、偏相关】对话框左侧的候选变量中至少选择一个变量将其添加至【控制】列表框中,表示在进行偏相关分析时需要控制的变量。注意如果不选入控制变量,则进行的是简单相关分析。Step04:假设检验类型选择 在【显著性检验】复选栏可以选择输出的假设检验类型,对应有两个单选项。双尾检验:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相关)时选择此项。单尾检验:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【标记显著性相关】项。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.3
22、 SPSS在偏相关分析中的应用第31页,此课件共53页哦Step05:其他选项选择 单击【选项】按钮,弹出如图所示的【选项】对话框,该对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。统计量:选择输出统计量。均值和标准差:将输出选中的各变量的观测值数目、均值和标准差。零阶相关系数:显示零阶相关矩阵,即皮尔逊相关矩阵。缺失值:用于设置缺失值的处理方式。它有两种处理方式:按列表排除个案:系统默认项。剔除当前分析的两个变量值是缺失的个案。按对排除个案:表示剔除所有含缺失值的个案后再进行分析。7.3 SPSS在偏相关分析中的应用第32页,此课件共53页哦图7-10【偏相关:选项】对话框7
23、.3 SPSS在偏相关分析中的应用第33页,此课件共53页哦Step06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,弹出如图所示对话框,在此可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的bootstrap 估计。相关性表支持相关性的bootstrap 估计。选项具体功能请参看本书3-1节的相关部分说明。Step07:单击确定按钮,结束操作,SPSS软件自动输出结果。7.3 SPSS在偏相关分析中的应用第34页,此课件共53页哦7.3.3 实例分析:股票市场和债券市场1 实例内容 在我国的金融市场中,股票市场和债券市场都是其中的重要组成部分。研
24、究它们之间的关系有利于我们弄清楚金融市场之间的关联特征。但是我国债券市场主要由银行间债券市场和证券交易所债券市场组成,并且它们处于相对分割状态,在投资主体、交易方式等方面存在显著差异。文件7-2.sav列出了近几年我国股票市场、交易所国债市场和银行间国债市场的综合指数,请利用相关分析研究这三个市场的关联特征 7.3 SPSS在偏相关分析中的应用第35页,此课件共53页哦2 实例操作 由于这里要研究三个金融市场之间的关系,因此首先可以利用7.2节的简单相关分析来初步探讨它们之间的联系。表7-6计算了这三个市场之间的Pearson相关系数。从表中数据看到,三个市场间的价格相关系数较高,其中交易所和
25、银行间国债市场相关系数高达0.922,而它们和股市的相关系数相对较低,分别是0.411和0.419,从数值大小看到这两个子市场和股市的关联性差异不明显。但是,就相关系数本身而言,它未必是两事物间线性关系强弱的真实体现,往往有夸大的趋势,因为它在计算时都没有考虑第三方的影响,这就有可能导致对事物的解释出现偏差。这里,股市、银行间国债市场和交易所国债市场之间肯定是相互关联的,两个市场间的关系强弱肯定要受到第三方的影响制约,市场间的关系强弱可能存在传递效应。基于这种考虑,这里要引入偏相关系数测度市场间的关系。7.3 SPSS7.3 SPSS在偏相关分析中的应用在偏相关分析中的应用第36页,此课件共5
26、3页哦3 实例结果及分析(1)描述性统计分析表 执行完上述操作后,首先给出的是当前样本进行描述性统计的结果表7-7。可以看到样本容量都等于1321,三个市场综合指数的样本均值和样本方差都有一定的差距。均值均值标准差标准差N股票指数1.6305E3613.147851321交易所国债指数1.0625E25.514771321银行间国债指数1.0765E25.1582413217.3 SPSS在偏相关分析中的应用第37页,此课件共53页哦(2)偏相关系数表 表7-8表7-10列出了三个市场之间的偏相关系数。在控制了股市指数后,银行间和交易所市场间的相关系数没有发生太大变化,仍然高达0.906,说明
27、了这两个市场的关系密切且股市对两市波动影响较小。而银行间国债市场、交易所国债市场与股市的偏相关系数却发生了显著变化:银行间市场和股市的Pearson相关系数为0.419,而在控制了交易所指数后,它们之间的偏相关系数下降为0.114;同理,交易所国债市场和股市的相关系数也由0.411下降到0.070。这说明了第三方市场对剩余两个市场确实存在显著影响,通过简单相关系数还无法深入刻画市场之间的关系。这里引入偏相关系数是比较适合的。7.3 SPSS在偏相关分析中的应用第38页,此课件共53页哦控制变量控制变量股票指数股票指数交易所国债指交易所国债指数数相关性1.0000.070股票指数显著性(双侧)0
28、.011银行间国债指数df01318相关性0.0701.000交易所国债指数显著性(双侧)0.011df131807.3 SPSS在偏相关分析中的应用第39页,此课件共53页哦控制变量控制变量股票指数股票指数银行间国债指银行间国债指数数股票指数相关性1.0000.114显著性(双侧)0.000交易所国债指数df01318相关性0.1141.000银行间国债指数显著性(双侧)0.000df131807.3 SPSS在偏相关分析中的应用第40页,此课件共53页哦控制变量控制变量交易所国债指交易所国债指数数银行间国债指银行间国债指数数相关性1.0000.906交易所国债指数显著性(双侧)0.000股
29、票指数df01318相关性0.9061.000银行间国债指数显著性(双侧)0.000df131807.3 SPSS在偏相关分析中的应用第41页,此课件共53页哦7.4.1 距离分析的基本原理 简单相关分析和偏相关分析有一个共同点,那就是对所分析的数据背景应当有一定程度的了解。但在实际中有时会遇到一种情况,在分析前对数据所代表的专业背景知识尚不充分,本身就属于探索性的研究。这时就需要先对各个指标或者案例的差异性、相似程度进行考察,以先对数据有一个初步了解,然后再根据结果考虑如何进行深入分析。7.4 SPSS在距离分析中的应用第42页,此课件共53页哦 距离分析是对观测量之间或变量之间相似或不相似
30、的程度的一种测度,是计算一对变量之间或一对观测量之间的广义的距离。根据变量的不同类型,可以有许多距离、相似程度测量指标供用户选择。但由于本模块只是一个预分析过程,因此距离分析并不会给出常用的P值,而只能给出各变量/记录间的距离大小,以供用户自行判断相似性。调用距离分析过程可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合程度,也可用于考察变量的相似程度。在距离分析中,主要利用变量间的相似性测度和不相似性测度度量研究对象之间的关系。7.4 SPSS在距离分析中的应用第43页,此课件共53页哦7.4.2 距离分析的S
31、PSS操作详解Step01:打开主菜单选择主菜单中的【分析】【相关】【距离】命令,弹出【距离】对话框,如图7-15所示,这是距离分析的主操作窗口。7.4 SPSS在距离分析中的应用第44页,此课件共53页哦 Step02:选择检验变量 在【距离】对话框左侧的候选变量中选择两个或两个以上变量将其添加至【变量】列表框中,表示需要进行距离分析的变量。同时可以选择一个字符型标示变量移入【标注个案】框中,在输出中将用这个标示变量值对各个观测量加以标记。缺省时,输出中用观测量的序号来标记。Step03:选择分析类型 图【计算距离】复选框可以点选计算何种类型的距离。个案间:系统默认项。表示作变量内部观察值之
32、间的距离相关分析。变量间:表示作变量之间的距离相关分析。7.4 SPSS在距离分析中的应用第45页,此课件共53页哦Step04:测度类型选择 图中的【度量标准】复选框可以点选择分析时采用的距离类型。不相似性:系统默认项。不相似性测距,系统默认采用欧式距离测度观测值或变量之间的不相似性。相似性:相似性测距。系统默认使用Pearson相关系数测度观测值或变量之间的相似性。Step05:单击确定按钮,结束操作,SPSS软件自动输出结果。上述第四步中除了采用系统默认的距离测度类型外,还可以根据用户的需要自己选择测度类型,由于这里专业性很强,而且实际中使用很少,下面只做些简单的介绍。在【距离】对话框中
33、,选择【不相似性】距离类型后,单击Measure,弹出图所示的对话框。7.4 SPSS在距离分析中的应用第46页,此课件共53页哦7.4 SPSS在距离分析中的应用第47页,此课件共53页哦选择【相似性】时各种数据类型可用的测距方法有:区间:计量资料 Pearson correlation:以Pearson相关系数为距离;Cosine:以变量矢量的余弦值为距离,界于-1至+1之间。Binary:二分类变量 Russell and Rao:以二分点乘积为配对系数;简单匹配:以配对数与总对数的比例为配对系数;Jaccard:相似比例,分子与分母中的配对数与非配对数给予相同的权重;骰子:骰子配对系数
34、,分子与分母中的配对数给予加倍的权重;Rogers and Tanimoto:Rogers and Tanimoto配对系数,分母为配对数,分子为非配对数,非配对数给予加倍的权重;Sokal and Sneath 1:Sokal and Sneath 型配对系数,分母为配对数,分子为非配对数,配对数给予加倍的权重;Sokal and Sneath 2:Sokal and Sneath 型配对系数,分子与分母均为非配对数,但分子给予加倍的权重;7.4 SPSS在距离分析中的应用第48页,此课件共53页哦Sokal and Sneath 3:Sokal and Sneath 型配对系数,分母为配对
35、数,分子为非配对数,分子与分母的权重相同;Kulczynski 1:Kulczynski 型配对系数,分母为总数与配对数之差,分子为非配对数,分子与分母的权重相同;Kulczynski 2:Kulczynski平均条件概率;Sokal and Sneath 4:Sokal and Sneath条件概率;Hamann:Hamann概率;Lambda:Goodman-Kruskai相似测量的值;Anderbergs D:以一个变量状态预测另一个变量状态;Yules Y:Yule综合系数,属于22四格表的列联比例函数;Yules Q:Goodman-Kruskal 值,属于22四格表的列联比例函数。
36、Ochiai:Ochiai二分余弦测量;Sokal and Sneath 5:Sokal and Sneath 型相似测量;Phi 4 point correlation:Pearson相关系数的平方值;Dispersion:Dispersion相似测量。7.4 SPSS在距离分析中的应用第49页,此课件共53页哦进行标准化的方法在【标准化】后面的下拉列表中。单击矩形框右面的箭头按钮展开下拉列表,可选择的标准化方法如下:无:不作数据转换,系统默认项;Z得分:作标准Z分值转换,此时均值等于0,标准差等于1;全距从-1到1:作-1至+1之间的标准化转换;全距 0到1:作0至1之间的标准化转换;最大
37、幅度为1:作最大值等于1的标准转换;均值为1:作均数单位转换;标准差为1:作标准差单位转换。【转换值】复选项:选择测度转换方法。在距离测度计算完成后,才进行对测度的转换。共有3 个转换方法可以选择。每种转换方法给出一种转换结果。3 种转换方法可以同时选择。7.4 SPSS在距离分析中的应用第50页,此课件共53页哦绝对值:对距离取绝对值。当符号表明的是相关的方向,且仅对相关的数值感兴趣时使用这种转换。更改符号:改变符号。把相似性测度值转换成不相似性测度值或相反。重新标度到01全距:重新调整测度值到范围01转换法。对已经按有意义的方法标准化的测度,一般不再使用此方法进行转换。7.4 SPSS在距
38、离分析中的应用第51页,此课件共53页哦7.4.3 实例分析:价格指数的相关性1 实例内容 价格指数是用来反映不同时期商品价格水平的变化方向、趋势和程度的经济指标,它属于经济指数的一种,通常以报告期和基期相对比的相对数来表示。价格指数是研究价格动态变化的一种工具,它为制定、调整和检查各项经济政策,特别是价格政策提供依据。表7-11列出了我国1991年2005年间居民消费价格指数、城市居民消费价格指数、农村居民消费价格指数、商品销售价格指数、工业品出厂价格指数、原材料等购进价格指数和固定资产投资价格指数。请研究这些价格指数之间的关系 7.4 SPSS在距离分析中的应用第52页,此课件共53页哦2 实例操作 本案例要讨论居民消费价格指数等七类价格指数之间关联特征。由于这些价格指数的构成复杂,因此可以采用距离分析来探讨它们之间的关系。由于都属于连续型数据,这里可以选择不相似性测距中的欧式距离来测度。7.4 SPSS在距离分析中的应用第53页,此课件共53页哦