SPSS相互分析案例解析讲解.docx

上传人:1564****060 文档编号:96518484 上传时间:2023-12-16 格式:DOCX 页数:15 大小:295.79KB
返回 下载 相关 举报
SPSS相互分析案例解析讲解.docx_第1页
第1页 / 共15页
SPSS相互分析案例解析讲解.docx_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《SPSS相互分析案例解析讲解.docx》由会员分享,可在线阅读,更多相关《SPSS相互分析案例解析讲解.docx(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、.相关分析一、两个变量的相关分析:Bivariate 1相关系数的含义相关分析是争论变量间亲热程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量,通常用 r 表示。相关系数的取值范围在-1 和+1 之间,即:1r 1。计算结果,假设r 为正,则说明两变量为正相关;假设r 为负,则说明两变量为负相关。相关系数 r 的数值越接近于 11 或+1,表示相关系数越强;越接近于0,表示相关系数越弱。假设 r=1 或1,则表示两个现象完全直线性相关。假设=0,则表示两个现象完全不相关不是直线相关。 r 0.3 ,称为微弱相关、 0.3 r 0.5 ,称为低度相关、 0.5 r 0.8 ,

2、 称为显著中度相关、0.8 r 1,称为高度相关r 值很小,说明 X 与 Y 之间没有线性相关关系,但并不意味着 X 与 Y 之间没有其它关系,如很强的非线性关系。直线相关系数一般只适用与测定变量间的线性相关关系,假设要衡量非线性相关时,一般应承受相关指数 R。2. 常用的简洁相关系数1皮尔逊Pearson相关系数皮尔逊相关系数亦称积矩相关系数,1890 年由英国统计学家卡尔皮尔逊提出。定距变量之间的相关关系测量常用 Pearson 系数法。计算公式如下:in (xni=1(x - x)2 n ( y - y)2iii=1r =i=1- x)( yi- y)1(1) 式是样本的相关系数。计算皮

3、尔逊相关系数的数据要求:变量都是听从正态分布,相互独立的连续数据;两个变量在散点图上有线性相关趋势;样本容量n 30 。(2) 斯皮尔曼Spearman等级相关系数Spearman 相关系数又称秩相关系数,是用来测度两个定序数据之间的线性相关程度的指标。当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间的关系亲热程度。它是依据数据的秩而不是原始数据来计算相关系数的,其计算过程包括:对连续数据的排秩、对离散数据的排序,利用每对数据等级的差额及差额平方,通过公式计算得到相关系数。其计算公式为:()6d 2r= 1 -R2n n2 - 1(2) 式中, rR为等级相关系数; d 为每

4、对数据等级之差; n 为样本容量。斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不管两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进展争论。(3) 肯德尔Kendall等级相关系数肯德尔Kendall等级相关系数是在考虑了结点秩次一样的条件下,测度两组定序数据或等级数据线性相关程度的指标。它利用排序数据的秩,通过计算不全都数据对在总数据对中的比例,来反映变量间的线性关系的。其计算公式如下:4iKr= 1 - n(n -1)33式中,rK 是肯德尔等级相关系数;i 是不全都数据对

5、数;n 为样本容量。计算肯德尔等级相关系数的数据要求与计算斯皮尔曼等级相关系数的数据要求一样。3. 相关系数的显著性检验通常,我们用样本相关系数 r 作为总体相关系数的估量值,而 r 仅说明样本数据的 X 与 Y 的相关程度。有时候,由于样本数据太少或其它偶然因素,使得样本相关系数 r 值很大,而总体的 X 与 Y 并不存在真正的线性关系。因而有必要通过样本资料来对 X 与 Y 之间是否存在真正的线性相关进展检验,即检验总体相关系数是否为零即原假设是:总体中两个变量间的相关系数为 0。SPSS 的相关分析过程给出了该假设成立的概率输出结果中的 Sig.。样本简洁相关系数的检验方法为:当原假设

6、H: r = 0 , n 50 时,检验统计量为:0rn - 1Z =1 - r 24当原假设 H: r = 0 , n 50 时,检验统计量为:0rn - 21 - r 2t =(df = n - 2)5式中, r 为简洁相关系数; n 为观测值个数或样本容量。4. 背景材料设有 10 个厂家,序号为 1,2,10,各厂的投入本钱记为 x ,所得产出记为 y 。各厂家的投入和产出如表 7-18-1 所示,依据这些数据,可以认为投入和产出之间存在相关性吗?表 110 个厂家的投入产出单位:万元厂家12345678910投入20402030101020202030产出30604060304040

7、5030705. 操作步骤5-1 绘制散点图的步骤(1) 选择菜单命令“Graphs”“Legacy Dialogs”“Scatter/Dot”,翻开 Scatter/Dot 对话框,如图 1 所示。图 1 选择散点图窗口(2) 选择散点图类型。SPSS 供给了五种类型的散点图。(3) 依据所选择的散点图类型,单击“Define”按钮设置散点图。不同类型的散点图的设置略有差异。简洁散点图Simple Scatter简洁散点图的设置窗口如图 2 所示。图 2 简洁散点图的设置窗口从对话框左侧的变量列表中指定某个变量为散点图的纵坐标和横坐标,分别选入 Y-Axis 和 X-Axis 框中。这两项是

8、必选项。可以把作为分组的变量指定到 Set Markers by 框中,依据该变量取值的不同对同一个散点图中的各点标以不同的颜色或外形。该项可以省略。把标记变量指定到 Label Cases by 框中,表示将标记变量的各变量值标记在散点图的旁边。该项可以省略。从左侧变量列表框中选择变量到 Panel by 框中作为分类变量,可以使该变量作为行Rows或列Columns将数据分成不同的组,便于比较。该项可以省略。选择 Use Chart Specifications From 选项,可以选择散点图的文件模板,单击“File”可以选择指定的文件。单击“Title”按钮可以对散点图的标题进展设置,

9、单击“Options”按钮可以对缺失值以及是否显示数据的标注进展设置。重叠散点图Overlay Scatter重叠散点图能同时生成多对相关变量间统计关系的散点图,首先依据分类变量的不同取值对原始数据进展分类,然后对各分类数据做简洁散点图。重叠散点图的设置窗口如图 7-18-3 所示。图 3 重叠散点图的设置窗口Y-Variable,后一个作为图的横轴变量 X-Variable,可以通过点击按从左侧框中选择一对变量进入 Pairs 框中,其中前一个为图的纵坐标变量钮进展横纵轴变量的调换。其他设置与同简洁散点图都一样。矩阵散点图Matrix Scatter矩阵散点图以方形矩阵的形式在多个坐标轴上分

10、别显示多对变量间的统计关系。矩阵散点图的关键是弄清各矩阵单元中的横纵变量。矩阵散点图的设置窗口如图 4 所示。图 4 矩阵散点图的设置窗口把参与绘图的假设干变量指定到 Matrix Variables 框中。选择变量的先后挨次打算了矩阵对角线上变量的排列挨次。其他设置也与简洁散点图一样。三维散点图3-D Scatter三维散点图生成三个相关变量的三维散点图,由三个坐标轴对应变量的数据打算,它以立体图的形式呈现三对变量间的统计关系。设置窗口如图 5 所示。图 5 三维散点图设置窗口从左侧的变量列表中指定三个变量分别选入 Y-Axis、X-Axis、Z-Axis 框中。其他设置均与简洁散点图一样。

11、单点散点图Sample Dot单点散点图生成单个变量的散点图,显示数值型变量的每一个观测值,这些值都积存在 X 轴四周,由于没有指定Y 轴,所以数据点的Y 坐标没有特别的含义。设置窗口如图 6 所示。图 6 单点散点图设置窗口从左侧变量列表中选择一个变量选入 X-Axis Variable框中。其他设置与简洁散点图一样。5-2 计算简洁相关系数的操作步骤通过散点图可以初步推断变量是否具有线性趋势。对具有线性趋势的变量计算相应的简洁相关系数的步骤如下:1选择菜单命令“Analyze”“Correlate”“Bivariate”,翻开两变量相关分析的对话框,如图 7 所示。图 7 两变量相关分析窗

12、口(2) 选入需要进展相关分析的变量进入 Variables 框,至少需要选入两个, 如选入“投入”、“产出”变量。(3) 在 Correlation Coefficients 复选框中选择需要计算的相关系数。主要有: Pearson 复选框:选择进展积距相关分析,即最常用的参数相关分析; Kendall”s tau-b 复选框:计算 Kendall”s 等级相关系数;Spearman 复选框:计算Spearman相关系数,即最常用的非参数相关分析秩相关。(4) Test of Significance 单项选择框用于确定是进展相关系数的单侧One-tailed或双侧Two-tailed检验,

13、系统默认双侧检验。(5) Flag significant correlations 用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时 P0.05 的系数值旁会标记一个星号,P0.01的则标记两个星号。(6) 单击 Options 按钮,弹出 Options 对话框,选择需要计算的描述统计量和统计分析,如图 8 所示。图 8 两变量相关分析的 Options 子对话框在 Statistics 复选框中定义各变量输出的描述统计量。 Means and standard deviations 选项表示每个变量的样本均值和标准差;Cross-product deviations

14、and covariances 选项表示各对变量的离差平方和、样本方差、两变量的叉积离差以及协方差阵。叉积离差为Pearson 相关系数公式中的分子局部;协方差为叉积离差/n-1。在 Missing Values 单项选择框中定义分析中对缺失值的处理方法,可以是具体分析用到的两个变量有缺失值才去除该记录Exclude cases pairwise,或只要该记录中进展相关分析的变量有缺失值无论具体分析的两个变量是否缺失,则在全局部析中均将该记录去除Excludes cases listwise。(7) 单击“OK”按钮完成设置,提交运行。6. 结果解析依据背景资料,利用表 1 中的数据,建立 S

15、PSS 数据文件,分别将变量投入、产出选入Variables框中,并在Options 子对话框选中Means and standard deviations 选项和 Cross-product deviations and covariances 选项,其他选择默认。结果如表 2、表 3 所示。表2 描述统计量Descriptive Statistics6-1 表 2 为描述统计量,表3 为相关分析结果。从表3 中可以看出皮尔逊相关系数为 0.759,即投入与产出的相关系数为 0.759,双侧检验的 P 值为 0.011, 明显小于 0.05,拒绝二者不相关的原假设。因此,我们可以得出结论:可

16、以认为投入与产出之间存在正相关,当投入增加时,产出也会相应增加。MeanStd. DeviationN投入产出22.0045.009.18914.3371010表3 简洁相关系数分析结果Correlations投入产出投入Pearson Correlation1.759*Sig. (2-tailed).011Sum of Squares andCross-products760.000900.000Covariance84.444100.000N1010产出Pearson Correlation.759*1Sig. (2-tailed).011Sum of Squares andCross-p

17、roducts900.0001850.000Covariance100.000205.556N1010*. Correlation is significant at the 0.05 level (2-tailed).6-2 调用 Bivariate 过程命令时允许同时输入两个变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。二、偏相关分析:Partial 1偏相关分析的含义在实际问题中,两变量的相关关系往往还要受到其他因素的影响,这些影响有时候会使相关分析的结果变得不那么牢靠。因此,引入了偏相关分析的方法。偏相关分析,也称净相关分析,是指在争论两个变量之间的线性相关关系时,将与这

18、两个变量有联系的其他变量掌握不变的统计方法。依据掌握变量的个数,偏相关分析分为零阶偏相关分析、一阶偏相关分析、二阶偏相关分析等等。其中, 零阶偏相关分析是指没有掌握变量的相关分析,即一般的相关分析。一阶偏相关分析是指有一个掌握变量的相关分析,二阶偏相关分析是指有两个掌握变量的偏相关分析,其他高阶偏相关分析以此类推。2. 偏相关系数.进展偏相关分析时要用到偏相关系数。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度的指标。偏相关系数的取值范围亦在-1+1 之间,其计算公式分别为:当有一个掌握变量为 x 时,变量 x 和 y 之间的一阶偏相关系数为:21

19、r=yx x12r- rr(1 - r 2 )(1 - r 2)121 2yx2x x1 2yxyxx x63. 对偏相关系数的检验方法在偏相关分析中,由于两个变量之间的相关系数是在固定掌握了一个或几个变量后进展的,考虑到这种因素及抽样误差的影响,其检验统计量为:rn - k - 21 - r 2t =7式中,r 是特定的偏相关系数;n 为观测值个数;k 为掌握变量个数;n - k - 2为自由度。4. 背景材料某汽车制造商从某月中随机抽出 10 天的电力消耗量、温度、日产量等有关资料,数据如表4 所示。结合多年治理阅历,对电力消耗量、温度、日产量的关系做出相关分析。表 4 某汽车制造商的电力

20、消耗量、温度、日产量等数据表电力消耗千瓦温度华氏日产量1283120117911013851289751011487105108110812841101177107148511211841195. 操作步骤5-1 选择菜单命令“Analyze”“Correlate”“Partial”,翻开偏相关分析的对话框,如图 9 所示。图 9 偏相关分析窗口5-2 选入需要进展偏相关分析的变量进入Variables框中,至少需要选入两个。5-3 选择需要在偏相关分析时进展掌握的协变量进入 Controlling for 框中,假设不选入,则进展的就是一般的相关分析。5-4 在 Test of Signif

21、icance 单项选择框中确定是进展相关系数的单侧One-tailed 或双侧Two-tailed检验,一般选双侧检验。5-5 Display actual significance level 复选框用于表示在结果中给出精准的 P值,一般选中。5-6 单击 Options 按钮,弹出 Options 对话框,选择需要计算的描述统计量和统计分析。如图 10 所示。表5 偏相关系数表CorrelationsControl Variables电力消耗温度图 10偏相关分析的 Options 子对话框(1) Statistics 复选框用于定义可选的描述统计量。其中,Means and standa

22、rd deviations 表示每个变量的样本均值和标准差;Zero-order correlations 表示输出包括掌握变量在内全部变量的相关矩阵。(2) Missing Values单项选择框用于定义分析中对缺失值的处理方法,可以是具体分析用到的两个变量有缺失值才去除该记录Exclude cases pairwise,或只要该记录中进展相关分析的变量有缺失值无论具体分析的两个变量是否缺失,则在全局部析中均将该记录去除(Excludes cases listwise)。系统默认为前者,以充分利用数据。6. 结果解析这里我们选择电力消耗、温度作为待分析变量,把日产量作为掌握变量,在Optio

23、ns 子对话框中选中 Means and standard deviations 选项,其他选择系统默认。具体分析结果见表 4、表 5 所示。表4 偏相关分析描述统计量DescriptiveStatistics6-1 表 5 偏相关系数表中的结果说明,在掌握了日产量变量后,电力消耗与温度之间的偏相关系数为 0.815,概率 P 值为 0.0070.05,从而说明两者之间有高度的相关关系。MeanStd. DeviationN电力消耗11.701.63610温度82.003.88710日产量112.008.08310日产量电力消耗Correlation1.000.815Significance

24、(2-tailed).007df07温度Correlation.8151.000Significance (2-tailed).007.df706-2 表 6 的输出结果是在分析时,除了原有的设置外,在 Options 子对话框中还选中 Zero-order correlations 选项的分析结果。表6 中结果说明,在没有掌握变量的状况下,电力消耗与温度之间的简洁相关系数为 0.838,概率 P 值为0.0020.05,也说明两者之间有高度的相关关系。可见,偏相关分析的结论与简洁相关分析的结论根本全都,但在有些时候,偏相关分析的结论与简洁相关分析的结论可以不全都。6 Correlations

25、Control Variables电力消耗温度日产量-none-a电力消耗Correlation1.000.838.361Significance (2-tailed).002.305df088温度Correlation.8381.000.506Significance (2-tailed).002.136df808日产量Correlation.361.5061.000Significance (2-tailed).305.136.df880日产量电力消耗Correlation1.000.815Significance (2-tailed).007df07温度Correlation.8151.000Significance (2-tailed).007.df70a. Cells contain zero-order (Pearson) correlations.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁