SPSS统计软件应用.doc

上传人:飞****2 文档编号:52216426 上传时间:2022-10-21 格式:DOC 页数:9 大小:95.50KB
返回 下载 相关 举报
SPSS统计软件应用.doc_第1页
第1页 / 共9页
SPSS统计软件应用.doc_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《SPSS统计软件应用.doc》由会员分享,可在线阅读,更多相关《SPSS统计软件应用.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 2.1 File:文件管理菜单,有关文件的调入、存储、显示和打印等; 2.2 Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等; 2.3 View:窗口外观控制菜单, 状态栏、工具栏、表格线的显示及隐藏,字体设置等。 2.4 Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等; 2.5 Transform:数据转换处理菜单,有关数值的计算、重新赋值、排序、缺失值替代等; 2.7 Analyze:统计菜单,有关一系列统计方法的应用,比如概括描述、均值比较、相关、回归等分析; 2.7 Graphs:作图菜单,有关统计图

2、的制作; 2.8 Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等; 2.9 Windows:窗口控制菜单,有关窗口的排列、选择、显示等; 2.7 Help:求助菜单,有关帮助文件的调用、查寻、显示等。点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。Missing values:定义缺省值。问卷中有一些特殊情况的编码,如被调查者不回答、打错、不需要填答等情况,要进行缺省值的处理。缺省值又叫用户缺省值(User missing value)No missing values:没有缺省值。 Disc

3、rete missing values:定义13个单一数的缺省值。 Range plus one of optional missing values:定义指定范围为缺省值,同时指定另外一个不在这一范围内的单一数为缺省值。 宽度为1的变量:单项选择题的缺省值一般是0、9,当答案有9选项时,就为0;或设定一个范围也可。多向选择题的缺省值就可设为9,或设定一个范围。宽度为2及以下的变量:缺省值设为99,或设一个范围均可。依此类推,视具体情况而定。 2.在数据浏览窗口输入数据 打开spss输入数据保存。 二、通过foxpro录入数据 特点:适用于大型调查;通用性好;输入速度快;易于修改。 1.建库

4、create *dbf(此处要定义变量名、类型及宽度) 变量名称 变量类型 宽度。 小数位数。 2.操作 append 加数字 append from 合盘 edit 编辑 browse 浏览 delete 删除 insert 插入 3.存盘并转换为spss数据格式 导出到foxpro2.0版本,然后在spss窗口打开foxpro2.0版本的数据表,在file里点击save as,把新的数据文件保存在制定的位置即完成数据转换。 4.定义变量的其它属性 Label: 变量标签,解释变量的含义。Values: 对标签进行定义。 Missing values:定义缺省值。Columns:定义数据管理

5、器纵列的长度 Align:字符排序方向。Measure:数据亮度选择。第二章:统计中常用的数据编辑第一节:个案查找、排序与选择 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统提供了如下主要方法。 一、个案查找 Data Go to Case 二、个案排序 Cases排序是重新排列数据行的先后次序,即以人为指定的某个变量值为基准进行升序排序Cases(默认方式)或降序排序Cases。步骤: (1)单击Data - Sort Cases; (2)单击需排序的变量右箭头,让所选变量进入Sort by文本框内。 (3)Sort Order有2个含义: Ascendi

6、ng升序排序,此为默认方式;Descending降序排序。 (4)单击图中的OK按钮,显示排序结果。 注意:用户也可选多个变量,当多个变量同时排序时,系统将按变量选择的先后逐级依次排序,即SPSS将先根据第1个变量排列数据行,当第1个变量值相同时再根据第2个变量值排序。 三、选择个案 如何在一个数据库或一个目标数据文件中限选部分个案(Some Cases)进行统计分析。这是常用的按部门或按地区的统计方法。 1.几种常见的选择个案情况: All cases :表示所有的观察例数都被选择,该选项可用于解除先前的选择; If Condition is Satisfied :表示按指定条件选择,限选某

7、个子总体进行统计; Random sample of cases:表示提取随机样本进行统计; Based on time or case range:表示按照顺序限选一定范围内的Cases统计; Use filter variable:表示用指定的变量作过滤,用户先选择1个变量,系统自动在数据管理器中将该变量值为0的观察单位标上删除标记,系统对有删除标记的观察单位不作分析。 若用户在Select Cases对话框的Unselected Cases Are框中选Deleted项,则系统将删除所有被标上删除标记的观察单位。 没有选中的个案处理:filtered(过滤)或deleted(删除) 调用

8、Select Cases命令完成定义后,SPSS将在主窗口的最下面状态行中显示Filter On字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示Filter On字样,意味着数据选择命令依然有效。 2.限选某个子总体进行统计 限选某个子总体是指限选数据库或目标数据文件中某类个案的数据进行统计。 步骤:1)单击Data中的Select Cases按钮进入对话框; 2)从对话框中选择If Condition is Satisfied命令按钮,单击If按钮,进入设置表达式; 3)在设置表达式的文本框中按照选取的需要输入表达式,单击Continue按钮;4)单击OK按钮

9、确认选择并显示结果。 说明:如选择filtered,则被打上斜杠/的Cases是落选的。 3.提取随机要本进行统计 提取随机样本,是从数据库或目标数据中提取一定比例的数据行(Cases)进行统计分析。 例3:目标数据共有72个Cases,要求随机抽取30%的Cases进行样本统计。 步骤: 1)单击Data,进入Select Cases对话框; 2)单击对话框中的中的“Random sample of cases” 下面的“Sample”按钮,进入抽样类型对话框,输入需要的抽样要求后,点击Continue - OK按钮,获得结果。 4.限选一定范围内的若干个Cases 限选一定范围内的n个Ca

10、ses是指依次选择数据文件中若干连续的Cases进行统计,比如需要限选前30个,或后30个或其他范围的进行统计。 步骤: 1)单击Data中的Select Cases按钮进入对话框; 2)从对话框中选择Based on time or case range下的range按钮,进入设置范围对话框; 3)输入个案的选取范围,点击Continue - OK按钮,获得结果。 第二节:数据的增删、合并与拆分 一、数据的增删 1.增加一个新的变量列 例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第2列的任一单元格,然后选Data菜单的Insert Variable命令项,系统自动

11、为用户在第2列前插入一个新的变量列,原第2列自动向右移一列成为第3列。 Data Insert variable 2.增加一个新的个案 例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的第6行下移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的Insert Case命令项,系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。 Data Insert Case 3.删除一个个案 例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头,这时整个第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Cl

12、ear命令项,该行即被删除。 4.删除一个变量列 例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该列即被删除。 二、合并数据 1.合并个案 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用Add Cases对话框完成,相互合并的数据文件中应该有相同的变量。 Data C Merge files C Merge cases C 选中需要合并的数据文件(在Add Cases对话框中,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名

13、(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicate case source as variable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。) C OK即可。2.合并变量 从外部数据文件增加变量到当前数据文件,称为横向合并,用Add Variable对话框完成,相互合并的数据文件中应包含同样的记录。 Data C Merge files C Merge variablesC 选中需要合并的数据文件C OK即可。 三、数据的拆分Data C Split File 用于将数据文件分组进行处理: A

14、nalyze all cases:和下面的两个单选框为一组,选中本框不拆分文件; Compare groups:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较; Organize output by groups:按所选变量拆分文件,各组分析结果单独放置; Groups based on框:用于选择拆分数据文件的变量; Sort the file by grouping variables:将数据按所用的拆分变量排序; File is already sorted:数据保持原状,不按所用的拆分变量排序。第三章:常用的数据转换第一节:数据的运算与缺失值的替代 一、数据的运算与新变量的生成

15、 如果原始数据中只有月收入变量,但在统计中需要计算年收入,则应创建新变量来表示年收入,它等于月收入乘以12,类似的很多。这些都可以通过compute 命令实现。 1.步骤: 1)单击spss菜单行中的transform,进入compute对话框,Compute.命令项既可对选定的变量进行运算操作,又可通过运算操作让系统生成新的变量。 2)在弹出的Compute Variable对话框中,首先在Target Variable指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后点击Type & Label.钮确定是数值型变量,还是字符型变量,或加上变量标签; 3)在Nume

16、ric Expression框中键入运算公式,系统提供计算器和82种函数(在Functions框内)让用户使用; 若点击If.钮会弹出Compute Variable:If Cases对话框,用户可指定符合条件的变量参与运算。 4)点击OK钮即可在数据管理器中产生一个新变量。 二、缺失值的替代 对于缺失值,可采取多种手段进行科学替代。 1.选Transform菜单的Replace Missing Values.命令项; 在弹出的Replace Missing Values 对话框中,先在变量名列中选1个或多个存在缺失值的变量点击钮,使之进入New Variable(s)框,这时系统自动产生用于

17、替代缺失值的新变量; 2.点击Method的下箭头选择缺失值的替代方式: 1)Series mean: 用该变量所有非缺失值均数做替代; 2)Mean of nearby points:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义; 3)Median of nearby points:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义; 4)Linear interpolation: 用缺失值相邻两点非缺失值的中点值做替代; 5)Linear trend at point:用线性拟合方式确定替代值。 第二节:数据重新编码 在数据管理器中,用户可对各单元的数值重新

18、赋予新值。 选Transform菜单的Recode命令项,此时有两种选择: 一是对变量自身重新赋值(Into Same Variables.); 二是对新生成的变量进行赋值(Into Different Variables.)。 一、对变量自身重新赋值(Into Same Variables.) 步骤: 1.单击spss菜单行中的transform,进入recode对话框; 2.单击对话框中的In to Same Variables ; 3.在弹出的Recode into Same Variables对话框中,先在变量名列中选1个或多个变量点击钮使之进入Numeric Variables框;

19、4.点击Old and New Values.钮,弹出Recode into Same Variables:Old and New Value对话框,用户根据实际情况确定旧值和新值; 5.点击Continue钮返回,再点击OK钮即可。 二、对新生成的变量进行赋值(Into Different Variables.) 1.单击spss菜单行中的transform,进入recode对话框; 2.单击对话框中的In to Different Variables; 3.在弹出的Recode into Different Variables对话框中,先在变量名列中选1个或多个变量点击钮,使之进入Nume

20、ric Variable Output Variable框,同时在Output Variable框确定一赋值变量,命名后点击Change按钮; 4.点击Old and New Values.钮,弹出Recode into Different Variables : Old and New Value对话框,用户根据实际情况确定旧值和新值; 5.点击Continue钮返回,再点击OK钮即可。 在两种赋值情况下,用户均可点击If.钮指定条件来确定观察单位。 与Compute方法不同的是:Recode方法不能进行运算,只能根据指定变量值作数值转换,且这种转换是单一数值的转换。第四章:频数分布与描述统

21、计 初学者具备了前几章的预备知识并获得原始数据或可执行的*.sav目标数据之后,接下来可进行统计分析。 统计分析的第1步是采用SPSS的Frequencies过程,计算变量的频次分布。比如某次调查中,需要统计男性人数、女性人数、男女性别比例、婚姻状况、人均收入等。 本章综合运用Frequencies和Descriptives过程进行完整的描述统计。第一节:选用Frequencies过程进行频次统计 Frequencies过程既可统计频次分布,又可简单探测数据的真伪。比如,当在频率表中看出sex=3(非男非女)时,可以立即断定数据输入有误。 一、 数据准备 打开数据管理窗口,即打开需要进行统计的

22、原始数据。 二、统计分析过程 1.激活Descriptive Statistics菜单,选其中的Frequencies.命令项,弹出Frequencies对话框; 2. 在对话框左侧的变量列表中选择要统计的变量名,点击 钮使之进入Variable(s)框; 3.点击Statistics.钮, 选择SPSS展示的各种统计量 在弹出的Frequencies: Statistics对话框中,可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算,选好后点击Continue钮返回Frequencies对话框。 SPSS展示的16种统计量的详解: P

23、ercentile Values:用于百分比的计算。 Quartiles 四分位的百分比。 Cut points for数据的等分。默认为10等分。 Percentiles百分位数的值。如测量20%、40%、60%、80%、100%位的值。 Dispersion:离散趋势测量的统计量。 Std.deviation 标准偏差,标准差。Varince 方差。方差等于标准偏差的平方。Range 全距。Minimum 数据的最小值。Maximum 数据的最大值。 S.E.mean 均值的标准误差。 Central Tendency:集中趋势测量的统计量。 Mean 均值。Median 中位数。Mode

24、 众数。Sum 和数。 Values Are group Midpoints:数据的组心。Distribution:形状(分布)测量的统计量。 Skewness 偏态系数或称偏度。Kurtosis 峰态系数或称峰度。 4.选择Charts画图 单击Charts按钮进入,在弹出的Frequencies: Charts对话框中, SPSS默认为无图形输出。但可根据数据类型选择条形图、直方图或圆形图。图形中的数值比较,可以采用百分比比较,也可以采用频次比较,默认为彩用百分比比较。点击Continue钮返回Frequencies对话框。 5.单击“Format”命令按钮,指定输出的格式。 Format

25、对话框主要用于指定频率表的输出格式。其中,Order by选项框中的4个格式是常用的,分别是: Ascending values:按照数据编码升序显示频率表;Descending values:按照数据编码降序显示频率表。 Ascending counts:按照观察值的频次,升序显示频率表;Descending counts:按照观察值的频次,降序显示频率表; 注意:选择默认的Ascending values(数值递增)为妥。 三、统计结果解释 1.系统对变量的原始数据作频数分布表,Frequency为频数、Percent为各组频数占总例数的百分比、Valid percent为各组频数占总例数

26、的有效百分比、Cum Percent为各组频数占总例数的累积百分比; 2.输出各基本统计指标,如均数, 标准误, 中位数, 众数等; 3.最后系统输出数据分布形状图表。 第二节:采用Descriptives过程描述数据 Frequencies过程用于数字型变量或字符串型变量的数据汇总,汇总时可统计出:(1)均值、(2)标准偏差、(3)最小值、(4)最大值、(5)众数、(6)中位数、(7)均值的标准误差、(8)方差、(9)偏态系数、(10)偏态系数的标准误差、(11)全距(Range)、(12)峰态系数、(13)峰态系数的标准误差、(14)求和等14种统计量。Frequecies过程还可画出数据

27、的圆形图、余形图、直方图。 Descriptives过程则用于区间型(定距)数距和比例型(定比)数据的数据汇总,汇总时可统计出上述除“众数、中位数”以外的12种统计量。 一、 Descriptives过程的最佳功能 Descriptives过程虽然不能画出圆形图、条形图、直方图,但在只需要统计量而不要频率表及图形的情况下,反而显得简捷易行。所以,Descriptives更适合对区间以上变量进行数据分析。Descriptives过程的最佳功能在于,它能计算变量的标准分。 二、在对话话中进行Descriptives的描述统计 采用Descriptives对话框进行描述统计的步骤如下: 1.打开目标

28、数据文件; 2.激活Statistics菜单选Descriptive Statistics中的Descriptives.命令项; 3.弹出Descriptives对话框中,在对话框左侧的变量列表中选择要进行描述性分析的变量,点击 钮使之进入Variable(s)框; 4.点击Options.钮,弹出Descriptives:Options对话框,框中各指标的意义与本章本章第一节一致; 5.选好项目后点击 Continue钮返回Descriptives对话框,再点击OK钮即可。 第五章:列联表分析 一、定类定类型 1.打开目标数据文件,进入Analyze主菜单; 2.激活Statistics菜单

29、选Descriptive Statistics中的Crosstabs命令项; 3.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Row(s)框,作为分布表中的行变量; 4.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Column(s)框,作为分布表中的列变量; 5.单击statistics按钮,打开statistics对话框,选择要进行分析的统计量。 1)Chi-square选项,可以输出四中检验结果: 一是行、列变量相互独立的皮尔逊卡方检验系数,是常用的检验方法; 二是似然比卡方检验,用于对数线性模型的检验; 三是费雪精确检验

30、,当样本小于20时效果很好; 四是耶茨校正卡方检验,为卡方检验的校正值,总小于卡方值。 2)Nominal栏,适用于定类变量的统计量 Contingency coefficient选项,描述两个变量之间关联性高低的统计量;其数值在01之间,0表示行列变量之间没有关联,接近1表示行列之间有很强的关联。其值的大小与行列数目的多少有关。 Phi and Cramer V 选项,用来表示两个变量之间关联性高低的统计量。 Lambda 选项,01之间,0表示自变量不能预测因变量,1表示自变量能完全预测因变量。 Uncertainty coefficient 选项,不确定性系数,表示使用一个变量的值来预测

31、其他变量的值可能发生的错误。不确定系数越接近于1,表明从第一个变量获得的有关第二个变量的值的信息越多,越接近于0,则相反。 6.单击cells按钮,打开cells对话框,选择行列显示结果。 6.1counts计数栏:观察值和预期值; 6.2percentages百分比栏 在交叉汇总列表中,行和列都可以相互交换位置,因此没有严格意义上的自变量和因变量。但如果已经有了研究的自变量和因变量,一般情况下: 如果自变量是行变量,则选择行百分比作比较;如果自变量是列变量,则选择列百分比作比较。 7.观察统计结果 二、定类定序型交叉分析第五章:等级相关分析 一、步骤: 1.打开目标数据文件,进入Analyz

32、e主菜单; 2.激活Statistics菜单选Descriptive Statistics中的Crosstabs命令项; 3.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Row(s)框,作为分布表中的行变量; 4.弹出Crosstabs对话框中,在对话框左侧的变量列表中选择一个或多个变量进入Column(s)框,作为分布表中的列变量; 5.单击statistics按钮,打开statistics对话框,选择要进行分析的统计量。1)Chi-square选项,可以输出四中检验结果2) ordinal by ordinal 栏,适用于定序定序型的统计量 Gamma系数

33、是一个定序定序变量间的统计系数值,范围在-11之间。绝对值越接近1,表明两个变量之间高度关联,越接近0,表明关联度越低。6.对统计结果进行分析 第七章:相关分析第一节:简单线性相关分析的概念 1、两个变量间的简单线性相关分析 相关分析是研究变量音密切程度的一种常用统用方法。线性相关分析研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,通常用r表示。 如果一个变量Y可以确切地用另一个变量X的线性函数表示,这种关系是确切的,则两个变量间的相关系数是1或-1。一般情况下,相关系数在11之间。 一般情况,两个变量的对应关系不具有唯一性。例如身高与体重的关系,相同身高的人会有不

34、同的体重。研究他们之间线性关系的密切程度使用相关分析。研究它们之间的因果关系使用回归分析。 2.相关分析的SPSS过程 在Analyze下拉菜单中的Correlate命令项具有三个相关分析功能命令。 Bivariate命令项调用Correlations过程和Nonparcorr过程。 Partial命令项调用Partial Corr过程。 Distance命令项调用Proximities过程。第二节:两个变量间的简单相关分析 两两变量间的相关,包括两个连续变量间的相关和两个等级变量间的秩相关。 在进行相关分析之前,应该使用graphs菜单中的Scatter命令做散点图,进行初步观察,确认两个变

35、量间有相关趋势,再按下列步骤进行相关分析。 1、建立数据文件 2、选择分析变量 按Analyze Correlate Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,如图所示。在主对话框左面的变量表中选择变量。 3、Correlation Coefficients栏中列出相关分析类型,有三个选择项: (1)Pearson皮尔逊相关,系统默认的相关分析方法。只有正态分布的等间隔测度的变量才使用这种相关分析。 (2)Spearman斯皮尔曼相关,调用Nonpar corr过程计算分类变量间的期皮尔曼秩相关系数。 (3)Kendalls tau-b肯德尔-b,调用Nonpar cor

36、r过程计算定序型变量间的相关,考虑结点的影响。 4、Test of Significance栏,显著性检验选择项 (1)Two-tailed 双尾t检验,系统默认的检验方式,当事先不知道相关方向(正相关还是负相关)时选择此项。 (2)One tailed单尾t检验,如果事先知道相关方向可以选择此项。 无论选择以上哪一个选择题,均显示假设成立的概率水平。针对的零假设是:总体中两个变量不相关。 5、Flag significant correlations,要求在输出结果中,相关系数右上方使用“*”表示显著性水平为5%,用“*”表示其显著性水平为1%。 6、Options 对话框中的选择项 在主对

37、话框中单击Options 按钮,展开Options对话框。 (1)统计量选择项 在Statistics栏中有两个有关统计量的选择项,只有在主对话框中选择了Pearson相关分析方法时才可以选择这两个选择项。Means and standard deviations 要求设计算并输出均值与标准差。Cross-product deviations and covariances要求计算并输出叉积离差阵和协方差阵。 (2)缺失值处理方法选择项 Exclude cases listwise选项剔陶所有带有缺失值的观测量。系统默认此项。 Exclude cases pairwise选项成对剔除带有缺失值

38、的观测量。 选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。 例1:简单相关分析例题 以19621988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析为例。见data-7-01。 首先,建立H0:1962年1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间不相关。 操作步骤: 1、建立或打开数据文件 2、选择分析变量 按Analyze Correlate Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,在源变量栏中选择分析变量deposit和income,单击向右箭头按钮,将分析的变量移至variables矩形框中。 3、选择P

39、earson皮尔逊相关,系统默认的相关分析方法。 4、Test of Significance栏,显著性检验选择项 (1)Two-tailed 双尾t检验,系统默认的检验方式,当事先不知道相关方向(正相关还是负相关)时选择此项。 (2)One tailed单尾t检验,如果事先知道相关方向可以选择此项。 5、Flag significant correlations,要求在输出结果中,相关系数右上方使用“*”表示显著性水平为5%,用“*”表示其显著性水平为1%。 6、在Options 对话框中选中Means and standard deviations 要求设计算并输出均值与标准差;在缺失值处

40、理方法选择项中采用Exclude cases listwise选项剔出所有带有缺失值的观测量。系统默认此项。 7.选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。 8.结果分析 通过统计结果发现,国民收入和存款余额的相关系数为0.975,显著度=0.001,明显小于0.01,说明国民收入和存款余额之间是高度相关的。 例2:生成矩形相关矩阵的简单相关例题 以一组银行雇员数据为例,见data-7-2。要求观察起始工资和现工资与雇员本人各方面条件的关系。变量有:起始工资、现有工资、年龄、工作时间、以前工作经验。 首先建立假设 其次,操作步骤: 1、建立或打开数据文件 2、

41、选择分析变量 按Analyze Correlate Bivariate顺序单击菜单项,展开二元变量相关分析主对话框,在源变量栏中选择分析变量需要统计的变量,单击向右箭头按钮,将分析的变量移至variables矩形框中。 3、选择Pearson皮尔逊相关; 4、选择Two-tailed 双尾t检验; 5、选中Flag significant correlations复选项 ; 6、在Options 对话框中选中Means and standard deviations 要求设计算并输出均值与标准差;在缺失值处理方法选择项中采用Exclude cases listwise选项剔出所有带有缺失值的观

42、测量。 7.选择完成后,单击Continue按钮返回主对话框。单击OK按钮提交系统执行。 8.结果分析 表中皮尔逊相关系数虽然均很小,但是双尾检验表明: (1)当前工资与工作时间不相关(sig.=0.0670.05),当前工资与年龄呈负相关(sig.=0.001),当前工资与以前工作经验呈负相关(sig.=0.034)。 (2)起始工资分析与(1)同理。第三节:偏相关分析 1、偏相关分析 简单相关分析计算两个变量间的相关系数,分析两个变量线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。 偏相关分析就是排除其他变量干扰后所测量到的两个变量真正的相关系数,即偏

43、相关分析是控制“第三者”后所获得的甲乙二者的“净”相关系数。 例如身高、体重与肺活量之间的关系如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?结论是否定的。正是因为身高与体重有着线性关系,体重与肺活量存在线性关系,因此,得出身高与肺活量之间存在着较强的线性关系的错误结论。 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。实际生活中有许多这样的关系,例如可以控制年龄和工作经验两个变量的影响,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁