第五章 SPSS基本统计分析(二).ppt

上传人:hyn****60 文档编号:70750601 上传时间:2023-01-27 格式:PPT 页数:35 大小:562KB
返回 下载 相关 举报
第五章 SPSS基本统计分析(二).ppt_第1页
第1页 / 共35页
第五章 SPSS基本统计分析(二).ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《第五章 SPSS基本统计分析(二).ppt》由会员分享,可在线阅读,更多相关《第五章 SPSS基本统计分析(二).ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第五章第五章SPSS基本统计分析基本统计分析描述性统计分析描述性统计分析5.4 多选项分析(频数分析和交叉分析)多选项问题的概念:多选项问题是根据实际调查的需要,多选项问题的概念:多选项问题是根据实际调查的需要,要求被调查者从问卷给出的若干个可选答案中选择一个要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案。目前,市场研究或许多领域对某事物评价以上的答案。目前,市场研究或许多领域对某事物评价的研究中常常遇到这样的问题。的研究中常常遇到这样的问题。可以选多个,分为限选和不限选:可以选多个,分为限选和不限选:n限选:如在限选:如在1111种工作种类中,选你喜欢的,最多可种工作种类中,选你

2、喜欢的,最多可选选4 4种(种(Var1-Var4)Var1-Var4);求所有人喜欢各种工作的频数求所有人喜欢各种工作的频数或频率。或频率。n不限选:如在所列的不限选:如在所列的2020种电器中,你家所拥有的电种电器中,你家所拥有的电器,不限选(器,不限选(Var1-Var20Var1-Var20),),求所有被调查家庭拥求所有被调查家庭拥有各种电器的频数或频率。有各种电器的频数或频率。5.4.1 多选项问题的分解多多选项二分法及其编码(multiple dichotomies method):多选项二分法是将多选项问题中的每一个答案设为一个SPSS变量,每个变量值有0或1两个取值,分别表示

3、选择了该答案和不选择该答案。如对下面问题有9个可能的答案,每个可选择的答案由一个变量表示,每个变量的值只能有表明“是”和“否”的两个代码0或者1。编号编号 调查内容调查内容 选选 项项 1 1 您您喜欢红色吗喜欢红色吗 是是 否否 2 2 您喜欢橙色吗您喜欢橙色吗 是是 否否 3 3 您喜欢黄色吗您喜欢黄色吗 是是 否否 4 4 您喜欢绿色吗您喜欢绿色吗 是是 否否 5 5 您喜欢青色吗您喜欢青色吗 是是 否否 6 6 您喜欢蓝色吗您喜欢蓝色吗 是是 否否 7 7 您喜欢紫色吗您喜欢紫色吗 是是 否否 8 8 您喜欢黑色吗您喜欢黑色吗 是是 否否 9 9 您喜欢白色吗您喜欢白色吗 是是 否否

4、左边的表格为向顾客发放的颜色左边的表格为向顾客发放的颜色调查,在选择服装时,您喜欢什么颜调查,在选择服装时,您喜欢什么颜色作为主体颜色,在答案的色作为主体颜色,在答案的“”中中打打“”(可多选)(可多选)这是一组问题,每个问题均有两这是一组问题,每个问题均有两个答案,回答者只能选择其中一种。个答案,回答者只能选择其中一种。在建立数据文件时,变量名使用相同在建立数据文件时,变量名使用相同的变量主名,后面加以不同序号组成,的变量主名,后面加以不同序号组成,本组问题的本组问题的9 9个变量名可以是个变量名可以是color1-color1-color9color9。而。而答案的编码规则为:回答答案的编

5、码规则为:回答“是是”变量值为变量值为1 1,回答,回答“否否”变量值变量值为为0 0,其他值为缺失值。,其他值为缺失值。n多选项分类法及其编码选项分类法及其编码(multiple category multiple category method method):多选项分类法中,首先应估计多选项问题最多):多选项分类法中,首先应估计多选项问题最多可能出现的答案个数;然后为每个答案设置一个可能出现的答案个数;然后为每个答案设置一个SPSSSPSS变量,变量,变量取值为多选项问题中的所有可选答案。如上面有关选变量取值为多选项问题中的所有可选答案。如上面有关选择服装的主体颜色,您可以选择喜欢的三种

6、,在提供的择服装的主体颜色,您可以选择喜欢的三种,在提供的1010种答案前上选择。种答案前上选择。1、红 2、橙 3、黄 4、绿 5、青6、蓝 7、紫 8、黑 9、白10说不清 这是一个问题,可以有三个答案。在建立数据文件时,要建立三个变量color1-color3表示回答者选择的三个颜色。如选择结果为1、红、6、蓝、8、黑,则变量color1的值为1,变量color2的值为6,变量color3的值为8。如果采用多选二分法则有6个选项,故应设6个变量,运用0-1编码方法编码,即:1,0,1,0,1,1。如果采用多选分类法,则编码为1,3,5,6,0,0。1 3 5 6问题问题2:择业中考虑的主

7、要因素:择业中考虑的主要因素(多选)(多选)1经济收入经济收入 2专业对口专业对口 3发展前途发展前途 4地理区位地理区位5个人爱好个人爱好 6风险大小风险大小7劳动强度劳动强度 8社会福利社会福利9其他其他编码应为:1,0,1,1,1,0,1,1,0。或1,3,4,5,7,8,0,0,0。1 3 6问题问题3 3:您择业中考虑的主要因素有(限选三项):您择业中考虑的主要因素有(限选三项)1经济收入经济收入 2 专业对口专业对口 3发展前途发展前途 4地理区位地理区位5个人爱好个人爱好 6风险大小风险大小7劳动强度劳动强度 8社会福利社会福利9社会地位社会地位 10其他其他 因为限选三项,故应

8、设三个变量,编码依次因为限选三项,故应设三个变量,编码依次为为1,3,6。5.4.2 多选项分析的基本操作 首先将每个题的若干答案组成一个综合变量即首先将每个题的若干答案组成一个综合变量即变量集变量集(Set)(Set),然后对综合变量的各种取值进行分析。只有通过定义然后对综合变量的各种取值进行分析。只有通过定义多选项变量集,多选项变量集,spssspss才能确定应对哪些变量取相同值的个案数才能确定应对哪些变量取相同值的个案数进行累加。进行累加。n多选项分析在SPSS中是通过Analyze-Multiple Response中的各项功能实现的。1.Define Sets:(1)从左边的变量中将

9、多选变量集的变量选择到variables in sets框中,建立多选二分变量集或多选分类变量集。(2)在variables are coded as框中指定多选变量集中的变量是按照那种方法编码的。Dichotomies表示以多选二分法编码,并在counted value中输入用哪个数值来表示选中该选项。categories表示以多选分类法编码,并在range框中输入变量取值的最小值和最大值。(3)为多选项变量集命名,系统会自动在该名字前加字符$。(4)单击add按钮将定义好的多选项变量集加到mult response sets框中。Spss可以定义多个多选项变量集。2.Frequencies

10、:对多选变量集进行频数分析。从mult response sets中把待分析的多选项变量集选择到tables for框中;3.Crosstabs:对多选变量集与其他变量集或与原基本变量进行交叉表分析。(1 1)选择列联表的行变量并定义取值范围;()选择列联表的行变量并定义取值范围;(2 2)选)选择列联表的列变量并定义取值范围;(择列联表的列变量并定义取值范围;(3 3)选择列联表)选择列联表的控制变量并定义取值范围;(的控制变量并定义取值范围;(4 4)单击)单击optionoption按钮选按钮选择列联表的输出内容和计算方法。择列联表的输出内容和计算方法。Match variable Ma

11、tch variable across response setsacross response sets选项表示,如果列联表的行列选项表示,如果列联表的行列变量均为多选项变量集时,第一个变量集的第一个变变量均为多选项变量集时,第一个变量集的第一个变量与第二个变量集的第量与第二个变量集的第一一个变量作交叉分组,依次类个变量作交叉分组,依次类推。推。结果中:注意结果中:注意Pct of ResponsesPct of Responses(占(占总回答数的总回答数的)和)和Pct of CasePct of Case(占总个案数(占总个案数 )的区别。)的区别。5.4.3多选项分析的应用举例多选项

12、分析的应用举例利用居民储蓄调查数据进行分析,实现以下两个分析利用居民储蓄调查数据进行分析,实现以下两个分析目标:目标:1.分析储户的储蓄目的;分析储户的储蓄目的;2.分析不同年龄段储户的储蓄目的。分析不同年龄段储户的储蓄目的。分析分析1.为进行多选项分析,首先定义名为为进行多选项分析,首先定义名为cxmd的多选项的多选项变量集,其中包括变量集,其中包括a7_1、a7_2、a7_3三个变三个变量,然后对多选项变量集进行频数分析;量,然后对多选项变量集进行频数分析;2.对不同年龄段储户储蓄目的进行分析,采用多选项对不同年龄段储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。交叉分组下的频数分析

13、。5.5 探索分析 Explore1.分析目的和方法分析目的和方法n奇异性:数据过大或过小(找出、分析原因、是否剔除)n分布特征:数据是否来自正态总体n考察方法:统计量和统计图形(箱式图、茎叶图、QQ图)2.一般一般是是考察考察定距变量定距变量3.Analyze+Descriptive Statistics+Exploren分析变量(Dependent List):数值型变量n分组变量(Factor List):分类变量n标识变量(Label Cases by):用某变量的值作为观察值的标识如id选择一个或多个变量选择一个或多个变量进入进入Dependent框框作为作为分析变量,单击分析变量,

14、单击OK可可获得分析变量的一系获得分析变量的一系列基本统计量和图形。列基本统计量和图形。此作为分组变量,可以是字符变量,对此作为分组变量,可以是字符变量,对分析变量的分析将按该变量的观测值进分析变量的分析将按该变量的观测值进行分组分析。可有多个分组变量,这时行分组分析。可有多个分组变量,这时会按多个变量的交叉组合进行分组。会按多个变量的交叉组合进行分组。该框中的变量作为标识该框中的变量作为标识符,在输出诸如异常值符,在输出诸如异常值时,用该变量进行标识,时,用该变量进行标识,只允许有一个标识符。只允许有一个标识符。可同时输出基本统可同时输出基本统计量和图形计量和图形只输出基本统计量只输出基本统

15、计量只输出图形只输出图形Explore 主对话框主对话框输出基本统计量输出基本统计量 均值的置信区间,可键入均值的置信区间,可键入199%的任的任意值,根据该值算出置信区间的上下限。意值,根据该值算出置信区间的上下限。给出中心趋势的给出中心趋势的最大似然比的稳最大似然比的稳健估计量,当数健估计量,当数据分布均匀,且据分布均匀,且两尾较长,或当两尾较长,或当数据中存在极端数据中存在极端值时,可给出比值时,可给出比均值或中位数更均值或中位数更合理的估计。合理的估计。输出最大和输出最大和最小的最小的5个个数,且在输数,且在输出窗口中加出窗口中加以标明。以标明。输出输出5%、10%、25%、50%、7

16、5%、90%和和95%的百分位数。的百分位数。Statistics对话框对话框Statistics子对话框:用于选择需要的描述统计量;子对话框:用于选择需要的描述统计量;descriptives:输出均值、中位数、众数、:输出均值、中位数、众数、5%修正均值、修正均值、估计标准误、方差、标准差、最小值、最大值、全距、四分估计标准误、方差、标准差、最小值、最大值、全距、四分位差、峰度系数及其标准误、偏度系数及其标准误及指定的位差、峰度系数及其标准误、偏度系数及其标准误及指定的均值置信区间;均值置信区间;m-estmators:做集中趋势的最大稳健估计,该统计量:做集中趋势的最大稳健估计,该统计量

17、是利用迭代方法计算出来的,受异常值的影响要小得多。是利用迭代方法计算出来的,受异常值的影响要小得多。如如果该估计量离均值较远,则说明数据可能存在异常值,此时果该估计量离均值较远,则说明数据可能存在异常值,此时宜用该估计量替代均值以反映集中趋势。宜用该估计量替代均值以反映集中趋势。一共会输出四种一共会输出四种m估计量,其中估计量,其中huber适用于数据接近正态分布时,另三种则适用于数据接近正态分布时,另三种则适用于数据中有许多异常值的情况;适用于数据中有许多异常值的情况;outliers:输出五个最大值和五个最小值。:输出五个最大值和五个最小值。percentiles:输出第:输出第5%、10

18、%、25%、50%、75%、90%、95%分位数。分位数。plots子对话框:用于选择需要的统计图;子对话框:用于选择需要的统计图;boxplots复选框:确定箱式图的绘制方式,可以复选框:确定箱式图的绘制方式,可以分组绘制(分组绘制(factor levels together),也可以),也可以不分组绘制(不分组绘制(dependents together),或者),或者不绘制(不绘制(none);descriptive复选框:可以选择绘制复选框:可以选择绘制茎叶图茎叶图(stem-and-leaf)和)和直方图直方图(histogram););normality plot with te

19、st:绘制:绘制正态分布图正态分布图(QQ图),并进行变量是否符合正态分布的检验;图),并进行变量是否符合正态分布的检验;茎叶图茎叶图 (stem-and-leaf)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由“茎茎”和和“叶叶”两部分构成,其图形是由数字组成的两部分构成,其图形是由数字组成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4.树叶上只保留一位数字树叶上只保留一位数字5.5.茎叶图类似于横置的直方图,但又有区别:茎叶图类似于横置的直方图,但又有区别:直直方方图图可可观观察察一一组组数数据据的的分

20、分布布状状况况,但但没没有有给给出出具具体体的的数值数值 茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数值,保留了原始数据的信息数值,保留了原始数据的信息6.6.图图的的下下方方会会标标示示出出茎茎宽宽和和实实际际值值的的倍倍数数,每每行行的的茎茎和和叶叶组组成成的的数数字字再再乘乘以以茎茎宽宽,即即得得到到实实际际数数据据的的近近似似值值如如茎茎宽宽为为1010,则则图图中中的的2.32.3代代表表2323,同同样样在在图图的的下下方方也也会会标标示示出出每片叶子代表的记录数。每片叶子代表的记录数。未分组数据茎叶图例例题某大学数学教某大学数学

21、教师认为,学生学,学生学习数学数学时的焦的焦虑情情绪是影响数学成是影响数学成绩的因素之一。他采用两种不同的教的因素之一。他采用两种不同的教学方式(学生自学、教学方式(学生自学、教师讲授)考察不同焦授)考察不同焦虑水平水平的大学生解决某个数学的大学生解决某个数学问题的成的成绩。首先,通。首先,通过“数学焦数学焦虑水平自水平自评量表量表”筛选出被出被试120名,其中名,其中高焦高焦虑的被的被试60名(称名(称为高焦高焦虑水平水平组),低焦),低焦虑的被的被试60名(称名(称为低焦低焦虑水平水平组)。再把高、)。再把高、低焦低焦虑水平水平组被被试各分成两各分成两组,每,每组30人,分人,分别采用不同

22、的教学方式学采用不同的教学方式学习某个数学某个数学问题(120个被个被试均没有学均没有学习过该数学数学问题)。)。经过同同样的教学的教学时间后,后,对全体被全体被试进行同行同样的数学的数学测验,并采取同,并采取同样的的评分分标准准评定每个学生的数学成定每个学生的数学成绩。是分。是分别对各各组被被试的数学成的数学成绩做探索分析。做探索分析。练习练习 利用居民储蓄调查数据,对一次存款金额变利用居民储蓄调查数据,对一次存款金额变量进行探索性分析。量进行探索性分析。5.6 比率分析5.6.1 比率分析的目的和主要指标比率分析的目的和主要指标 比率分析用于对两变量间变量值比率变化的描比率分析用于对两变量

23、间变量值比率变化的描述分析,适用于述分析,适用于数值型变量数值型变量。例如根据例如根据1999年各地区保险业务情况的数据,年各地区保险业务情况的数据,分析各地区财产保险业务的保费收入占全部业务保分析各地区财产保险业务的保费收入占全部业务保费收入的比例情况。费收入的比例情况。通常的分析可以生成各个地区财产保险业通常的分析可以生成各个地区财产保险业务的保费收入占全部业务保费收入的比率变量,务的保费收入占全部业务保费收入的比率变量,然后对该比率变量计算基本描述统计量(如均然后对该比率变量计算基本描述统计量(如均值、中位数、标准差、全距等),进而刻画比值、中位数、标准差、全距等),进而刻画比率变量的集

24、中趋势和离散程度。率变量的集中趋势和离散程度。SPSS的比率分析除能够完成上述分析外,的比率分析除能够完成上述分析外,还提供了其他相对比描述指标,大致也属于集还提供了其他相对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴,中趋势描述指标和离散程度描述指标的范畴,具体包括:具体包括:(1)加权比率均值(Weighted mean):两两变量均值的比,属集中趋势描述指标。变量均值的比,属集中趋势描述指标。(2)AAD(Average Absolute Deviation)平均绝对离差:是对比率变量离散程度的描述,:是对比率变量离散程度的描述,计算公式为:计算公式为:其中,其中,是比

25、率数,是比率数,M是比率变量的中位数,是比率变量的中位数,N为样本数为样本数相对数或平均数计算平均数的计算相对数或平均数计算平均数的计算相对数(或平均数)用 Y 表示,有 Y=a/b,a、b为总量指标。求各期 Y的平均一般不能采用简单算术平均法,即 因为各期数据Yi 的对比基础 bi 不同,它们对全期总平均水平的影响作用应轻重有别.计算公式:计算公式:1.分别计算其分子、分母的平均数2.对比得:上式实质上等于对各期Y加权算术平均。(3)COD(Coefficient of Dispersion)离散系数:也是对比率变量离散程度的描述,计算:也是对比率变量离散程度的描述,计算公式为:公式为:(4

26、)PRD(Price-related Differential)相关价格微分:是比率均值与加权比率均值的比,:是比率均值与加权比率均值的比,也是比率变量离散程度的描述。也是比率变量离散程度的描述。(5)COV变异系数:用于对比率变量离散程度:用于对比率变量离散程度的描述,分为基于的描述,分为基于均值的变异系数(Mean centered COV)和和中位数的变异系数(Median centered COV)。前者是通常意前者是通常意义下的变异系数,是标准差除以均值;后者定义下的变异系数,是标准差除以均值;后者定义为:义为:5.6.2 比率分析的基本步骤比率分析的基本步骤(1)选择菜单)选择菜单

27、AnalyzeDescriptive StatisticsRadio,出现窗口出现窗口(2)将比率变量的分子选择到)将比率变量的分子选择到Numerator框中,框中,将比率变量的分母选到将比率变量的分母选到Denominator框中。框中。(3)如果做不同组间的比率比较,则将分组变量)如果做不同组间的比率比较,则将分组变量选择到选择到Group Variable框中。框中。(4)单击)单击Statistics按钮指定输出哪些关于比率按钮指定输出哪些关于比率的描述统计量,出现如下窗口:的描述统计量,出现如下窗口:至此,至此,SPSS将自动计算比率变量,并将相关指将自动计算比率变量,并将相关指标

28、输出到输出窗口中。标输出到输出窗口中。报表中的描述性统计分析报表中的描述性统计分析(case summaries)过程case summariescase summaries过程用于按指定的分组变量的不过程用于按指定的分组变量的不同水平进行交叉描述性统计分析。同水平进行交叉描述性统计分析。Analyze-report-case summaryAnalyze-report-case summary进入。进入。variablesvariables框:选择需要进行分析的变量,可多框:选择需要进行分析的变量,可多选;选;grouping variablesgrouping variables框:选择用

29、于分组的变量。框:选择用于分组的变量。如果选择了多个分组变量,则系统会按各个变量如果选择了多个分组变量,则系统会按各个变量的不同取值的交叉组合对汇总变量进行分析。的不同取值的交叉组合对汇总变量进行分析。Display case:Display case:用于确定是否输出详细的记录列表,用于确定是否输出详细的记录列表,下面的三个复选框用于选择具体的输出方式。下面的三个复选框用于选择具体的输出方式。StatisticsStatistics子对话框用于选择一些常用的统计量。子对话框用于选择一些常用的统计量。titletitle子对话框:子对话框:titletitle框:用于定义输出表格的标题,默认标

30、题为框:用于定义输出表格的标题,默认标题为case summaries。caption框:用于给输出表格加上注解文字。框:用于给输出表格加上注解文字。subheadings for totals:用于选择是否给用于选择是否给每个分组均显示所计算统计量的名称;每个分组均显示所计算统计量的名称;exclude case with missing values listwise:用于选择是否在分析中删除带有缺失用于选择是否在分析中删除带有缺失值的变量。值的变量。missing statistics appear as:用于输出用于输出一个字符串,用于在输出结果中表示缺失值。一个字符串,用于在输出结果中表示缺失值。报表中的描述性统计分析举例报表中的描述性统计分析举例1.对居民储蓄调查数据中的居民存款金额按照户口对居民储蓄调查数据中的居民存款金额按照户口和职业进行分类汇总得到均值、中位数及标准差。和职业进行分类汇总得到均值、中位数及标准差。分析:可以使用分析:可以使用split file过程,然后使用过程,然后使用descriptive过程来完成。但是我们用这里的过程来完成。但是我们用这里的case summary过程一步就能完成。过程一步就能完成。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁