《第5章 SPSS基本统计分析.ppt》由会员分享,可在线阅读,更多相关《第5章 SPSS基本统计分析.ppt(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第5章 SPSS基本统计分析5.1 5.1 计算基本描述统计量计算基本描述统计量5.15.1变量的频数统计变量的频数统计5.35.3交叉分组下的频数分析交叉分组下的频数分析5.45.4多选项分析多选项分析5.1计算基本描述统计量计算基本描述统计量一、一、基本描述统计量基本描述统计量二、二、计算基本描述统计量的操作步骤计算基本描述统计量的操作步骤三、三、计算基本描述统计量的其他菜单计算基本描述统计量的其他菜单 选项选项四、四、分组计算描述统计量分组计算描述统计量一、基本描述统计量一、基本描述统计量1.1.描述集中趋势的统计量描述集中趋势的统计量:算算术术平均数平均数 调和平均数调和平均数 几何平
2、均数几何平均数众数众数 中位数中位数2.2.描述离散趋势的统计量描述离散趋势的统计量极差极差 平均差平均差 标标准差(方差)准差(方差)均均值标值标准准误误 3.3.描述分布特征的统计量描述分布特征的统计量偏度偏度 峰度峰度 1.描述集中趋势的统计量(1)均值(mean):a.表示某变量所有变量值集中趋势或平均水平的统计量。b.适用于定距数据。c.特点:利用了全部数据,易受极端值的影响。(2)众数(mode)(在frequency菜单中计算)a.一组数据中出现频数最多的变量值。b.适用于各类数据,主要用于定类数据。c.特点:众数可能不唯一,不受极端值的影响。2.描述离散程度的统计量(1)标准差
3、(standarddeviation-StdDev)(2)方差(variance)(3)极差(range):n最大值(minimum)-最小值(minimum)n极差很小表明所有数据几乎集中在一起n应用于相同样本容量的两组数据离散程度比较3.描述分布特征的统计量(1)偏度(skewness):描述对称程度的统计量偏度为0表示对称;大于0表示正偏差大(右偏),频数最的值比均值小,极值大于均值;小于0表示负偏差大(左偏).3.描述分布特征的统计量(2)峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。峰度为0表示与正态分布峭度相同。大于0表示比正态分布陡,尖峰。小于0表示比正
4、态分布缓;平峰。二、计算基本描述统计量二、计算基本描述统计量 的操作步骤的操作步骤1.打开菜单Analyze-DescriptivesStatistics-Descriptives.,出现窗口;2.选择参加计算的数值型变量到Variables框三、计算基本描述统计量的其三、计算基本描述统计量的其 他菜单选项他菜单选项1.Savestandardizedvaluesasvariables标准化处理变量值2.Option选项四、分组计算描述统计量四、分组计算描述统计量1.菜单选项:DataSplitFile;2.选择拆分变量到GroupsBasedon框中;3.选择输出方式:Comparegrou
5、ps/Organizeoutputbygroups;4.点选Sortthefilebygroupingvariables/Fileisalreadysorted。四、分组计算描述统计量四、分组计算描述统计量5.2 变量的频数分析一、变量频数的描述方法 利用变量的频数分布分析可以方便的对数据按组进行归类整理,形成各观测量的不同水平(分组)的频数分布情况表和图形,以便对数值的数量特征和内部结构状况有一个概括的认识。5.3 变量的频数分析1.频数、百分比有效百分比:各频数占总有效样本数之比累计百分比:各百分比逐级累加结果。2.分位数4分位数(Quartiles)3.统计图形条形图、饼图、直方图二、频
6、数统计的基本步骤n例题现对1991年美国社会调查情况数据进行统计处理,数据文件为SPSS自带 1991U.S.General Society Survy.sav。分析不同年龄(age)和最高受教育年限(educ)各水平的频数分布情况。操作步骤如下:(1)单击 AnalyzeDescriptivestatisticsFrequencies(2)在左侧源变量框中选择一个或多个变量送入Variables(s)中;(3)根据需要选择相应的选择项:Displayfrequencytables选择此项将显示频数分布表。如果你只想画图可以不选择此项。Statistics选择此项,打开统计量选择对话框如图所示
7、。在对话框中选择输出统计量。可选择的统计量分四组,每组中的统计量可以并列选择。PercentileValues栏,百分位数选择项。nQuartiles,输出四分位数。nCutpointsforequalgroups,输出等分点的百分位数(2-100之间)。Dispersion离差栏:nStd.Deviation标准差nVariance方差nRange全距nMinmumnMmaxmunnS.E.mean均数的标准误GeneralTendency中心趋势栏nMean均数nMedian中位数nMode众数nSum算术和Distribution分布参数栏nSkewness正态分布的偏度,同时显示偏度的
8、标准误。nKurtosis正态分布的峰度。如果Skewness与Kurtosis的值为0,那么表示观测量数据的分布非常接近正态分布;如果Skewnes的值为正数,表示数据的分布为正偏态分布,如果Kurtosis的数值为正,那么表明数据的分布要比正态分布具有更尖锐的峰型。Charts统计图形Format设置频数表输出格式。Multiple variables 多变量栏Compare variables,将所有变量结果在一个图形z中输出Organize output by variables,为每一个变量单独输出一个图形。(4)结果分析观察量数合法值百分位数5.4 交叉分组下的频数分析一、交叉分组
9、下的频数分析1.主要任务:(1)编制交叉列联表(2)变量间进行相关性分析一、交叉分组下的频数分析1.交叉列联表两个或两个以上的变量交叉分组后形成的列联表。行变量(Row):表1、2中职称列变量(Column):表1、2中文化程度层变量(Layer):表2中性别一、交叉分组下的频数分析二维交叉列联表(表1)一、交叉分组下的频数分析三维交叉列联表(表2)一、交叉分组下的频数分析交叉列联表单元格中的数据项:(1)观察频数(ObservedCounts)(2)期望频数(ExpectedCounts)RT为行频数合计CT为列频数合计(3)行百分比(RowPercentage)(4)列百分比(Column
10、Percentage)一、交叉分组下的频数分析(5)总百分比(TotalPercentage)(6)剩余(UnstandardizedResiduals)观测频数-期望频数(7)标准化剩余(StandardizedResiduals)一、交叉分组下的频数分析2.行、列变量相关性分析卡方统计量检验行列变量之间是否相关。服从(行数1)(列数1)的卡方分布交叉列联表卡方检验的一些说明:n若交叉列联表中行、列变量应均为定类变量,最好是等距变量n若交叉列联表中20%以上单元格中的期望频数小于5,则一般不宜采用卡方检验。此时卡方检验统计量往往偏大,易于拒绝原假设。可以采用似然卡方检验等方法进行修正。二、交
11、叉分组下的频数分析的操作步骤1.菜单:Analyze-DescriptiveStatistics-Crosstabs,弹出对话框;2.选择行变量到Row框中,选择列变量到Column框中;3.若有其他变量参与分析,作为层控制变量选到Layer框中;4.选择Displayclusteredbarcharts选项,指定绘制频数分布柱形图;Suppresstables表示部输出列联表;二、交叉分组下的频数分析的操作步骤5.单击Cells指定列联表单元格中的输出内容;6.单击Format指定列联表各单元的输出排列顺序;7.单击Statistics指定用哪种方法分析行变量和列变量的关系。5.5 多选项分
12、析一、什么是多选项问题二、分析多选项问题的一般方案三、多选项分析处理多选项问题一、什么是多选项问题例:某地高三学生志愿调查中,为分析学生填报志愿的倾向性,设计了以下问题。按照你的志愿,按顺序依次选择打算报考的三所大学:(1)北京大学(2)清华大学(3)中国人民大学(4)北京理工大学(5)北京师范大学(6)北京外国语大学一、什么是多选项问题1.多选项问题:一道问题有两个或两个以上答案同时出现的问题。2.答案为顺序水准或名义水准,并且允许选择的答案为多个,有两个或两个以上被同时选中。二、分析多选项问题的一般方案1.多选项问题的分解基本思路:将多选项问题分解成几个子问题,设置几个SPSS变量,分别存
13、放描述这些问题的几个可能被选择的答案。2.分解方法(1)多选项二分法:MultipleDichotomiesMethod(2)多选项分类法:MutilpleCategoryMethod2.1多选项二分法将多选项问题中提供的每个可能的答案设为一个SPSS变量,每个变量只有0或1两个取值,分别表示选择该答案和不选择该答案。SPSS变量名变量名标签变量值T1报考北京大学0/1T2报考清华大学0/1T3报考中国人民大学0/1T4报考北京理工大学0/1T5报考北京师范大学0/1T6报考北京外国语大学0/12.2多选项分类法1.估计最多可能同时出现的答案个数;2.为每个答案设置一个SPSS变量,变量取值为
14、多选问题中的可选答案。SPSS变量名变量名标签变量取值V1志愿一1/2/3/4/5/6V2志愿二1/2/3/4/5/6V3志愿三1/2/3/4/5/6二、分析多选项问题的一般方案3.对多选项问题做普通频数分析的困难与多选项问题的分解方法有较大关系。如对T1至T6作频数分析,只能得到各个学校的考生报考情况;对V1至V3作频数分析,只能得到志愿1至3中各学校的报考情况。三、多选项分析处理多选项问题1.基本实现思路:(1)按多选项二分法或多选项分类法将多选项问题分解成若干问题,并设置若干SPSS变量;(2)采用多选项频数分析或多选项交叉分组下的频数分析。三、多选项分析处理多选项问题2.多选项分析的基
15、本步骤(1)定义多选项分析的多选项变量集(2)进行多选项的频数分析(3)进行多选项的交叉列联表分析定义多选项分析的多选项变量集(1)菜单Analyze-MultipleResponse-DefineSets,弹出对话框。定义多选项分析的多选项变量集(2)从数值型变量中将进入多选项变量集的变量选择到VariablesinSet框中。(3)在VariablesAreCodedAs框中指定变量按照哪种方法分解。(4)Name为多选项变量集命名。(5)单击Add按钮将定义好的多选项变量集加到MultResponseSets。进行多选项的频数分析(1)选择菜单Analyze-MultipleRespon
16、se-Frequencies,弹出对话框。(2)从MultResponseSets把待分析的变量集选择到TableFor框中。(3)指定是否处理缺失数据进行多选项的交叉列联表分析(1)选择菜单Analyze-MultipleResponse-Crosstabs,弹出对话框。(2)选择交叉列联表的行变量并定义取值范围。(3)选择交叉列联表的列变量并定义取值范围。(4)选择交叉列联表的分层变量并定义取值范围。(5)单击Option按钮,选择列联表的输出内容和计算方法。5.6 基本统计分析的报表制作一、用户统计报表概述二、制作用户基本报表三、制作普通报表一、用户统计报表概述1.用户统计报表的组成职工
17、工资情况报表主标题男职工副标题列标题注:截止到本年底行标题数据单元文化程度本科专科高中初中职称高级工程师工程师技术员无技术职称一、用户统计报表概述2.用户统计报表的种类基本报表(BasicTables)普通报表(GeneralTables)频数报表(TablesofFrequencies)多选项报表(MultipleresponseTables)二、制作用户基本报表1.SPSS基本报表样式(1)Summary:指代汇总变量(2)Down:指代行控制变量(3)Across:指代列控制变量(4)Separate:指代表控制变量二、制作用户基本报表2.基本报表的功能3.基本操作步骤(1)单击菜单选项
18、:Analyze-Customtables-Basictables.(2)指定汇总变量到Summaries框中。(3)指定行控制变量到Subgroup框中的Down框中。(4)指定列控制变量到Subgroup框中的Across框中。二、制作用户基本报表(4)指定表控制变量到Subgroup框中的Separate框中。二、制作用户基本报表4.制作基本报表的其他选项三、制作普通报表基本报表:只能对汇总变量作同一种或几种统计计算;普通报表:可以对不同的汇总变量分别计算不同的统计量。1.SPSS基本报表样式(1)Rows:指代行控制变量(2)Columns:指代列控制变量(3)Layers:指代表控制
19、变量注:无专门的汇总变量。可指定行、列上的某些变量为汇总变量。三、制作普通报表2.普通报表的功能3.基本操作步骤(1)单击菜单选项:Analyze-Customtables-Generaltables.(2)指定行控制变量到Rows框中。若行维中有用户希望汇总的变量,选中后点击SelectedVariables框中的IsSummarized选项。(3)指定列控制变量到Columns框中。若列维中有用户希望汇总的变量,方法同(2)。三、制作普通报表三、制作普通报表4.其他选项(1)指定变量层次关系:Nest和Unnest选项。(2)OmitLabel选项。(3)InsertLabel选项。(4)StatisticsLabelsAppear框中的选项。