《SPSS17中文版统计分析典型实例精粹教学文稿.doc》由会员分享,可在线阅读,更多相关《SPSS17中文版统计分析典型实例精粹教学文稿.doc(109页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Good is good, but better carries it.精益求精,善益求善。SPSS17中文版统计分析典型实例精粹-SPSS17中文版统计分析典型实例精粹目录第一篇SPSS17基础知识第1章SPSS17入门.31.1SPSS软件的特点.31.2SPSS的组成与安装.41.2.1SPSSforWindows17.0的模块介绍.41.2.2SPSSforWindows17.0的安装步骤.51.3SPSS的运行方式.101.4SPSS的主要界面.101.4.1SPSS的启动.101.4.2SPSS的数据编辑窗口.111.4.3SPSS的结果输出窗口151.5本章小结.18第2章数据的
2、基本操作.192.1建立数据文件.192.1.1输入数据建立数据文件.192.1.2直接打开其他格式的数据文件.202.1.3使用数据库查询建立数据文件.212.1.4导入文本文件建立数据文件.222.2编辑数据文件.232.2.1输入数据.232.2.2定义数据的属性.242.2.3插入或删除数据.332.2.4数据的排序.342.2.5选择个案.352.2.6转置数据.382.2.7合并数据文件.382.2.8数据的分类汇总.442.2.9数据菜单的其他功能.462.3数据加工.472.3.1数据转换.472.3.2数据的手动分组(编码).502.3.3数据的自动分组(编码).542.3.
3、4产生计数变量.552.3.5数据秩(序)的确定.572.3.6替换缺失值.592.4数据文件的保存或导出.612.4.1保存数据文件.612.4.2导出数据文件.622.5本章小结.62第3章SPSS基础统计描述.633.1数理统计量概述.633.1.1均值(Mean)和均值标准误差(S.E.Mean).633.1.2中位数(Median).643.1.3众数(Mode).643.1.4全距(Range).653.1.5方差(Variance)和标准差(StandardDeviation).653.1.6峰度(Kurtosis)和偏度(Skewness).663.1.7四分位数(Quarti
4、les)、十分位数(Deciles)和百分位数(Percentiles).663.2数据描述.673.3频数分析.693.4探索分析.733.5交叉列联表分析.783.6比率分析.843.7P-P图和Q-Q图.863.8图表绘制.893.8.1条形图.893.8.2线图.943.8.3面积图.963.8.4饼形图.983.8.5高低图.993.8.6箱图.1013.8.7直方图.1033.9本章小结.104第4章SPSS基础模块分析.1054.1均值分析.1054.1.1均值的计算公式.1054.1.2均值分析菜单.1064.2方差分析.1084.2.1单因素方差分析.1094.2.2其他方差
5、分析.1134.3参数检验.1164.3.1单样本T检验.1174.3.2其他参数检验.1194.4非参数检验.1204.4.1卡方检验.1214.4.2其他非参数检验.1244.5回归分析.1314.5.1线性回归.1314.5.2其他回归分析.1384.6聚类分析.1464.6.1两步聚类分析.1464.6.2其他聚类分析.1524.7判别分析.1544.7.1判别的函数公式.1554.7.2判别分析的菜单.1554.8因子分析与主成分分析.1614.8.1因子分析.1614.8.2主成分分析.1664.9时间序列分析.1674.9.1定义日期变量.1684.9.2创建时间序列.1694.
6、9.3填补缺失数据.1714.9.4时间序列分析.1714.10生存分析.1724.10.1寿命表分析.1734.10.2其他生存分析.1744.11相关分析.1764.11.1简单相关分析.1764.11.2散点图.1814.11.3偏相关分析.1844.12信度分析.1864.12.1信度分析概述.1874.12.2SPSS信度分析.1894.12.3信度分析的其他问题.1924.13本章小结.197第二篇SPSS17统计分析应用实例第一部分调查统计第5章调查统计入门实例.2035.1硬币均匀性判断.2035.1.1实例内容说明.2035.1.2实现方法分析.2045.1.3具体操作步骤.
7、2045.2使用回归分析判断住房与收入的关系.2075.2.1实例内容说明.2075.2.2实现方法分析.2085.2.3具体操作步骤.2085.3不同性别同学成绩的均值和方差分析.2165.3.1实例内容说明.2165.3.2实现方法分析.2165.3.3具体操作步骤.2165.4本章小结.220第6章调查统计提高实例.2216.1学生身高的探索性分析.2216.1.1实例内容说明.2216.1.2实现方法分析.2226.1.3具体操作步骤.2226.2使用对数线性模型分析骨折资料.2296.2.1实例内容说明.2296.2.2实现方法分析.2296.2.3具体操作步骤.2306.3培训班学
8、习成绩的显著性分析.2376.3.1实例内容说明.2376.3.2实现方法分析.2386.3.3具体操作步骤.2386.4本章小结.241第7章调查统计经典实例.2437.1学习成绩的聚类分析.2437.1.1实例内容说明.2437.1.2实现方法分析.2437.1.3具体操作步骤.2447.2身体生长发育指标的地区显著性差异判断.2517.2.1实例内容说明.2517.2.2实现方法分析.2527.2.3具体操作步骤.2527.3复习时间和考试成绩的关系判断.2627.3.1实例内容说明.2627.3.2实现方法分析.2637.3.3具体操作步骤.2637.4本章小结.266第二部分市场研究
9、第8章市场研究入门实例.2698.1机电产品销售额的影响因素分析.2698.1.1实例内容说明.2698.1.2实现方法分析.2708.1.3具体操作步骤.2708.2消费支出与可支配收入的线性回归分析.2768.2.1实例内容说明.2768.2.2实现方法分析.2778.2.3具体操作步骤.2778.3商品的季节性分析.2898.3.1实例内容说明.2898.3.2实现方法分析.2908.3.3具体操作步骤.2908.4本章小结.300第9章市场研究提高实例.3019.1保险公司革新速度与规模及其类型间的关系分析.3019.1.1实例内容说明.3019.1.2实现方法分析.3029.1.3具
10、体操作步骤.3029.2不同厂家同种产品的质量分析.3139.2.1实例内容说明.3139.2.2实现方法分析.3149.2.3具体操作步骤.3149.3合成纤维的强度与拉伸倍数的关系分析.3189.3.1实例内容说明.3189.3.2实现方法分析.3199.3.3具体操作步骤.3199.4本章小结.325第10章市场研究经典实例.32710.1灯丝不同的灯泡的使用寿命分析.32710.1.1实例内容说明.32710.1.2实现方法分析.32710.1.3具体操作步骤.32810.2不同商品的消费者满意度分析.33610.2.1实例内容说明.33610.2.2实现方法分析.33710.2.3具
11、体操作步骤.33710.3顾客对不同款式衬衣喜爱程度的分析.34410.3.1实例内容说明.34410.3.2实现方法分析.34410.3.3具体操作步骤.34410.4本章小结.348第三部分企业/政府数据分析第11章企业/政府数据分析入门实例.35111.1儿童身高数据频数分析.35111.1.1实例内容说明.35111.1.2实现方法分析.35211.1.3具体操作步骤.35211.2百姓对奥运会评价的方差分析.36011.2.1实例内容说明.36011.2.2实现方法分析.36111.2.3具体操作步骤.36111.3居民交通工具使用情况的回归分析.36911.3.1实例内容说明.36
12、911.3.2实现方法分析.37011.3.3具体操作步骤.37011.4本章小结.377第12章企业/政府数据分析提高实例.37912.1卫生部门对居民寿命情况的分析.37912.1.1实例内容说明.37912.1.2实现方法分析.37912.1.3具体操作步骤.38012.2农作物产量与降水量和平均温度的相关性分析.38612.2.1实例内容说明.38612.2.2实现方法分析.38612.2.3具体操作步骤.38712.3加强体育锻炼与增强身体素质的关系分析.39012.3.1实例内容说明.39012.3.2实现方法分析.39012.3.3具体操作步骤.39112.4本章小结.394第1
13、3章企业/政府数据分析经典实例.39513.1当代大学生价值观的因子分析.39513.1.1实例内容说明.39513.1.2实现方法分析.39613.1.3具体操作步骤.39713.2职业女性家庭特征资料的信度评价.40413.2.1实例内容说明.40413.2.2实现方法分析.40513.2.3具体操作步骤.40513.3对国内生产总值和零售总额之间的关系分析.41213.3.1实例内容说明.41213.3.2实现方法分析.41313.3.3具体操作步骤.41413.4本章小结.420第四部分医学统计分析第14章医学统计分析入门实例.42314.1血红蛋白值描述性统计分析.42314.1.1
14、实例内容说明.42314.1.2实现方法分析.42414.1.3具体操作步骤.42414.2环氯胍的半数致死剂量计算.42814.2.1实例内容说明.42814.2.2实现方法分析.42914.2.3具体操作步骤.42914.3发硒与血硒的相关分析.43514.3.1实例内容说明.43514.3.2实现方法分析.43614.3.3具体操作步骤.43614.4本章小结.439第15章医学统计分析提高实例.44115.1用统计图描述血压状态与冠心病的关系.44115.1.1实例内容说明.44115.1.2实现方法分析.44115.1.3具体操作步骤.44215.2判断红细胞计数的频数是否呈正态分布
15、.44815.2.1实例内容说明.44815.2.2实现方法分析.44815.2.3具体操作步骤.44915.3胃癌患者发生术后院内感染的影响因素分析.45215.3.1实例内容说明.45215.3.2实现方法分析.45315.3.3具体操作步骤.45315.4本章小结.462第16章医学统计分析经典实例.46316.1不同治疗方案的生存率分析.46316.1.1实例内容说明.46316.1.2实现方法分析.46416.1.3具体操作步骤.46516.2不同制剂的药效分析.47316.2.1实例内容说明.47316.2.2实现方法分析.47316.2.3具体操作步骤.47416.3同种药物在不
16、同治疗阶段的药效分析.48116.3.1实例内容说明.48116.3.2实现方法分析.48116.3.3具体操作步骤.48316.4本章小结.487SPSS17中文版统计分析典型实例精粹:以经典统计学软件SPSS17中文版为写作平台,提供软件命令的中英对照基础篇学习软件基本操作和统计描述知识,实例篇详解案例应用原理、流程和操作技巧36个实例典型、丰富,涉及调查统计、市场研究、企业政府数据分析和医学统计领域循序渐进、由浅入深,围绕SPSS应用的原理、流程和操作技巧娓娓阐述插图:1.3SPSS的运行方式SPSS提供了三种基本的运行方式:完全窗口菜单运行方式、程序运行方式和批处理方式。完全窗口菜单运
17、行方式简单明了,除人工输入数据需要键盘外,大部分的操作命令、统计分析方法的实现都是通过菜单、图标按钮和对话框来完成的,使用者无需掌握编程知识就可以使用SPSS软件,适用于传统的统计分析人员。程序运行方式和批处理方式则是从使用者特殊的分析需求出发,编写SPSS命令程序,通过语句直接运行的。这两种运行方式要求使用者掌握专业的SPSS编程语法,对使用者的要求较高。1.4SPSS的主要界面1.4.1SPSS的启动SPSS安装完毕后,系统会自动在Windows的【开始】菜单下创建快捷方式。打开【开始】菜单,在“SPSSforWindows”下选中“SPSSl7.0forWindows”并单击,即可启动S
18、PSS。当用户运行SPSS软件后,计算机屏幕上会出现一个SPSS启动操作对话框,如图1.10所示。在该对话框中,用户可以选择打开数据的方式。对话框中包括一个六选一的单选按钮组和一个复选框,分别说明如下:“您希望做什么?(Whatwouldyouliketodo?)”单选按钮组运行教程(Runthetutorial):单击选中后,SPSS将打开帮助教程,在教程中,用户可选择不同模块的帮助说明进行有针对性的辅导。输入数据(Typeindata):需要手动输入数据,建立新的数据文件时可选择此项。选中后,即进入空白的SPSS数据编辑窗口。运行现有查询(Runanexistingquery):选中后,可
19、以选择查询文件(.spq)的位置,并可单击打开。第3章SPSS基础统计描述SPSS基础统计描述是进行统计分析的基础和前提。使用一些数学统计量来直观地描述原始数据的集中程度、离散状况和分布情况,之后就可以对数据的总体特征进行较为准确的归纳,从而便于选择合适的统计分析方法。基础统计描述主要包括数据描述、频数分析、探索分析、交叉列联表分析、P-P图、Q-Q图等,下面将具体介绍。3.1数理统计量概述SPSS在描述性统计分析中,提供了多个统计量来描述数据特征,这些统计量包括均值、中位数、众数、方差、标准差、四分位数、十分位数、百分位数、峰度系数、偏度系数等。在进行描述性统计分析之前,首先要对这些统计量在
20、统计学上的定义及其计算公式有所了解。3.1.1均值(Mean)和均值标准误差(S.E.Mean)均值(平均数、平均值)表示的是某个变量所有取值的集中趋势或平均水平。例如,某班学生数学考试的平均成绩、公司员工的平均收入、某年级学生的平均身高、某高校高招录取平均分等。平均数有总体平均数和样本平均数之分。总体平均数:若一组数据X1,X2,XN代表一个大小为N的有限总体,则其总体平均数为:(3.1)样本平均数:若一组数据x1,x2,xn代表一个大小为n的有限样本,则其样本平均数为:(3.2)样本数据是从总体数据中抽取出来的,但在不同次抽样中得到的样本是不同的。虽然在一定程度上,样本数据可以反映总体数据
21、的特征,但由于抽样等原因,样本数据是总体数据的随机变量。同样,虽然样本均值可以反映总体数据的特征,但在不同次抽样中所得的样本均值是不同的,并且它们与总体均值间存在差异。均值标准误差(StandardErrorofMean,S.E.Mean,简称标准误)就是描述这些样本均值与总体均值之间平均差异程度的统计量。3.1.2中位数(Median)中位数是将总体数据的各个数值按大小顺序排列,居于中间位置的变量,用Median表示。中位数将所有的数据等分成两半,中位数两端的数据个数相同,因此它也被称为二分位数。中位数的确定,仅仅取决于它在数列中的位置,不受极端值的影响,因此可以用它表示总体的一般水平。同时
22、,中位数比算术平均数具有更好的稳定性。一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列,如果N为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第位置上的两个数值的平均数。3.1.3众数(Mode)众数是指总体数据中出现次数最多的变量,用Mode表示。它同样不受数据极端值的影响,从而在一定程度上提高了平均水平的代表性。例如,制衣厂可以根据消费者所需服装尺码的众数来安排生产。此外,如果众数的值出现的频数或频率较大,那么说明众数的代表性就越高,数列的集中趋势也就越显著。确定众数没有明确的公式,一般只能用手工统计,故较为烦琐。SPSS所提供的统计功能可以减少
23、诸如此类烦琐的过程。众数、中位数与算术平均数之间存在一定的关系,这种关系决定于总体分布的状况。当总体分布呈对称的钟形分布时,算术平均数位于分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此,众数、中位数和算术平均数三者相等。当总体分布呈非对称的钟形分布时,由于这三种平均数受极端数值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间仍有一定的关系。当分布右偏时,算术平均数受偏高数值影响较大,其位置必然在众数之右,中位数在众数与算术平均数之间。反之,当次数分布左偏时,算术平均数受偏小数值的影响较大,其位置在众数之左,中位数仍在众数与算术平均数之间。以上的均值、中位数和众数都是反映数据
24、集中趋势的统计量。3.1.4全距(Range)全距,又称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差,借以表明总体标志值最大可能的差异范围。全距越长,说明数据越离散;反之,全距越小,说明数据越集中。用符号表示全距的计算公式为:(3.3)全距的缺点在于其方法过于粗略,因为它只考虑总体两端数值的差异,没有考虑中间数值差异的情况,因而它是测定离散程度的一种粗略的方法,不能全面反映总体数据的差异程度。要充分利用每一个数据的信息,就需要利用方差和标准差。3.1.5方差(Variance)和标准差(StandardDeviation)方差是总体所有变量值与其算术平均数偏差平
25、方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。总体方差公式:(3.4)总体标准差公式:(3.5)样本方差公式:(3.6)样本标准差:(3.7)其中,m为总体平均数,为样本平均数,N为总体的个数,n为样本的个数。虽然标准差有计量单位,而方差无计量单位,但两者的作用一样,故在此仅介绍标准差。标准差用平方的方法消除了正负号,因而它是最常用、最重要的离散趋势统计量。标准差越大,表示变量值之间的差异越大,各数据距离均值越远,则平均数的代表性就越低。反之,标准差越小,表示变量值之间的差异越小,各数据距离均值较近,则平均数的代表性就越高。
26、标准差在实际生活中也有广泛的应用。例如,可以用标准差来测定居民收入分配的差异程度,还可以用来反映平均收支、平均结余、平均产量等经济变量的代表性等。全距、方差和标准差都是反映数据离散趋势的统计量。3.1.6峰度(Kurtosis)和偏度(Skewness)峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。峰度的具体计算公式
27、为:(3.8)偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。偏度的具体计算公式为:(3.9)3.1.7四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)四分位数是将一组数据由小
28、到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数,即中位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。与四分位数类似,十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与这9个点位置上相对应的数值称为十分位数,分别记为D1,D2,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%的数据落在D9下。同理,百分位数是将一组数据由小到大(
29、或由大到小)排序后分割为100等份,与99个分割点位置上相对应的数值称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%的数据落在P99下。通过四分位数、十分位数和百分位数,可以大体看出总体数据在哪个区间内更为集中,也就是说,它们在一定程度上可以反映数据的分布情况。上面的峰度系数、偏度系数和四分位数、十分位数、百分位数,都是反映数据分布状况的统计量。3.2数据描述描述性统计分析是对数据进行基础性的描述。通过得出的数据的平均值(Mean)、和(Sum)、标准差(Stddeviation)、最大值(Max)、最小值(Min)、方差(Variance)、全
30、距(Range)、均值标准误差(S.E.Mean)、峰度(Kurtosis)、偏度(Skewness)等统计量,来估计原始数据的集中程度、离散状况和分布情况。数据描述功能的操作步骤如下:01打开【分析】(Analyze)菜单,选择【描述统计】(DescriptiveStatistics)命令下的【描述】(Descriptives)命令,如图3-1所示。这里,需要提醒的是如果数据文件尚未打开,【分析】(Analyze)菜单下的任一功能都不能使用,SPSS会弹出一个对话框,如图3-2所示,提醒用户打开文件。打开文件后,【分析】(Analyze)菜单下的统计功能才能正常使用。图3-1【分析】(Ana
31、lyze)菜单图3-2未打开文件提醒对话框02选择【描述】(Descriptives)命令后,SPSS将打开“描述性”(Descriptives)对话框,如图3-3所示。图3-3“描述性”主对话框在该主对话框中,用户可以通过单击按钮从左边原变量中选择一个或者几个变量进入右边的“变量”(Variable(s))列表框中。对话框底部有一个“将标准化得分另存为变量”(Savestandardizedvaluesasvariables)复选框,选择该项,将对“变量”(Variable(s))列表框中被选中变量的数据进行标准化,然后将标准化的结果保存到新变量中。新变量的变量名为原变量的变量名前面添加字母
32、“z”,并被添加在数据编辑窗口中变量的最后一列。数据标准化的计算公式为:(3.10)通过标准化,可以将均值为m、标准差为s的原变量转化成均值为0、标准差为1的新变量。“描述性”(Descriptives)主对话框的下端有5个按钮,如果还未将左边原变量中的变量添加至“变量”(Variable(s))列表框中,则【确定】(OK)和【粘贴】(Paste)按钮为灰白显示,不可单击,但【重置】(Reset)、【取消】(Cancel)和【帮助】(Help)按钮可以单击。通过单击【重置】(Reset)按钮,用户可以将已进入右框的变量全部转移至左框的变量列表中,重新进行选择。03单击【选项】(Options)
33、按钮,将打开“描述:选项”(Descriptives:Options)对话框,如图3-4所示。在该对话框中,用户可以选择所要统计的统计量和图表输出方式。具体对话框中各选项的意义如下:(1)在对话框中最上面一行是均值(Mean)和合计(Sum)。(2)离散(Dispersion)栏中的统计量包括:标准差(StdDeviation)最小值(Minimum)方差(Variance)最大值(Maximum)范围(极差)(Range)均值的标准误(S.E.Mean)(3)分布(Distribution)栏中的统计量包括:峰度(Kurtosis)偏度(Skewness)(4)显示顺序(DisplayOrder)栏中,用户可以自行选择输出变量的排序方式,包括:l变量列表(VariableList):在结果输出窗口中,