《Chapter 5 SPSS统计分析软件及其应用.ppt》由会员分享,可在线阅读,更多相关《Chapter 5 SPSS统计分析软件及其应用.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Chapter 5SPSS统计分析软件及其应用oSPSS是世界上最著名的统计分析软件之一。o其名称原为“Statistical Package for the Social Sciences”:社会科学统计软件包o但是,随着产品服务领域的扩大和服务深度的增加,现在英文名称已更改为“Statistical Product and Service Solutions”:统计产品与服务解决方案 5.1 SPSS 简介SPSS的主要特点:o工作界面友好;o完善的数据转换接口;o能满足不同层次与领域统计人员的需要;o强大的统计图绘制和编辑功能;o丰富的指导协助功能。SPSS中国网站:http:/ Dat
2、a Editor 窗口右上角的关闭按钮o选择SPSS Data Editor 窗口主菜单“FileExit”命令o双击SPSS Data Editor 窗口左上角的窗口图标o单击SPSS Data Editor 窗口最上角的窗口图标,在显示出的菜单中单击关闭命令oAltF4组合键SPSS的系统环境1、窗口o在SPSS中,有几种不同类型的窗口,分别提供不同的操作环境和界面。常用的有:Data Editor(数据编辑窗)、Syntax Editor(语法编辑窗)、OutputSPSS Viewer(输出窗)、Draft Viewer(草稿输出窗)、Script Editor(脚本语言编辑窗)、Pi
3、vot Table Editor(表格编辑窗)、Chart Editor(统计图标编辑窗)、Text Output Editor(文本编辑窗)等。Data EditorSyntax EditorOutputSPSS ViewerDraft ViewerScript Editor2、菜单 oSPSS允许用户对菜单进行编辑,选择Utilities菜单中的Menu Edit选项,弹出菜单编辑对话框,可以将Windows下的其他外部应用程序、SPSS的语法程序、脚本程序添加到SPSS的菜单中,以后就可以在SPSS中方便的启动这些应用程序了。o例如,将应用程序Microsoft PowerPoint 编
4、辑到SPSS数据窗口的Utilities菜单中,这样便可以在数据窗口里打开这个程序。以数据编辑窗口的主菜单为例oFile(文件)菜单oEdit(编辑)菜单oView(视图外观)菜单oData(数据)菜单oTransform(数据转换)菜单oAnalyze(统计分析)菜单oGraphs(图形)菜单oUtilities(实用程序)菜单oWindows(窗口控制)菜单oHelp(帮助)菜单3、对话框oGeneral 列出了常规选项oViewer 提供Output窗口显示时的信息、图标等选项oDraft Viewer 草稿输出窗口的各种初始设置及功能选项oOutput Lables 提供了输出中标签的
5、设置选项oCharts 用于设置图形输出格式oInteractive 用于设置交互式的图形oPivot Table 用于设置输出表格的格式oData 用于设置有关数据的参数oCurrency 设置数值型变量的输出格式oScripts 设置启动SPSS用到的脚本程序文件5.2 SPSS数据文件的建立与操作 o变量名o变量类型o变量标签o值标签o变量格式宽度o单元格对齐格式o缺失值o测度1、打开数据文件 2、变量、观测量3、数据文件的保存4、数据录入、编辑与查询5、数据文件的整理6、数据文件的转置7、数据文件的合并8、数据的分类汇总变量的属性:数据的分类汇总 机械厂.sav5.3 典型信息分析方法
6、 在SPSS中的实现5.3.1 描述性统计分析o描述统计的任务就是描述随机变量的统计规律性。要完整地描述随机变量的统计特性需要分布函数;o但在实际问题中,求随机变量的分布函数并不是一件容易的事,另一方面对于一些问题也不需要去全面考察随机变量的变化规律,而只需知道随机变量的某些特征。1、频数分析常用统计量:o百分位值 o离散程度:极差、方差、标准差 o集中趋势:均值、众数、算术和 o分布特征:偏度、峰度 在SPSS中的实现:osample.sav 2、描述统计量过程5.3.2 方差分析o在工农业生产及科学研究中,影响产品质量与产量(或研究结果)的因素一般较多。为了找出影响结果(效果)最显著的因素
7、,要先做些试验,然后对测试数据进行统计推断,方差分析就是对实测数据进行统计推断的一种方法;o方差分析中,常称上述的因素为因子因子,用A、B、C等表示因素在试验中所处的不同情况或状态称为水平水平,例如因子A的r个不同水平表示为A1,A2,Ar。o例:从小学入学新生中随机抽取20名学生作数学试验,将儿童均分为四组,分别用四种汉字识字教学法进行教学,一段时间后对他们进行统一测验,成绩如下:o判断教学法对测试成绩是否有显著影响的的问题,就是要辨别测试成绩之间的差异主要是由随机误差造成的,还是由不同教学法造成的,这一问题可归结为四个母体是否有相同分布的讨论。o由于在实际中有充分的理由认为测试成绩服从正态
8、分布,且在安排试验时,除所关心的因子(这儿是教学法)外,其它试验条件总是尽可能做到一致,因此统计学中认为每个母体的方差相同,即 yiN(i,2)i=1,2,3,4,o因此,推断几个母体是否具有相同分布的问题就简化为:检验几个具有相同方差的正态母体是否均值相等的问题,即只需检验 H0:1=2=3=4o首先分析引起yij波动的原因,有如下两个:o从分解平方和入手:o其中Se反映各水平下试验的随机误差,称为误差平方和或者组内平方和;oSA反映因素不同水平效应的差异,称为效应平方和或者组间平方和。o在正态总体Xi,i1,r相互独立且等方差的假定下,H0为真时,SE/2 与SA/2相互独立,且SE/2服
9、从自由度为(nr)的卡方分布,SA/2服从自由度为(r1)的卡方分布,ST/2服从自由度为(n1)的卡方分布。o而统计量 有如下的特征:在假设H0为真时接近1,不真时则有偏大的趋势,所以我们取F作H0的检验统计量。o方差分析在SPSS中的实现:例(Lamp life).sav5.3.3 相关分析1、什么是相关分析 2、相关分析的描述与测度 测度变量相关系数的统计量:o散点图虽然可以直观地判断变量间的关系形态,并对变量间的相关形态做出大致的描述,但不能准确地反映变量之间关系地密切程度。因此,还需要计算相关系数:o相关系数:皮尔逊(Pearson)相关系数:用于scale测度的变量 斯皮尔曼(Sp
10、earman)和肯德尔(Kendall)秩相关系数:用于定序或等级变量 偏相关(Partial Correlations)系数:测度相似关系的统计量(以间隔测度变量为例)o距离 Euclidean distance、Chebyechev distance、Block distance、Minkowski distanceo相似系数 Cosine、Pearson correlation3、相关分析的作用o相关关系与回归分析有密切的关系,通过相关分析发现变量之间确实存在显著的线性相关关系之后,便可以通过回归分析进一步揭示变量之间的统计规律。o同样,通过距离分析发现变量或观测量间的相似程度或亲疏程度
11、后,可以进一步进行聚类分析、因子分析等来揭示它们之间的统计规律。4、在SPSS中的实现(1)二元变量相关分析:o双尾检验:如果事先不知道相关方向(正相关还是负相关)则可以选择此项;单尾检验:如果事先知道相关方向可以选择此项。o例(Survey)、例(Renown)(2)二元变量偏相关分析:例(ceramic)(3)距离分析:例(Doctor)9.3.4 回归分析o研究一个或几个变量的变动对另一个变量变动的影响程度,找出它们之间的关系式,用自变量的已知值去推测因变量的值或范围。o进行回归分析,首先需要一定样本,同时,这些样本的变量间应具有较为显著的相关关系。1、回归方程的数学模型o一元线性回归模
12、型o多元线性回归模型 o非线性回归模型 2、回归方程的建立 o建立回归方程,首先需推测回归方程的形式。o除此以外,还有两个关键的问题,一个是自变量筛选,一个是参数估计。3、回归方程的显著性检验与评价 o显著性检验:一个是从总体上对方程进行方差分析,看整个方程是否有意义,F检验;另一方面是对每个自变量前的回归系数进行检验,看它所对应的自变量对方程是否有贡献,t检验。o评价:主要用于反映回归效果,即回归方程显著的话,它好到什么程度,判定系数。4、回归分析在SPSS中的实现AnalyzeRegressiono一元线性回归 例(Sodium Nitrate)o多元线性回归 例(rice)o曲线估计 例(Composition)曲线估计中涉及的部分模型Linear线性模型Quadratic二次模型Compound复合模型Growth生长曲线模型Logarithmic对数曲线模型Cubic三次曲线模型S-curveS曲线模型Exponential指数曲线模型Inverse逆曲线模型Power幂指曲线模型Logistic逻辑曲线模型9.3.5 因子分析o实例:例(Jiangsu).sav9.3.6 聚类分析o实例:例(Index).sav(分层聚类)