《SPSS总结办公文档工作总结 _办公文档-工作总结 .pdf》由会员分享,可在线阅读,更多相关《SPSS总结办公文档工作总结 _办公文档-工作总结 .pdf(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 SPSS 的基本统计功能 1、数据的预处理 2、描述性统计和探索性统计 3、假设检验(包括参数检验、非参数检验等)4、方差分析(包括一般的方差分析和多元方差分析)5、相关分析 6、回归分析 7、多元统计分析,包括聚类分析、判别分析、因子分析、对应分析、主成分分析等 8、时间序列分析 9、信度分析 10、数据挖掘:决策树与神经网络 SPSS 统计分析的一般步骤 1、建立 SPSS 数据文件:在【变量视图】定义 SPSS数据文件的结构,在【数据视图】进行录入数据文件的录入。2、SPSS 数据的管理数据的预处理:集中于【数据】和【转换】两个菜单项。3、SPSS 数据的统计分析阶段 :在【分析】菜单
2、中选择正确的统计方法。4、SPSS 分析结果的阅读和解释 :读懂 SPSS 输出窗口中的分析结果 5、明确其统计含义,并结合背景知识做出合理的解释。第 2章 SPSS统计分析前的准备 一、SPSS 数据文件的特点 1、SPSS 数据文件是一种有结构的数据文件(一般文本文件仅有纯数据部分,而没有关于结构的描述);2、由数据的结构和内容两部分构成;3、其中数据的结构记录数据类型、取值说明、数据缺失等必要信息(在【变量视图】,每一列大家都要明白你在定义什么,有什么用);4、数据的内容是那些待分析的具体数据;5、在【数据视图】每一列代表一个变量(variable),变量名显示在表格顶部;6、在【数据视
3、图】的每一行代表一个记录(case)(即一个案例,或称一个对象、一个观察、一个个体),记录序号显示在表格的左侧;7、在【数据视图】可以输入和编辑数据,但是不能输入数学表达式和函数 二、定义变量 1、【数据视图】是进行数据输入、数据编辑的界面,对应的表格用于查看、录入和修改数据。2、【变量视图】是定义数据文件的变量的界面,对应的表格用于输入和修改变量的定义。3、用 SPSS 读取其他格式的数据:1)数据文件:*。sav 语法文件:*。sps 结果文件:*。spo 脚本文件:*。sbs 2)文件-打开-数据,可打开多种文件类型(。sav、。xls、。dbf、。txt、。dat 等)注:要想顺利打开
4、 txt 文档,txt 文档最好有固定的分隔符,如一个空格或一个逗号等。三、数据的编辑 在 SPSS 中,数据文件的编辑、整理等功能被集中在了【数据】和【转换】两个菜单项中:1、数据的增删、复制、剪切、粘贴;2、数据的排序,Sort Cases排序便于数据的浏览,快捷找到最大值或最小值,迅速发现数据的异常值;四、文件的拆分:文件的拆分相当于统计学中的数据分组,即将数据按一个或几个分组变量分组。五、数据选取:数据选取(个案选取)的基本方式 按指定条件选取(If condition is satisfied)随机抽样(Random sample of cases)选取某一区域内(Based on
5、time or case range)六、个案加权:记录加权是对观测数据赋以权重,常用于频数表资料;七、文件的合并:合并文件是指将外部数据中的记录或变量合并到当前的数据文件中去。合并数据文件包括两种方式:从外部数据文件增加记录到当前数据文件中纵向合并或称追加记录。从外部数据文件增加变量到当前数据文件中横向合并或称追加变量。八、变量的计算和变换:【转换】-【计算变量】九、数据的重新编码 recode 统计分组 将字符型变量转换为数值型变量 将几个小类别合为一个类别 将数值型变量转换为字符型 十、统计结果的保存为 word文件:【文件】-【导出】第 3章 SPSS描述性统计 1.Frequenci
6、es(频率)过程的特色是产生频数表;功能 产生频数分布表;绘制条形图、饼图、直方图;计算集中趋势与离散程度、分布形状(峰度和偏度的意义)等统计量;按要求给出分位数;对数据的分布趋势进行初步分析(注:对于定性变量来说,一般来说产生频数分布表,制作条形图,饼图即可);2.描述分析(Descriptives过程)适用的分析对象:定量变量,测度为 scale。方差分析和多元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的阅读和
7、解释读懂输出窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记功能:调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等;并可将原始数据转换成 Z分数((原始值-均值)/标准差)。3.Explore(探索)过程用于对数据概况不清时的探索性分析,定量变量;在一般描述性统计分析的基础
8、上,增加有关数据其他特征的文字与图形描述。提供茎叶图、箱线图、PP图、QQ图等;指出异常值(Outliers),可检查数据是否有错误,剔除异常值和错误数据;进行点估计和区间估计,计算均值的置信区间,;检验一组数据是否呈正态分布;4.列联表分析(1)列联表分析的适用条件 对一个定量变量的描述和分析,一般用频数分析(频数分布表、饼图、直方图、条形图);对两个定性变量的描述和分析,通常使用列联表、对应分析,或使用卡方检验;对两个以上定性变量的描述和分析,通常使用高维列联表。(2)期望频数的分布 如果行变量和列变量是独立的,可以计算出列联表中每个格子里的频数应该是多少,称为期望频数;(3)列联表分析的
9、基本思路 检验列联表中的行变量与列变量之间是否独立(或是否相关)。原假设为行变量与列变量之间独立(或不相关)。比较观察频数与期望频数的差。如果两者的差越大,表明实际情况与原假设相去甚远;如果差越小,表明实际情况与原假设越相近。对于这个假设的检验,可以采用卡方分布,进行卡方检验。(4)列联表分析的步骤 检验列联表中的行变量与列变量之间是否独立(是否相关)提出假设 H0:行变量与列变量独立(不相关)H1:行变量与列变量不独立(相关 计算检验的统计量 统计决策 进行决策:P值决策 P0。05,则拒绝原假设 H0,否则,接收原假设。(5)Pearson卡方检验的应用条件 所有单元的期望频数应该大于 1
10、,或不应有大量的期望频数小于 5 的单元格。如果列联表中有 20%以上的单元格中的期望频数小于 5,则一般不宜用卡方检验。Pearson卡方检验最普遍 第 4章 SPSS的均值比较过程 1。Means过程 对准备比较的各组计算描述指标,进行预分析,也可直接比较,定量变量。(1)Means 过程是专门计算各种平均数,并对平均数进行简单比较的;方差分析和多元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的阅读和解释读懂输出
11、窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记(2)虽然 Descriptive Statistics(描述统计)菜单项中的几个过程也能计算均数,但 Means过程的输出结果是将各组的描述指标放在一起的,便于相互比较;(3)Means过程必须设置分组变量,若没有分组变量的话,可以使用Descrip
12、tive Statistics菜单项中的几个过程。(4)适用于测度水平为 SCALE的变量。2。单样本 T检验(1)目的 检验某变量的总体均值与指定的检验值之间是否存在显著差异。(2)适用条件 样本来自的总体服从正态分布(3)基本步骤 H0:0 H1:0 构造检验统计量 统计决策 如果 P值,接受原假设;3。独立样本 T 检验(1)目的 通过比较两个样本均值差的大小来确定两个总体的均值是否相等。(2)适用条件 独立性:两个样本相互独立,且均为大样本;正态性:如果两个样本相互独立但都是小样本,或有一个样本是小样本,则要求总体服从正态分布;方差齐性 (3)基本步骤 a、方差齐性 F检验 原假设:两
13、个总体方差相等;备则假设:两个总体方差不相等;P值0。05 时,拒绝原假设,说明方差不齐;否则两个总体方差无显著性差异。b、对两总体的均值提出假设 H0:12 H1:12 c、统计决策 在 SPSS 中进行两独立样本 t 检验时,应首先对 F检验作判断。如果方差相等,观察分析结果中 Equal variances assumed列的 t 检验相伴概率值;如果方差不相等,观察 Equal variances not assumed列的 t 检验相伴概率值。如果 P值,不能拒绝原假设;4.配对样本的 T 检验 配对样本是指对同一样本的某个变量进行前后两次测试所获得的两组数据,或是对两个方差分析和多
14、元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的阅读和解释读懂输出窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记完全相
15、同的样本在不同条件下进行测试所获得的两组数据。其差别在于抽样不是相互独立的,而是互相关联的。(1)配对样本通常有两个特征:第一,两组样本的样本数相同;第二,两个样本记录的先后顺序一一对应,不能随意更改。(2)适用条件 两样本数据必须两两配对 两总体服从正态分布 配对样本的录入方式是:每对数据在同一个 case 的两个配对的变量上(3)检验步骤 a、提出假设 H0:12 H1:12 b、统计决策 如果 P值,不能拒绝原假设;第 5章 方差分析 如何对一个或两个总体的均值进行检验,我们可以用均值比较,如果要讨论多个总体均值是否相等,我们所采用的方法是方差分析。方差分析中有以下几个重要概念。(1)因
16、素(Factor):是指所要研究的变量,它可能对因变量产生影响。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。(2)水平(Level):水平指因素的具体表现,如销售的四种方式就是因素的不同取值等级。(3)单元(Cell):指因素水平之间的组合。(4)元素(Element):指用于测量因变量的最小单位。一个单元里可以只有一个元素,也可以有多个元素。(5)交互作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用。1.单因素方差分析 单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水
17、平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。(1)适用条件 在各个水平之下观察对象是独立随机抽样,即独立性;各个水平的因变量服从正态分布,即正态性;各个水平下的总体具有相同的方差,即方差齐性;(2)基本原理 SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显方差分析和多元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析
18、因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的阅读和解释读懂输出窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动
19、主要由随机变量因素引起的。SPSS 将自动计算检验统计量和相伴概率 P值,若 P0。05,方差齐,否则,方差不齐;单因素方差分析表,P值,接受 H0,都则,拒绝 H0,接受 H1。2.多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。(2)基本原理 由于多因素方差分析中观察变量不仅要受到多个因素独立作用的影响,而且因素其交互作用和一些随机因素都会对变量产生影响。因此观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。以
20、两个因素为例,可以表示为:其中,Q表示各部分对应的离差平方和。多因素方差分析比较 占 的比例,以此推断不同因素以及因素之间的交互作用是否给观测变量带来显著影响。(3)基本术语 a、Dependent Variable 观测变量或因变量 主要指研究中的定量变量 如:移动话费、学生成绩、销售量、亩产量等 b、Fixed Factor 固定效应因素,固定因素,控制因素 主要指研究中的定性变量 如:资费等级、客户类型、漫游类型、促销策略等 c、Random Factor 随机效应因素、随机因素 人为无法对其水平值进行准确控制,只是能够直观观测到 如:话费水平、收入水平、消费习惯等 d、Interact
21、ion 交互作用、交互效应 如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。例如:饮食习惯、适量运动对减肥的作用;e、main effect 与交互效应相对应的 主效应就是每个因素对因变量的单独影响(main effect)方差分析和多元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的
22、阅读和解释读懂输出窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记f、Covariates 协变量 指对应变量可能有影响,需要在分析时对其作用加以控制的连续性定量变量 当模型中存在协变量时,一般是通过找出它与因变量的回归关系来控制其影响(3)应用条件 等方差;各样本的独立性:只有各样本为相互独立的随
23、机样本,才能保证变异的可加性(可分解性);正态性:即所有观察值系从正态总体中抽样得出;(4)基本步骤 提出假设 H0:因素 A中的 r 个水平的均值相等(因素 A 对因变量无显著性影响)H1:因素 A中的 r 个水平的均值不全相等(因素 A 对因变量有显著性影响)统计决断 P值检验法 依次查看各 F值的 P值,p-值M2 2、编秩,将两组数据由小到大统一编秩,编秩时如遇有相同数据,取平均秩次。3、求秩和,两组秩次分别相加。4、确定统计量 若两组样本容量相等,则任取一组的秩和为统计量;若两组样本容量不等,则以样本样本容量较小者对应的秩和为统计量。5、查表确定 P值,作出推断结论。若 P,不能拒绝
24、原假设。若则 P,不能拒绝原假设 P值save来保存我们的结果,一般情况下,我们建议保存我们的数据,结果可不保存。因为只要有了数据,如果我们想要结果的,我们可以随时利用数据得到结果。总结:以上便是 SPSS处理问卷的四个步骤,四个步骤结束后,我们需要 SPSS 软件做的工作基本上也就结束了,接下来的任务就是写我们的统计报告了。值得一提的是。SPSS 是一款在社会统计学应用非常广泛的统计类软件,学好它将对我们以后的工作学习产生很大的意义和作用。方差分析和多元方差分析相关分析回归分析多元统计分析包括聚类分析判别分析因子分析对应分析主成分分析等时间序列分析信度分析数据挖掘决策树与神经网络统计分析的一般步骤建立数据文件在变量视图定义数据文件的结构在分析菜单中选择正确的统计方法分析结果的阅读和解释读懂输出窗口中的分析结果明确其统计含义并结合背景知识做出合理的解释第章统计分析前的准备一数据文件的特点数据文件是一种有结构的数据文件一般文文件仅有纯数据部信息在变量视图每一列大家都要明白你在定义什么有什么用数据的内容是那些待分析的具体数据在数据视图每一列代表一个变量变量名显示在表格顶部在数据视图的每一行代表一个记录即一个案例或称一个对象一个观察一个个体记