第四章基本统计分析优秀PPT.ppt

上传人:石*** 文档编号:65759367 上传时间:2022-12-08 格式:PPT 页数:47 大小:4.31MB
返回 下载 相关 举报
第四章基本统计分析优秀PPT.ppt_第1页
第1页 / 共47页
第四章基本统计分析优秀PPT.ppt_第2页
第2页 / 共47页
点击查看更多>>
资源描述

《第四章基本统计分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章基本统计分析优秀PPT.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章基本统计分析第一页,本课件共有47页基本统计分析功能概述1.报告分析报告分析(Reports)(有兴趣的自学)(有兴趣的自学)2.描述性统计分析(描述性统计分析(Descriptive Statistics)第二页,本课件共有47页报告分析简介:报告分析包括:报告分析包括:1.1.OLAP在线分析处理过程在线分析处理过程 2.2.报表报表根据报表制作的侧重点不同,可以分为根据报表制作的侧重点不同,可以分为3 3种:种:(1)(1)个案简明统计报表个案简明统计报表(Cases Summary)(2)(2)行形式报表(行形式报表(Report Summaries in Rows)(3)(3)

2、列形式报表列形式报表(Report Summaries in columns)第三页,本课件共有47页描述性统计分析(Descriptive Statistics)1.Frequencies 频数分析频数分析2.Descriptive 描述性统计分析描述性统计分析3.Explore 探索分析探索分析4.Crosstabs 列联表分析列联表分析5.Ratio 比率分析比率分析第四页,本课件共有47页第五页,本课件共有47页第一节 频数分析 一、频数的定义一、频数的定义 频数就是一个变量在各个变量值上取值频数就是一个变量在各个变量值上取值的个案数。的个案数。可编制频数分布表和绘制统计图,把握可编制

3、频数分布表和绘制统计图,把握数据分布的基本特征。数据分布的基本特征。二、命令二、命令 Analyze/Descriptive statistics/Frequencies 第六页,本课件共有47页 Frequencies主对话框主对话框显示频数分布表显示频数分布表统计量统计量统计图形统计图形频数输出的顺序频数输出的顺序第七页,本课件共有47页输出统计量对话框输出统计量对话框第八页,本课件共有47页Chart 对话框对话框第九页,本课件共有47页Format 对话框对话框按各个变量组织输出,按各个变量组织输出,输出结果将按照每个变输出结果将按照每个变量一张表的形式显示量一张表的形式显示按频数的升

4、序输出按频数的升序输出按变量值的升序输出按变量值的升序输出统计表中变量的各项分统计表中变量的各项分析结果在一张表并列显析结果在一张表并列显示示控制频数表输出范围控制频数表输出范围类型的最大数目为类型的最大数目为第十页,本课件共有47页第十一页,本课件共有47页第十二页,本课件共有47页第十三页,本课件共有47页某频次分析结果某频次分析结果第十四页,本课件共有47页统计量分析结果统计量分析结果第十五页,本课件共有47页条形图第十六页,本课件共有47页饼图(圆饼图)第十七页,本课件共有47页直方图第十八页,本课件共有47页第二节 计算基本描述统计量功能:功能:对变量进行描述性统计分析,计算均对变量

5、进行描述性统计分析,计算均值、标准差、全距和均值标准误差等,并值、标准差、全距和均值标准误差等,并可将原始数据转换成可将原始数据转换成Z Z分数。分数。调用命令:调用命令:按按Analyze/Descriptive Statistics/Frequencies 或者或者Descriptives顺序单击,打顺序单击,打开主对话框。开主对话框。第十九页,本课件共有47页一、均值一、均值(Mean)(Mean)、中位数、中位数(Median)(Median)、众数、众数(Mode)(Mode)1.1.定义定义 均值表示的是某变量所有取值的集中趋势均值表示的是某变量所有取值的集中趋势或平均水平;中位数

6、是把一组数据按递增顺序或平均水平;中位数是把一组数据按递增顺序排列,处于中间位置上的变量值就是中位数;排列,处于中间位置上的变量值就是中位数;众数是指一组数据中,出现次数最多的那个变众数是指一组数据中,出现次数最多的那个变量值。量值。2.2.命令命令 调用调用Analyze/Descriptive statistics/Frequencies第二十页,本课件共有47页集中趋势描述对话框第二十一页,本课件共有47页三、方差、标准差、全距、均值的标准误差三、方差、标准差、全距、均值的标准误差 1.1.定义定义 (1 1)方差是所有变量值与平均数偏差平方和的平)方差是所有变量值与平均数偏差平方和的平

7、均值。均值。(2 2)标准差表示一组数据关于平均数的平均离散)标准差表示一组数据关于平均数的平均离散程度。程度。(3 3)全距是数据最大值与最小值之间的绝对差。)全距是数据最大值与最小值之间的绝对差。(4 4)均值标准误差:描述样本均值与总体均值之)均值标准误差:描述样本均值与总体均值之间平均差异程度的统计量。间平均差异程度的统计量。2.2.命令命令 调用调用Analyze/Descriptive statistics/Frequencies 第二十二页,本课件共有47页描述数据离散程度第二十三页,本课件共有47页三、分位数 1.1.应用:应用:数据按升序排列后,找到若干个分位点上数据按升序排

8、列后,找到若干个分位点上的值。从一个侧面比较两组数据的集中趋势。的值。从一个侧面比较两组数据的集中趋势。如四分位数是将一组个案由小到大排序后,用如四分位数是将一组个案由小到大排序后,用3 3个点将全部数据分为四等份,与三个点上相对个点将全部数据分为四等份,与三个点上相对应的值称为四分位数。应的值称为四分位数。2.命令命令调用调用Analyze/Descriptive statistics/Frequencies 第二十四页,本课件共有47页计算分位数第二十五页,本课件共有47页四、峰度(四、峰度(Kurtosis)和偏度()和偏度(Skewness)1.1.定义定义(1 1)峰度是描述某变量所

9、有取值分布形态陡)峰度是描述某变量所有取值分布形态陡缓程度的统计量。缓程度的统计量。(2 2)偏度也是描述数据分布形态的,它是描)偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。述某变量取值分布对称性的统计量。2.2.命令命令调用调用Analyze/Descriptive statistics/Frequencies 第二十六页,本课件共有47页计算峰度和偏度第二十七页,本课件共有47页五、标准化五、标准化Z Z分数分数 1.1.定义定义 Z Z分数表示的是此变量值大于或小于平分数表示的是此变量值大于或小于平均数几个标准差。均数几个标准差。2.2.命令命令 Analyze D

10、escriptive Statistics Descriptive第二十八页,本课件共有47页计算标准分第二十九页,本课件共有47页例题分析例题分析:已知已知2020个初生婴儿的体重数据如下表,个初生婴儿的体重数据如下表,对其进行描述统计。对其进行描述统计。27702915279529952860297030873126312546542272350342183418392126693707231025733881第三十页,本课件共有47页 1.打开数据文件打开数据文件“婴儿体重婴儿体重.sav”。打开。打开 Descriptives主对话框,选定变量主对话框,选定变量“婴儿体重婴儿体重”进入

11、进入Variable栏中。栏中。2.选中选中Save standardized values as variables复选框,要求计算变量的复选框,要求计算变量的z值,并值,并保存结果到当前数据集中。保存结果到当前数据集中。3.单击单击Options按钮,选中按钮,选中Mean、Std.Deviation、Minimum、Maximum 项。项。操作步骤:操作步骤:第三十一页,本课件共有47页婴儿体重的描述统计量婴儿体重的描述统计量第三十二页,本课件共有47页 这时打开原数据集,可看到多了一列这时打开原数据集,可看到多了一列“z z婴儿婴儿体体”,这是,这是“婴儿体重婴儿体重”的的z z分数,

12、如下图所示:分数,如下图所示:第三十三页,本课件共有47页第三节第三节 探索分析探索分析一、定义一、定义 调用此过程可对变量进行更为深入详尽的调用此过程可对变量进行更为深入详尽的描述性统计分析。它在一般描述性统计指标的描述性统计分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形基础上,增加有关数据其他特征的文字与图形描述;有助于用户思考对数据进行进一步分析描述;有助于用户思考对数据进行进一步分析的方案。故称为探索分析。的方案。故称为探索分析。二、命令二、命令 Analyze Descriptive Statistics Explore第三十四页,本课件共有47页Explor

13、e 主对话框第三十五页,本课件共有47页Statistics对话框对话框输出中心趋势的粗略最大似输出中心趋势的粗略最大似然估计然估计输出输出5%、10%、25%、50%、75%、90%、95%的百分位数的百分位数第三十六页,本课件共有47页 Explore 栏中栏中Plots对话框对话框为每个因变量生成为每个因变量生成一个箱图一个箱图所有因变量生成所有因变量生成一个箱图一个箱图生成散布生成散布层层次图,方差齐次图,方差齐性检验性检验转换幂值估计转换幂值估计第三十七页,本课件共有47页Explore 栏中栏中Options对话框对话框确定缺失值的处置:确定缺失值的处置:因变量或分组变量中带有因变

14、量或分组变量中带有缺失值的观测量都将在分析缺失值的观测量都将在分析过程中被剔除。过程中被剔除。在分析过程中根据分组变量在分析过程中根据分组变量产生的组中带缺失值的观测产生的组中带缺失值的观测量都将被剔除。量都将被剔除。分组变量的缺失值被单独分分组变量的缺失值被单独分为一组,输出频数时将标出缺为一组,输出频数时将标出缺失组。失组。第三十八页,本课件共有47页例题:下表为例题:下表为3030名名1010岁少儿的身高(岁少儿的身高(cmcm)数据)数据(略略),试对其进行探索分析。,试对其进行探索分析。编编号号身高身高编编号号身高身高编编号号身高身高男男女女男男女女男男女女1131.5132.761

15、35.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.7编编号号身高身高编编号号身高身高编编号号身高身高男男女女男男女女男男女女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136

16、.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.7第三十九页,本课件共有47页步骤:步骤:1.打开打开 Explore主对话框,打开数据文件主对话框,打开数据文件“Explore分析分析.sav”选变量选变量height进入进入Dependent List栏中,选栏中,选sex变量进变量进入入Factor List栏中;栏中;2.在在Display栏中选择栏中选择 Both项;项;3.打开打开Statistics对话框,选中对话框,选中Descriptive、M-estimators、Outliers复选项,单击复

17、选项,单击Continue返回;返回;4.打开打开Plot对话框,选择对话框,选择Boxplots栏中的栏中的Factor levels together项,选择项,选择Descriptives栏内的栏内的 Stem-and-leaf复选项,复选项,单击单击 Continue 返回。单击返回。单击OK第四十页,本课件共有47页观测量摘要表观测量摘要表M估计量表估计量表第四十一页,本课件共有47页少儿身高的性别分组描述统计量少儿身高的性别分组描述统计量第四十二页,本课件共有47页少儿身高的极端值少儿身高的极端值第四十三页,本课件共有47页方差一致性检验 零假设是分组后的方差相等。零假设是分组后的

18、方差相等。表中四行是依据不同的统计量得到的检验,分别是表中四行是依据不同的统计量得到的检验,分别是基于基于均值、基于中位数、基于中位数及调整后的自由度和基于调整均值、基于中位数、基于中位数及调整后的自由度和基于调整后的均值。后的均值。由于其显著值均大于由于其显著值均大于0.050.05,不能否定零假设,即可以认为,不能否定零假设,即可以认为男生和女生的身高的方差是无差异的。男生和女生的身高的方差是无差异的。第四十四页,本课件共有47页从左到右分为三部分:频从左到右分为三部分:频数、茎和叶。数、茎和叶。茎是整数部分,叶是小数部茎是整数部分,叶是小数部分,分,Stem width表示茎宽。表示茎宽

19、。每行的茎和叶组成的数字每行的茎和叶组成的数字再乘以茎宽,即得到实际再乘以茎宽,即得到实际数据的近似值,实际数据数据的近似值,实际数据中与该近似值靠近的值的中与该近似值靠近的值的个数即为频数表示的个数。个数即为频数表示的个数。茎叶图HIGHT Stem-and-Leaf HIGHT Stem-and-Leaf Plot forPlot forSEX=1SEX=1 Frequency Stem&LeafFrequency Stem&Leaf 1.00 12.1 1.00 12.1 4.00 12.8999 4.00 12.8999 3.00 13.122 3.00 13.122 5.00 13.

20、55567 5.00 13.55567 2.00 14.00 2.00 14.00 Stem width:10.00 Stem width:10.00 Each leaf:1 case(s)Each leaf:1 case(s)第四十五页,本课件共有47页箱式图方形是箱式图的主体,上方形是箱式图的主体,上下边为四分位数,中心粗下边为四分位数,中心粗线为中位数,变量的线为中位数,变量的50%的观测值落在这一区域中。的观测值落在这一区域中。方形上下两条纵向直线是方形上下两条纵向直线是触须线,触须线外的两端触须线,触须线外的两端线为本体的最大值和最小线为本体的最大值和最小值。本体指除奇异值外的值。本体指除奇异值外的变量值。变量值。奇异值用奇异值用“O”标出,本标出,本例中无奇异值。例中无奇异值。第四十六页,本课件共有47页上机作业上机作业4 41.1.自己学习报告分析的各项命令。自己学习报告分析的各项命令。2.2.熟练掌握频次分析、描述性统计分析和熟练掌握频次分析、描述性统计分析和探索分析的基本功能和运用技巧。探索分析的基本功能和运用技巧。3.3.上机练习上机练习4 4,完成第一个统计分析报告。,完成第一个统计分析报告。第四十七页,本课件共有47页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁