描述性统计分析PPT课件.ppt

上传人:石*** 文档编号:87216061 上传时间:2023-04-16 格式:PPT 页数:59 大小:921KB
返回 下载 相关 举报
描述性统计分析PPT课件.ppt_第1页
第1页 / 共59页
描述性统计分析PPT课件.ppt_第2页
第2页 / 共59页
点击查看更多>>
资源描述

《描述性统计分析PPT课件.ppt》由会员分享,可在线阅读,更多相关《描述性统计分析PPT课件.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于描述性统计分析第一张,PPT共五十九页,创作于2022年6月本章学习目标:n掌握数据分析项目的整个过程;n掌握数据的分类方法;n掌握对数据进行描述的图形化方法和数值方法;n学习分析数据分布的方法;n掌握应用SPSS进行描述性数据分析的方法;n掌握常用统计图形的绘制方法和解释技巧 第二张,PPT共五十九页,创作于2022年6月前言:描述性统计和推断性统计n统计学分为描述性统计分析和推断性统计分析n描述性统计q应用分类、制表、图形以及概括性数据指标来概括数据分布特征的方法。结论不能推及总体。n推断性统计q推断性统计分析得到的结论适用于总体。第三张,PPT共五十九页,创作于2022年6月统计量n

2、统计分析往往是从了解数据的基本特征开始的。统计上,需要把样本数据所含信息进行概括、融合和抽象,从而得到反映样本数据的综合指标,这些指标称为统计量。第四张,PPT共五十九页,创作于2022年6月描述性统计分析指标n统计量可分为两类q一类表示数据的中心位置,例如均值、中位数、众数等q一类表示数据的离散程度,例如方差、标准差、极差等用来衡量个体偏离中心的程度。第五张,PPT共五十九页,创作于2022年6月3.1 频率分析 n功能:频率分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征第六张,PPT共五十九页,创作于2022年6月频率分析意义n意义:SPSS

3、的频数分析过程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通过频数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。第七张,PPT共五十九页,创作于2022年6月频率分析术语n频率频率 q对于定性观测值时,把它们按照某种原则分成一些组,每个观测值必须落入一个类并且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率频率 n落入该类中的个案数和个案总数的比例称为相

4、相对频率对频率第八张,PPT共五十九页,创作于2022年6月案例n数据文件Employ Data.sav记录了某公司职工的基本信息,例如性别、民族、出生日期、教育水平、工资水平、工作年限等。n教育水平为分类变量,它有11个类别。第九张,PPT共五十九页,创作于2022年6月SPSS频率分析n选择【分析】【描述统计】【频率】第十张,PPT共五十九页,创作于2022年6月频率分析选项-统计量第十一张,PPT共五十九页,创作于2022年6月频率分析选项-图表第十二张,PPT共五十九页,创作于2022年6月频率分析的结果解释n频率表格n条形图、直方图第十三张,PPT共五十九页,创作于2022年6月当堂

5、练习-频率分析实例n案例3.1身高数据给出了河南省某学校50名高二学生的身高。试分析该50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。第十四张,PPT共五十九页,创作于2022年6月3.2 中心趋势的描述n均值(尺度数据和定序数据)n中位数(尺度数据和定序数据)n众数(定性数据和尺度数据)n5%截尾均值(尺度数据和定序数据)第十五张,PPT共五十九页,创作于2022年6月均值n均值即数据的算术平均数,是数据中心趋势的主要度量指标,n设变量有n个测量值 ,则算术均值为:第十六张,PPT共五十九页,创作于2022年6月均值的特点n最常用的中心位置度量n

6、受极端值影响n 例:1,3,5,7,9 和 1,3,5,7,14第十七张,PPT共五十九页,创作于2022年6月中位数n重要的中心位置度量n在递增排序后的数据列中q 若数据个数为奇数,中位数是正中央的数q 若数据个数是偶数,中位数是正中央的两数的平均值.n不受极端值的影,例如:1,5,7,3,9第十八张,PPT共五十九页,创作于2022年6月众数n发生频数最高的数据值n不受极端值的影响n众数可能不存在n可能有多个众数(单峰,双峰,多峰)n可用于定量或定性数据第十九张,PPT共五十九页,创作于2022年6月5%截尾均值 n避免了极端值的影响 第二十张,PPT共五十九页,创作于2022年6月3.3

7、 离散趋势的描述n仅仅根据数据的中心趋势指标进行决策是不够的。例如,如果一个国家的不同家庭收入差距很少;而另一个国家的家庭收入差距很大,既存在大量的贫困家庭,也存在许多十分富有的家庭,那么即使这两个国家的中等收入家庭的收入完全一样,其家庭收入情况仍然完全不同。第二十一张,PPT共五十九页,创作于2022年6月例子n假设我们有以下的三组观测值:q观测A:11,12,13,16,16,17,18,21q观测B:14,15,15,15,16,16,16,17q观测C:11,11,11,12,19,20,20,20n这三组观测值的均值都是15.5,那么这三组数据是否相似呢?第二十二张,PPT共五十九页

8、,创作于2022年6月离散趋势第二十三张,PPT共五十九页,创作于2022年6月离散趋势的描述 n极差(range)n方差(Variance)n标准差(S.d.)n分位数(Percentage)n变异指标第二十四张,PPT共五十九页,创作于2022年6月极差n极差=最大值-最小值n受极端值影响较大第二十五张,PPT共五十九页,创作于2022年6月方差和标准差n方差n标准差第二十六张,PPT共五十九页,创作于2022年6月变异系数 n在比较两组数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。n需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为:

9、第二十七张,PPT共五十九页,创作于2022年6月分位数 n第p p百分位数q使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值q如何计算?n将原数据从小到大排列n计算i=(p/100)n n若i是整数,则第p百分位数为第i 与第 i+1 项的平均n若i不是整数,则向上取整。第二十八张,PPT共五十九页,创作于2022年6月总结五数n最小值、第一个四分位数、中位数、第三个四分位数、最大值n从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现 第二十九张,PPT共五十九页,创作于2022年6月3.4 分布的形状n偏度q当偏度系数大于0

10、时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左q当偏度系数小于0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右 q当偏度系数为0,分布对称 第三十张,PPT共五十九页,创作于2022年6月峰度n峰度n 3,分布为高峰度,即比正态分布的峰要陡峭;图表q条形图q饼图q直方图n示例:数据文件DisasterReason.sav q条形图q饼图q直方图q帕累托图第四十九张,PPT共五十九页,创作于2022年6月条形图第五十张,PPT共五十九页,创作于2022年6月饼图第五十一张,PPT共五十九页,创作于2022年6月帕累托图第五十二张,PPT共五十九页,创

11、作于2022年6月直方图-茎叶图-箱图n描述性-探索q直方图q茎叶图q箱图n示例:数据Employee Data.savq直方图q茎叶图q箱图第五十三张,PPT共五十九页,创作于2022年6月直方图和茎叶图第五十四张,PPT共五十九页,创作于2022年6月箱图第五十五张,PPT共五十九页,创作于2022年6月从旧对话框作图n重新完成上面两个例子中的图形(箱图除外)第五十六张,PPT共五十九页,创作于2022年6月饼图-帕累托图n频率-饼图n质量控制-排列图n图-图表构建程序n图-旧对话框第五十七张,PPT共五十九页,创作于2022年6月本章小结n主要介绍了描述统计分析的方法和技巧。主要方法有频数分析、描述性分析、探索分析、列联表分析。第五十八张,PPT共五十九页,创作于2022年6月感谢大家观看第五十九张,PPT共五十九页,创作于2022年6月

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁