《第四章连续变量的描述统计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章连续变量的描述统计优秀PPT.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章连续变量的描述量的描述统计第一页,本课件共有47页1.连续变量的统计描述概述连续变量的统计描述概述2.集中趋势的描述指标集中趋势的描述指标3.离散趋势的描述指标离散趋势的描述指标4.实例操作实例操作Part 2:第四章:第四章 连续变量的描述统计连续变量的描述统计第二页,本课件共有47页学习要求学习要求掌握SPSS软件中用于连续变量统计描述的Explore、Frequencies、Descriptive过程学习要求学习要求理解连续变量的均值、方差等统计描述指标第三页,本课件共有47页4.1 4.1 连续变量的统计描述概述连续变量的统计描述概述统计描述的工具统计描述的工具统计图统计图
2、 统计表统计表统计描述指标统计描述指标 第四页,本课件共有47页数据分布的特征数据分布的特征集中趋势集中趋势 (位置位置)离中趋势离中趋势 (分散程度分散程度)偏态和峰度偏态和峰度(形状)(形状)第五页,本课件共有47页连续变量统计描述的连续变量统计描述的常用常用指标指标均值均值众数众数中位数中位数极差极差四分位差四分位差方差方差统计描述指标统计描述指标集中趋势集中趋势离散趋势离散趋势第六页,本课件共有47页4.2 4.2 集中趋势的描述指标集中趋势的描述指标一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是寻找数据一般水平的代表值或中心值;测度集中趋势就
3、是寻找数据一般水平的代表值或中心值;第七页,本课件共有47页集中趋势测度均值集中趋势测度均值集中趋势的测度值之一;集中趋势的测度值之一;最最常用常用的测度值;的测度值;一组数据的均衡点所在;一组数据的均衡点所在;设一组数据为:设一组数据为:x1,x2,xn,简单算术平均数的计算公式为:,简单算术平均数的计算公式为:第八页,本课件共有47页集中趋势测度中位数集中趋势测度中位数集中趋势的测度值之一;集中趋势的测度值之一;排序后处于中间位置上的值:排序后处于中间位置上的值:Me50%50%第九页,本课件共有47页集中趋势测度众数集中趋势测度众数集中趋势的测度值之一;集中趋势的测度值之一;出现次数最多
4、的变量值;出现次数最多的变量值;第十页,本课件共有47页数据类型与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数第十一页,本课件共有47页4.3 4.3 离中趋势的描述指标离中趋势的描述指标数据分布的另一个重要特征;数据分布的另一个重要特征;离中趋势的各测度值是对数据离中趋势的各测度值是对数据离散程度离散程度所作的描述;所作的描述;反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说明了集中趋反
5、映各变量值远离其中心值的程度从另一个侧面,从令一侧面说明了集中趋势测度值的代表程度;势测度值的代表程度;第十二页,本课件共有47页离中趋势测度极差离中趋势测度极差离散程度的测度值之一;离散程度的测度值之一;一组数据的最大值与最小值之差,计算公式为:一组数据的最大值与最小值之差,计算公式为:R=max(xi)-min(xi)第十三页,本课件共有47页离中趋势测度方差离中趋势测度方差离散程度最常用的测度值;离散程度最常用的测度值;反映了各变量值与均值的平均差异;反映了各变量值与均值的平均差异;计算公式:计算公式:第十四页,本课件共有47页离中趋势测度四分位差离中趋势测度四分位差离中趋势的测度值之一
6、;离中趋势的测度值之一;排序后处于排序后处于75%和和25%位置上的值的差位置上的值的差QQU U QQL L:QQL LQQMMQQU U25%25%25%25%25%25%25%25%第十五页,本课件共有47页数据类型与离中趋势测度值数据类型与离中趋势测度值数据类型和所适用的离散程度测度值数据类型和所适用的离散程度测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据或定比数据定距数据或定比数据适适用用的的测测度度值值四分位差四分位差 方差或标准差方差或标准差 离散系数(比较时用)离散系数(比较时用)平均差平均差 极差极差 四分位差四分位差第十六页,本课件共有47页4.4 4.4
7、 数据分布的形状测度数据分布的形状测度扁平分布尖峰分布峰度峰度左偏分布右偏分布与标准正态与标准正态分布比较!分布比较!偏态偏态第十七页,本课件共有47页数据分布的形状测度偏态数据分布的形状测度偏态数据分布偏斜程度的测度;数据分布偏斜程度的测度;计算公式:计算公式:偏态系数偏态系数=0为对称分布;为对称分布;偏态系数偏态系数0为右偏分布;为右偏分布;偏态系数偏态系数0为左偏分布。为左偏分布。第十八页,本课件共有47页算例算例【例】已知2007年我国农村居民家庭按纯收入分组的有关数据如下表。试计算偏态系数。2007年农村居民家庭纯收入数据年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)50
8、0以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94第十九页,本课件共有47页计算过程计算过程农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值xi户数比重(%)fi(xi-x)fi3(xi-x)fi45以下5101015152020252530303535404045455050以上2.57.512.517.522.527.532.537
9、.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计1001689.2572521.25第二十页,本课件共有47页计算结果计算结果根据上表数据计算得:将计算结果代入公式得:结论结论:偏态系数为正值,说明农村居民家庭纯收入的分布为右偏分布。第二十一页
10、,本课件共有47页农村居民家庭纯收入数据的直方图农村居民家庭纯收入数据的直方图10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论结论:说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数。按纯收入分组按纯收入分组(元元)252520201515105 5户户数数比比重重(%)第二十二页,本课件共有47页数据分布的形状测度峰度数据分布的形状测度峰度数据分布扁平程度的测度;数据分布扁平程度的测度;计算公式:计算公式:峰度系数峰度系数=3扁平程度适中;
11、扁平程度适中;峰度系数峰度系数3为尖峰分布。为尖峰分布。第二十三页,本课件共有47页4.5 4.5 连续变量的统计描述实例操作连续变量的统计描述实例操作【例例】:某班:某班3030名学生名学生统计学统计学期末考试成绩如下,试对该考试进行统计描述分析。期末考试成绩如下,试对该考试进行统计描述分析。117 122 124 129 107 117 130 122 110 118 123 126 127 123 118 112 100 125 117 122 126 122 118 108 112 127 123 119 113 120第二十四页,本课件共有47页描述统计过程描述统计过程SPSSSPS
12、S软件中用于连续变量统计描述的工具主要有软件中用于连续变量统计描述的工具主要有FrequenciesFrequencies、Descriptive Descriptive、ExploreExplore三大过程。三大过程。第二十五页,本课件共有47页FrequenciesFrequencies过程过程频数分布表是描述性统计中最常用的方法之一,频数分布表是描述性统计中最常用的方法之一,FrequenciesFrequencies过程就是专过程就是专门为产生频数表而设计的。门为产生频数表而设计的。FrequenciesFrequencies过程不仅可以产生详细的频数表,还可以按要求给出百分位点的数值
13、,过程不仅可以产生详细的频数表,还可以按要求给出百分位点的数值,以及常用的条图、圆图等统计图。以及常用的条图、圆图等统计图。第二十六页,本课件共有47页统计学统计学成绩成绩【例】:某班30名学生统计学期末考试成绩如下,试对该考试进行分析。117117117117123123112112126126127127122122130130126126100100122122123123124124122122127127125125118118119119129129110110123123117117108108113113107107118118118118122122112112120120第
14、二十七页,本课件共有47页主对话框主对话框选择要分析的变量选择要分析的变量选定频数表格式选定频数表格式做统计图做统计图定义需计算的统计量定义需计算的统计量第二十八页,本课件共有47页StatisticsStatistics子对话框子对话框离散趋势离散趋势集中趋势集中趋势百分位数百分位数分布分布第二十九页,本课件共有47页结果输出表格结果输出表格Frequencies过程的表格输出不仅主要有均值、中位数、众数、标准差等等过程的表格输出不仅主要有均值、中位数、众数、标准差等等常用的描述统计指标。常用的描述统计指标。第三十页,本课件共有47页ChartsCharts子对话框子对话框条图条图正态曲线正
15、态曲线直方图直方图饼图饼图Charts子对话框主要是定义输出的图形类型:条图、饼图、直方图。子对话框主要是定义输出的图形类型:条图、饼图、直方图。第三十一页,本课件共有47页结果输出直方图结果输出直方图第三十二页,本课件共有47页FormatFormat子对话框子对话框限制分组数限制分组数选择两个以上变量选择两个以上变量作频数表作频数表定义频数表定义频数表排列顺序排列顺序Format 子对话框主要是定义输出频数表的格式。子对话框主要是定义输出频数表的格式。第三十三页,本课件共有47页DescriptiveDescriptive过程过程它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标
16、,它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,这和其他过程相比并无不同。这和其他过程相比并无不同。该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据库供以后分该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据库供以后分析。析。第三十四页,本课件共有47页主对话框主对话框选择要分析的变量选择要分析的变量第三十五页,本课件共有47页OptionsOptions子对话框子对话框Options子对话框子对话框主要是选择需要输出的描述统计指标:均值、中位数、众主要是选择需要输出的描述统计指标:均值、中位数、众数、标准差等等。数、标准差等等。第三十六页,本课件共有47
17、页结果输出表格结果输出表格第三十七页,本课件共有47页ExploreExplore过程过程可对变量进行更深入详尽的描述性统计分析,主要用于对资料的性质、分可对变量进行更深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称为布特点等完全不清楚时,故又称为探索性分析探索性分析。在常用的描述性统计指标的基础上,它增加了有关数据详细分布特征在常用的描述性统计指标的基础上,它增加了有关数据详细分布特征的文字与图形描述,如茎叶图、箱式图等。的文字与图形描述,如茎叶图、箱式图等。第三十八页,本课件共有47页主对话框主对话框选入所需分析变量选入所需分析变量选定分组变量选定分组变量选定
18、标签变量选定标签变量选定结果中包括的内容选定结果中包括的内容第三十九页,本课件共有47页StatisticsStatistics子对话框子对话框所有以上两个过所有以上两个过程有的指标程有的指标集中趋势集中趋势输出输出5个个最大与最最大与最小值小值百分位数百分位数第四十页,本课件共有47页PlotsPlots子对话框子对话框箱式图的绘制方箱式图的绘制方式式茎叶图和直方茎叶图和直方图图正态图和正态图和正态检验正态检验判断离散程度是否相同(比较合适的变量判断离散程度是否相同(比较合适的变量变换方法)变换方法)第四十一页,本课件共有47页结果输出表格结果输出表格第四十二页,本课件共有47页结果输出表格
19、结果输出表格第四十三页,本课件共有47页结果输出结果输出-直方图直方图第四十四页,本课件共有47页结果输出箱图结果输出箱图离群点离群点最小值最小值最大值最大值中位数中位数上四分位数上四分位数下四分位数下四分位数第四十五页,本课件共有47页小小 结结 本章主要阐述本章主要阐述SPSS软件中用于连续变量统计描述的软件中用于连续变量统计描述的Explore、Frequencies、Descriptive三大三大过程。过程。在实际的数据分析工作中,首要的工作就是去了解数据在实际的数据分析工作中,首要的工作就是去了解数据的整体情况,随后才能考虑作更深入的分析和推断。的整体情况,随后才能考虑作更深入的分析和推断。第四十六页,本课件共有47页Thank you!第四十七页,本课件共有47页