《第四章-连续变量的描述统计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章-连续变量的描述统计优秀PPT.ppt(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1.连续变量的统计描述概述连续变量的统计描述概述2.集中趋势的描述指标集中趋势的描述指标3.离散趋势的描述指标离散趋势的描述指标4.实例操作实例操作Part 2:第四章:第四章 连续变量的描述统计连续变量的描述统计学习要求学习要求掌握SPSS软件中用于连续变量统计描述的Explore、Frequencies、Descriptive过程学习要求学习要求理解连续变量的均值、方差等统计描述指标4.1 4.1 连续变量的统计描述概述连续变量的统计描述概述统计描述的工具统计描述的工具统计图统计图 统计表统计表统计描述指标统计描述指标 数据分布的特征数据分布的特征集中趋势集中趋势 (位置位置)离中趋势离中
2、趋势(分散程度分散程度)偏态和峰度偏态和峰度(形状)(形状)连续变量统计描述的连续变量统计描述的常用常用指标指标均值均值众数众数中位数中位数极差极差四分位差四分位差方差方差统计描述指标统计描述指标集中趋势集中趋势离散趋势离散趋势4.2 4.2 集中趋势的描述指标集中趋势的描述指标一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是找寻数据一般水平的代表值或中心值;测度集中趋势就是找寻数据一般水平的代表值或中心值;集中趋势测度均值集中趋势测度均值集中趋势的测度值之一;集中趋势的测度值之一;最常用的测度值;最常用的测度值;一组数据的均衡点所在;一组数据的均衡点所
3、在;设一组数据为:设一组数据为:x1,x2,xn,简洁算术平均数的计算公,简洁算术平均数的计算公式为:式为:集中趋势测度中位数集中趋势测度中位数集中趋势的测度值之一;集中趋势的测度值之一;排序后处于中间位置上的值:排序后处于中间位置上的值:Me50%50%集中趋势测度众数集中趋势测度众数集中趋势的测度值之一;集中趋势的测度值之一;出现次数最多的变量值;出现次数最多的变量值;数据类型与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均
4、数四分位数 中位数四分位数众数4.3 4.3 离中趋势的描述指标离中趋势的描述指标数据分布的另一个重要特征;数据分布的另一个重要特征;离中趋势的各测度值是对数据离散程度所作的描述;离中趋势的各测度值是对数据离散程度所作的描述;反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说反映各变量值远离其中心值的程度从另一个侧面,从令一侧面说明白集中趋势测度值的代表程度;明白集中趋势测度值的代表程度;离中趋势测度极差离中趋势测度极差离散程度的测度值之一;离散程度的测度值之一;一组数据的最大值与最小值之差,计算公式为:一组数据的最大值与最小值之差,计算公式为:R=max(xi)-min(xi)离中趋势
5、测度方差离中趋势测度方差离散程度最常用的测度值;离散程度最常用的测度值;反映了各变量值与均值的平均差异;反映了各变量值与均值的平均差异;计算公式:计算公式:离中趋势测度四分位差离中趋势测度四分位差离中趋势的测度值之一;离中趋势的测度值之一;排序后处于排序后处于75%和和25%位置上的值的差位置上的值的差QQU U QQL L:QQL LQQMMQQUU25%25%25%25%25%25%25%25%数据类型与离中趋势测度值数据类型与离中趋势测度值数据类型和所适用的离散程度测度值数据类型和所适用的离散程度测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据或定比数据定距数据或定比数据
6、适适用用的的测测度度值值四分位差四分位差 方差或标准差方差或标准差 离散系数(比较时用)离散系数(比较时用)平均差平均差 极差极差 四分位差四分位差4.4 4.4 数据分布的形态测度数据分布的形态测度扁平分布尖峰分布峰度峰度左偏分布右偏分布与标准正态与标准正态分布比较!分布比较!偏态偏态数据分布的形态测度偏态数据分布的形态测度偏态数据分布偏斜程度的测度;数据分布偏斜程度的测度;计算公式:计算公式:偏态系数偏态系数=0为对称分布;为对称分布;偏态系数偏态系数0为右偏分布;为右偏分布;偏态系数偏态系数0为左偏分布。为左偏分布。算例算例【例】已知2007年我国农村居民家庭按纯收入分组的有关数据如下表
7、。试计算偏态系数。2007年农村居民家庭纯收入数据年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94计算过程计算过程农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值xi户数比重(%)fi(xi-x)fi3(xi-x)fi45以下5101015152020252530303535
8、404045455050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计1001689.2572521.25计算结果计算结果依据上表数据计算得:将计算结果代入公式得:结论结论:偏态系数
9、为正值,说明农村居民家庭纯收入的分布为右偏分布。农村居民家庭纯收入数据的直方图农村居民家庭纯收入数据的直方图10001000500500150015002000200025002500300030003500350040004000 4500450050005000结论结论:说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数。按纯收入分组按纯收入分组(元元)252520201515105 5户户数数比比重重(%)数据分布的形态测度峰度数据分布的形态测度峰度数据分布扁平程度的测度;数据分布扁平程度的测度;计算公式:计算公式:峰度系数峰度系数=3扁平程度适中
10、;扁平程度适中;峰度系数峰度系数3为尖峰分布。为尖峰分布。4.5 4.5 连续变量的统计描述实例操作连续变量的统计描述实例操作【例】:某班【例】:某班3030名学生统计学期末考试成果如下,试对该考试进行统名学生统计学期末考试成果如下,试对该考试进行统计描述分析。计描述分析。117 122 124 129 107 117 130 122 110 118 117 122 124 129 107 117 130 122 110 118 123 126 127 123 118 112 100 125 117 122 123 126 127 123 118 112 100 125 117 122 126
11、 122 118 108 112 127 123 119 113 120 126 122 118 108 112 127 123 119 113 120描述统计过程描述统计过程SPSSSPSS软件中用于连续变量统计描述的工具主要有软件中用于连续变量统计描述的工具主要有FrequenciesFrequencies、Descriptive Descriptive、Explore Explore三大过程。三大过程。FrequenciesFrequencies过程过程频数分布表是描述性统计中最常用的方法之一,频数分布表是描述性统计中最常用的方法之一,FrequenciesFrequencies过程就是
12、过程就是特地为产生频数表而设计的。特地为产生频数表而设计的。FrequenciesFrequencies过程不仅可以产生具体的频数表,还可以按要求给出百分过程不仅可以产生具体的频数表,还可以按要求给出百分位点的数值,以及常用的条图、圆图等统计图。位点的数值,以及常用的条图、圆图等统计图。统计学成果统计学成果【例】:某班30名学生统计学期末考试成果如下,试对该考试进行分析。11711711711712312311211212612612712712212213013012612610010012212212312312412412212212712712512511811811911912912
13、9110110123123117117108108113113107107118118118118122122112112120120主对话框主对话框选择要分析的变量选择要分析的变量选定频数表格式选定频数表格式做统计图做统计图定义需计算的统计量定义需计算的统计量StatisticsStatistics子对话框子对话框离散趋势离散趋势集中趋势集中趋势百分位数百分位数分布分布结果输出表格结果输出表格Frequencies过程的表格输出不仅主要有均值、中位数、众数、标准差等等过程的表格输出不仅主要有均值、中位数、众数、标准差等等常用的描述统计指标。常用的描述统计指标。ChartsCharts子对话框
14、子对话框条图条图正态曲线正态曲线直方图直方图饼图饼图Charts子对话框主要子对话框主要是定义输出的图形类型:条图、饼图、直方图。是定义输出的图形类型:条图、饼图、直方图。结果输出直方图结果输出直方图FormatFormat子对话框子对话框限制分组数限制分组数选择两个以上变量选择两个以上变量作频数表作频数表定义频数表定义频数表排列依次排列依次Format 子对话框主要子对话框主要是定义输出频数表的格式。是定义输出频数表的格式。DescriptiveDescriptive过程过程它可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,它可对变量进行描述性统计分析,计算并列出一系列相应的统计
15、指标,这和其他过程相比并无不同。这和其他过程相比并无不同。该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据该过程可将原始数据转换成标准正态分值,并以变量的形式存入数据库供以后分析。库供以后分析。主对话框主对话框选择要分析的变量选择要分析的变量OptionsOptions子对话框子对话框Options子对话框主要是选择须要输出的描述统计指标:均值、中位数、子对话框主要是选择须要输出的描述统计指标:均值、中位数、众数、标准差等等。众数、标准差等等。结果输出表格结果输出表格ExploreExplore过程过程可对变量进行更深化详尽的描述性统计分析,主要用于对资料的性质、可对变量进行更深化
16、详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清晰时,故又称为探究性分析。分布特点等完全不清晰时,故又称为探究性分析。在常用的描述性统计指标的基础上,它增加了有关数据具体分布特征在常用的描述性统计指标的基础上,它增加了有关数据具体分布特征的文字与图形描述,如茎叶图、箱式图等。的文字与图形描述,如茎叶图、箱式图等。主对话框主对话框选入所需分析变量选入所需分析变量选定分组变量选定分组变量选定标签变量选定标签变量选定结果中包括的内容选定结果中包括的内容StatisticsStatistics子对话框子对话框全部以上两个过全部以上两个过程有的指标程有的指标集中趋势集中趋势输出输出5个个最
17、大与最大与最小值最小值百分位数百分位数PlotsPlots子对话框子对话框箱式图的绘制方箱式图的绘制方式式茎叶图和直茎叶图和直方图方图正态图正态图和正态和正态检验检验推断离散程度是否相同(比较合适的推断离散程度是否相同(比较合适的变量变换方法)变量变换方法)结果输出表格结果输出表格结果输出表格结果输出表格结果输出结果输出-直方图直方图结果输出箱图结果输出箱图离群点离群点最小值最小值最大值最大值中位数中位数上四分位数上四分位数下四分位数下四分位数小小 结结 本章主要阐述本章主要阐述SPSS软件中用于连续变量统计描软件中用于连续变量统计描述的述的Explore、Frequencies、Descriptive三大三大过程。过程。在实际的数据分析工作中,首要的工作就是去了在实际的数据分析工作中,首要的工作就是去了解数据的整体状况,随后才能考虑作更深化的分析和解数据的整体状况,随后才能考虑作更深化的分析和推断。推断。Thank you!