《数据描述统计分析 (2).ppt》由会员分享,可在线阅读,更多相关《数据描述统计分析 (2).ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第3章章 数据描述统计分析数据描述统计分析3.1 集中趋势的测定与分析集中趋势的测定与分析3.2 离中趋势的测定与分析离中趋势的测定与分析3.3 分布形态的测定与分析分布形态的测定与分析3.4 描述统计工具描述统计工具本章学习目标本章学习目标 Excel描述数据集中趋势的工作表函数及其应用描述数据集中趋势的工作表函数及其应用 Excel描述数据离中趋势的工作表函数及其应用描述数据离中趋势的工作表函数及其应用 Excel描述数据分布形态的工作表函数及其应用描述数据分布形态的工作表函数及其应用 Excel描述统计工具的内容及其应用描述统计工具的内容及其应用3.1 集中趋势的测定与分析集中趋势的测
2、定与分析3.1.1 集中趋势的测定内容集中趋势的测定内容3.1.2 用用Excel工作表函数描述集中趋势工作表函数描述集中趋势3.1.3 三种平均数的特点三种平均数的特点返回首页3.1.1 集中趋势的测定内容集中趋势的测定内容在在统统计计研研究究中中,需需要要搜搜集集大大量量数数据据并并对对其其进进行行加加工工整整理理,对对这这些些数数据据进进行行整整理理之之后后发发现现:大大多多数数情情况况下下数数据据都都会会呈呈现现出出一一种种钟钟形形分分布布,即即各各个个变变量量值值与与中中间间位位置置的的距距离离越越近近,出出现现的的次次数数越越多多;与与中中间间位位置置距距离离越越远远,出出现现的的
3、次次数数越越少少,从从而而形形成成了了一一种种以以中中间间值值为为中中心心的的集集中中趋趋势势。这这个个集集中中趋趋势势是是现现象象共共性性的的特特征征,是是现现象象规规律律性性的的数数量量表表现。现。返回本节3.1.2 用用Excel工作表函数描述集中趋势工作表函数描述集中趋势1均值函数均值函数(1)算术平均数。)算术平均数。(2)调和平均数。)调和平均数。(3)几何平均数。)几何平均数。2中位数(中位次数)函数中位数(中位次数)函数中中位位数数是是指指全全体体数数值值按按大大小小排排列列后后位位于于中中间间的的数数值。值。语法:语法:MEDIAN(number1,number2,.)如如果
4、果参参数数集集合合中中包包含含有有偶偶数数个个数数字字,函函数数MEDIAN()将返回位于中间的两个数的平均值。将返回位于中间的两个数的平均值。3众数函数众数函数众众数数是是一一组组数数列列中中出出现现次次数数最最多多的的数数值值,众众数数函函数数MODE()返返回回某某一一数数组组或或数数据据区区域域中中出出现现频频率率最最多多的的数数值值。与与MEDIAN相相同同,MODE也也是是一一个个位位置测量函数。置测量函数。语法:语法:MODE(number1,number2,.)如如果果数数据据集集合合中中不不含含有有重重复复的的数数据据,则则MODE()函函数返回错误值数返回错误值N/A。4最
5、大(小)值函数最大(小)值函数最最大大(小小)值值函函数数可可以以返返回回数数据据集集中中的的最最大大(小小)数值。数值。语法:语法:MAX(number1,number2,.)MIN(number1,number2,.)如果参数不包含数字,函数如果参数不包含数字,函数MAX(MIN)返回返回0。返回本节3.1.3 三种平均数的特点三种平均数的特点众数是一组数据中出现次数最多的变量值,它用众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还值的影响,但它没有利用全部数据信息,而且
6、还具有不惟一性。一组数据可能有众数,也可能没具有不惟一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。有众数;可能有一个众数,也可能有多个众数。中位数是一组数据按大小顺序排序后处于中间位中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度置上的变量,它主要用于对顺序数据的概括性度量。量。均值是一组数据的算术平均,它利用了全部数据均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。信息,是概括一组数据最常用的一个值。例例3-1 某商场家用电器销售情况如图某商场家用电器销售情况如图3-1所示。所示。(1)计计算算各
7、各种种电电器器的的全全年年平平均均销销售售量量,如如图图3-2所示。所示。(2)计计算算各各种种电电器器销销售售量量的的中中位位数数,如如图图3-3所所示。示。(3)计算各种电器销售量的众数,如图)计算各种电器销售量的众数,如图3-4所示。所示。图3-1 某商场家用电器销售情况 图3-2 家用电器销售量平均数 图3-3 家用电器销售量中位数 图3-4 家用电器销售量众数返回本节3.2 离中趋势的测定与分析离中趋势的测定与分析3.2.1 离中趋势的测定内容离中趋势的测定内容3.2.2 用用Excel函数计算标准差函数计算标准差3.2.3 四分位数与四分位距四分位数与四分位距返回首页3.2.1 离
8、中趋势的测定内容离中趋势的测定内容在在研研究究现现象象总总体体标标志志的的一一般般水水平平时时,不不仅仅要要研研究究总总体体标标志志的的集集中中趋趋势势,还还要要研研究究总总体体标标志志的的离离中中趋趋势势,如如研研究究价价格格背背离离价价值值的的平平均均程程度度。研研究究离离中中趋趋势势可可以以通通过过计计算算标标志志变变异异指指标标来来进进行行。标标志志变变异异指指标标是是同同统统计计平平均均数数相相联联系系的的一一种种综综合合指指标标,用用于于度度量量随随机机变变量量在在取取值值区区间间内内的的分分布布情情况况,主主要要有有平平均均差差、标标准准差差、方方差差、四四分分位位数数、百百分分
9、位位数数等等。在在一一般般计计算算中中,这这些些指指标标计计算算是是比比较较复复杂杂的的,但但在在Excel中中都都有有相相应应的的函函数数,因因而而使使计计算算变变得很简单。得很简单。返回本节3.2.2 用用Excel函数计算标准差函数计算标准差1样本标准差样本标准差 2总体标准差总体标准差 1样本标准差样本标准差 样本标准差函数用来估算样本的标准偏差,反映样本标准差函数用来估算样本的标准偏差,反映相对于平均值(相对于平均值(mean)的离散程度,的离散程度,Excel计算样计算样本标准差采用不偏估计式(亦即自由度本标准差采用不偏估计式(亦即自由度n-1),),其计算公式为其计算公式为 语法
10、:语法:STDEV(number1,number2,.)2总体标准差总体标准差 总体标准差函数返回以参数形式给出的整个样本总体标准差函数返回以参数形式给出的整个样本总体的标准偏差,反映相对于平均值(总体的标准偏差,反映相对于平均值(mean)的的离散程度。计算总体标准差使用整个总体的变量,离散程度。计算总体标准差使用整个总体的变量,通常采用偏性估计式(亦即自由度为通常采用偏性估计式(亦即自由度为n),),其计算其计算公式为公式为 语法:语法:STDEVP(number1,number2,.)例例3-2 使使用用例例3-1资资料料,计计算算各各家家电电销销售售量量的的总总体标准差,如图体标准差,
11、如图3-5所示。所示。图3-5 计算总体标准差例例3-3 两两组组工工人人生生产产某某种种零零件件的的产产量量如如图图3-6所所示。示。图3-6 两组工人产量 图3-7 计算产量平均数图3-8 计算两组工人产量标准差图3-9 计算两组工人产量标准差系数返回本节3.2.3 四分位数与四分位距四分位数与四分位距四四分分位位数数是是将将中中值值的的前前后后两两部部分分数数值值再再等等分分为为二二,以以数数值值小小的的一一端端算算起起,前前半半部部的的分分区区点点称称为为第第1四四分分位位数数,后后半半部部的的分分区区点点称称为为第第3四四分分位位数数,而而中中值值即即为为第第2四四分分位位数数。四四
12、分分位位数数通通常常用用于于在在销销售售额额和和测测量量值值数数据据集集中中对对总总体体进进行行分组。分组。语法:语法:QUARTILE(array,quart)array:需要求四分位数值的数组或数字型单元格区域。需要求四分位数值的数组或数字型单元格区域。quart:决定返回哪一个四分位值。决定返回哪一个四分位值。Quart值与值与QUARTILE返回值的对应关系见表返回值的对应关系见表3-1所示。所示。quart值函数QUARTILE返回值0最小数值1第一个四分位数(第25个百分排位)2中分位数(第50个百分排位)3第三个四分位数(第75个百分排位)4最大数值表3-1 Quart值与QUA
13、RTILE返回值的对应关系例例3-4 使用例使用例3-1资料,计算四分位数和四分位资料,计算四分位数和四分位距,如图距,如图3-10所示。所示。图3-10 计算四分位数和四分位距返回本节3.3 分布形态的测定与分析分布形态的测定与分析3.3.1 分布形态的测定内容分布形态的测定内容3.3.2 用用Excel工作表函数描述分布形态工作表函数描述分布形态返回首页3.3.1 分布形态的测定内容分布形态的测定内容只只用用集集中中趋趋势势和和离离中中趋趋势势来来表表示示所所有有数数据据,难难免免不不够够准准确确。分分析析总总体体次次数数的的分分布布形形态态有有助助于于识识别别整整个个总总体体的的数数量量
14、特特征征。总总体体的的分分布布形形态态可可以以从从两两个个角角度度考考虑虑,一一是是分分布布的的对对称称程程度度,另另一一个个是是分分布布的的高高低低。前前者者的的测测定定参参数数称称为为偏偏度或偏斜度,后者的测定参数称为峰度。度或偏斜度,后者的测定参数称为峰度。峰峰度度是是掌掌握握分分布布形形态态的的另另一一指指标标,它它能能描描述述分分布布的的平平缓缓或或陡陡峭峭程程度度。如如果果峰峰度度数数值值等等于于零零,说说明明分分布布为为正正态态;如如果果峰峰度度数数值值大大于于零零,说说明明分分布布呈呈陡陡峭峭状状态态;如如果果峰峰度度数数值值小于零,说明分布形态趋于平缓。小于零,说明分布形态趋
15、于平缓。返回本节3.3.2 用用Excel工作表函数描述分布形态工作表函数描述分布形态1偏度函数偏度函数2峰度函数峰度函数1偏度函数偏度函数偏度函数返回分布的偏斜度。偏斜度反映以平均偏度函数返回分布的偏斜度。偏斜度反映以平均值为中心的分布的不对称程度。正偏斜度表示不值为中心的分布的不对称程度。正偏斜度表示不对称边的分布更趋向正值,负偏斜度表示不对称对称边的分布更趋向正值,负偏斜度表示不对称边的分布更趋向负值。其计算公式为边的分布更趋向负值。其计算公式为 语法:语法:SKEW(number1,number2,.)2峰度函数峰度函数峰度函数返回数据集的峰值,表示次数分布高峰峰度函数返回数据集的峰值
16、,表示次数分布高峰的起伏状态。峰值反映与正态分布相比某一分布的起伏状态。峰值反映与正态分布相比某一分布的尖锐度或平坦度。正峰值表示相对尖锐的分布,的尖锐度或平坦度。正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布。其计算公式为负峰值表示相对平坦的分布。其计算公式为 语法:语法:KURT(number1,number2,.)例例3-5 使用例使用例3-1资料,计算各家电销售量的偏资料,计算各家电销售量的偏度和峰度,如图度和峰度,如图3-11所示。所示。返回本节3.4 描述统计工具描述统计工具对对于于统统计计数数据据的的一一些些常常用用统统计计量量,比比如如均均值值、中中位位数数、众众数数、标标
17、准准差差、峰峰度度系系数数、偏偏度度系系数数等等,可可以以利利用用上上述述统统计计函函数数计计算算。但但Excel提提供供了了一一种种更更快快捷捷的的方方法法,就就是是描描述述统统计计工工具具。描描述述统统计计分分析析工工具具用用于于生生成成数数据据源源区区域域中中数数据据的的单单变变量量统统计计分分析析报报表表,它它可可以以同同时时计计算算出出一一组组数数据据的的多多个个常常用用统统计计量量,提提供供有有关关数数据据集集中中趋趋势势和和离离中中趋趋势势以以及分布形态等方面的信息。及分布形态等方面的信息。返回首页例例3-6 调调查查某某企企业业生生产产车车间间10名名工工人人的的月月工工资资水水平平,资资料料如如图图3-12所所示示。用用描描述述统统计计工工具具对对工工人人工资数据进行分析。工资数据进行分析。图3-12 工资资料图3-13 “统计描述”对话框图3-14 “描述统计”工具输出结果返回本节