《第四章差异量数精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章差异量数精选文档.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章差异量数本讲稿第一页,共三十页描述数据离散程度的统计量称为差异量数。描述数据离散程度的统计量称为差异量数。差异量越大,表明数据越分散、不集中;差异量差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。越小,表明数据越集中,变动范围越小。一组数据的离散程度,常常通过数据的一组数据的离散程度,常常通过数据的离中趋势特点进行分析。离中趋势特点进行分析。本讲稿第二页,共三十页一、全距、百分位距(差)和四分位距(差)全距全距 R R(range)全距是一组数据中的最大值全距是一组数据中的最大值(maximum)与该组数据中最)与该组数据中最小值(小值(minimum)之差
2、,又称)之差,又称极差。极差。RXmaxXmin本讲稿第三页,共三十页百分位差(百分位距)百分位差是指两个百分位数(百分位差是指两个百分位数(percentile)之差。)之差。百分位数是指量尺上的一个点,在此点以下,包百分位数是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。常用括数据分布中全部数据个数的一定百分比。常用PpPp或或PmPm表示。表示。第第P P百分位数指在其值为百分位数指在其值为P P的数据以下,包括分布的数据以下,包括分布中全部数据的的百分之中全部数据的的百分之p p或或m m。本讲稿第四页,共三十页因以全距表示因以全距表示数据离散程度数据离散程度时
3、受极端数影时受极端数影响,取消分布响,取消分布两端两端10%的的数据,即数据,即P90-P90-P10P10指量尺上的一指量尺上的一个点,在此点个点,在此点以下,包括数以下,包括数据分布中全部据分布中全部数据个数的一数据个数的一定百分比定百分比四分位差也视四分位差也视为百分位差的为百分位差的一种,指在一一种,指在一个次数分配中,个次数分配中,中间中间50%的次的次数的距离的一数的距离的一半。半。百分位数百分位数百分位差百分位差四分位差四分位差本讲稿第五页,共三十页 P P P Pp p p p为所求的第为所求的第为所求的第为所求的第P P P P个百分数个百分数个百分数个百分数 LbLbLbL
4、b百分位数所在组的精确下限百分位数所在组的精确下限百分位数所在组的精确下限百分位数所在组的精确下限 f f f f为百分位数所在组的次数为百分位数所在组的次数为百分位数所在组的次数为百分位数所在组的次数 FbFbFbFb为小于为小于为小于为小于LbLbLbLb的各组次数的和的各组次数的和的各组次数的和的各组次数的和 N N N N为总次数为总次数为总次数为总次数 i i i i为组距为组距为组距为组距 PRPRPRPR为所求的第为所求的第为所求的第为所求的第P P P P个百分等级个百分等级个百分等级个百分等级 X X X X为给定的原始分数为给定的原始分数为给定的原始分数为给定的原始分数 L
5、bLbLbLb为该分数所在组的精确下限为该分数所在组的精确下限为该分数所在组的精确下限为该分数所在组的精确下限 f f f f为该分数所在组的次数为该分数所在组的次数为该分数所在组的次数为该分数所在组的次数 FbFbFbFb为小于为小于为小于为小于LbLbLbLb的各组次数的和的各组次数的和的各组次数的和的各组次数的和 N N N N为总次数为总次数为总次数为总次数 i i i i为组距为组距为组距为组距百分位数的计算公式百分位数的计算公式百分等级的计算公式百分等级的计算公式本讲稿第六页,共三十页常用的百分位距有两种:常用的百分位距有两种:P P9090P P1010和和 P P9393P P
6、7 7。用几个百分位距能较好地反映一组数据的差异用几个百分位距能较好地反映一组数据的差异程度。程度。本讲稿第七页,共三十页计算公式公式中公式中:f fb bp p为某一百分位数所在组下限以下的累积为某一百分位数所在组下限以下的累积 频频数数f fp p为某一百分位数所在组的频数为某一百分位数所在组的频数b bp p为某一百分位数所在组的精确下限为某一百分位数所在组的精确下限本讲稿第八页,共三十页四分位距四分位距是第一个四分位四分位距是第一个四分位数与第三个四分位数之差的数与第三个四分位数之差的一半一半,计算公式为计算公式为本讲稿第九页,共三十页其中:用中位数作集中量时,常用四分位距作差异量。用
7、中位数作集中量时,常用四分位距作差异量。本讲稿第十页,共三十页二、平均差平均差(平均差(average deviation 或者或者 mean deviation)是指一组数据中,每一个数据与)是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均该组数据的平均数离差的绝对值的算术平均数,通常用数,通常用ADAD或或MDMD表示。表示。本书中均以本书中均以ADAD表示。表示。本讲稿第十一页,共三十页原始数据计算公式原始数据计算公式次数分布表计算公式平均差意义明确,计算容易,反应灵敏。但平均差意义明确,计算容易,反应灵敏。但计算时要用绝对值,不适合代数运算,因此在进计算时要用绝对值,
8、不适合代数运算,因此在进一步统计分析中应用较少。一步统计分析中应用较少。本讲稿第十二页,共三十页三、方差和标准差方差(又称为变异数、均方)。是表示一组数据离散方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用程度的统计指标。一般样本的方差用 表示,总体的方差表示,总体的方差用用 表示。表示。标准差(标准差(standard deviation)是方差的算术平)是方差的算术平方根。一般样本的标准差用方根。一般样本的标准差用 S 表示,总体的标准差用表示,总体的标准差用 表示。表示。标准差和方差是描述数据离散程度的最常用的差异量。标准差和方差是描述数据离散程度的最常用的
9、差异量。本讲稿第十三页,共三十页1.方差和标准差的定义本讲稿第十四页,共三十页2方差和标准差的计算公式 未分组数据未分组数据未分组数据:未分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式本讲稿第十五页,共三十页分组数据:分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式本讲稿第十六页,共三十页样本方差和标准差 未分组数据未分组数据分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计
10、算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:样本方差用自由样本方差用自由度度n-1n-1去除去除本讲稿第十七页,共三十页表表5-1 525-1 52名学生数学成绩方差和标准差计算表名学生数学成绩方差和标准差计算表成绩成绩组中值组中值Xc频数频数f fF*XcF*XC2计计 算算959597.52 219519012.5909092.52 218517112.5858587.53 3262.522968.75808082.55 5412.534031.25757577.58 862048050707072.51111797.557
11、818.75656567.59 9607.541006.25606062.55 5312.519531.25555557.54 423013225505052.52 21055512.5454547.51 147.52256.25合计合计523775280525本讲稿第十八页,共三十页3总标准差的合成 方差具有可加性的特点。当已知几个小组方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。联合在一起的总的方差或标准差。需要注意的是,只有在应用同一种观测手需要注意的是,只有在应用同一种观测手段,测量的是同一
12、种特质,只是样本不同的段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。数据时,才能计算合成方差或标准差。本讲稿第十九页,共三十页计算公式公式中公式中:为总方差为总方差,为总标准差为总标准差 S Si i为各小组标准差为各小组标准差 n ni i为各小组数据个数为各小组数据个数 (511)(512)本讲稿第二十页,共三十页4方差和标准差的性质方差是对一组数据中各种变异的总和的测量方差是对一组数据中各种变异的总和的测量,具具有有可加性可加性可加性可加性和和可分解性可分解性可分解性可分解性特点。特点。标准差是一组数据方差的算术平方根,它标准差是一组数据方差的算术平方根,它不可
13、以不可以不可以不可以进行代数计算,但有以下特性:进行代数计算,但有以下特性:如果则如果则本讲稿第二十一页,共三十页方差与标准差的性质方差与标准差的性质性质1性质2性质3每一个观测数据乘以一个相同常数每一个观测数据乘以一个相同常数C之后,则所得标准之后,则所得标准差等于原标准差乘以这个常数。差等于原标准差乘以这个常数。若若Yi=XiC 则有则有每一个观测值都乘以同一个常数每一个观测值都乘以同一个常数C(C0),再加上一个常),再加上一个常数数d,所得的标准差等于原标准差乘以这个常数,所得的标准差等于原标准差乘以这个常数C。若。若Yi=XiC+d(C0)则有则有每一个观测数据加上一个相同常数每一个
14、观测数据加上一个相同常数C之后,计算到的标准之后,计算到的标准差等于原标准差。差等于原标准差。若若Yi=Xi+C 则有则有本讲稿第二十二页,共三十页5 5 方差与标准差的意义方差与标准差的意义方差与标准差是表示一组数据离散程度的最好指标。其值方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大,该组数据较分散;其值越越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。他们是统计小,说明次数分布的数据比较集中,离散程度越小。他们是统计描述和统计推断分析中最常用的差异量数。在描述统计部分,只描述和统计推断分析中最常用的
15、差异量数。在描述统计部分,只需要标准差就足以说明一组数据的离中趋势需要标准差就足以说明一组数据的离中趋势优点:反应灵敏优点:反应灵敏;计算公式严密计算公式严密;容易计算;适合代数运算;容易计算;适合代数运算;受抽样变动小;简单明了。受抽样变动小;简单明了。具有数学上的优越性,特备适当已知一组数的平均数与标准差后,具有数学上的优越性,特备适当已知一组数的平均数与标准差后,就可知道落在平均数上下各一个标准差,两个标准差或个标准差范围就可知道落在平均数上下各一个标准差,两个标准差或个标准差范围之内的数据所占的百分比。之内的数据所占的百分比。本讲稿第二十三页,共三十页四相对差异量1.差异系数的概念及计
16、算公式差异系数(差异系数(coefficient of variation)是指)是指标准差与其算术平均数的百分比,它是没有单标准差与其算术平均数的百分比,它是没有单位的相对数。常以位的相对数。常以CVCV表示表示,其计算公式为其计算公式为 (513)本讲稿第二十四页,共三十页2.差异系数的作用比较比较不同单位不同单位资料的差异程度资料的差异程度 比较单位相同而比较单位相同而平均数相差较大平均数相差较大的两组资的两组资料的差异程度料的差异程度可判断可判断特殊差异特殊差异情况情况 根据经验,一般根据经验,一般CVCV值常在值常在5 53535之间。如之间。如果果CVCV大于大于3535时,可怀疑
17、所求得的平均数是否失去时,可怀疑所求得的平均数是否失去了意义;如果了意义;如果CVCV小于小于5 5时,可怀疑平均数与标准时,可怀疑平均数与标准差是否计算有误。差是否计算有误。本讲稿第二十五页,共三十页例例1:1:比较计量单位不同的数据资料的差异程度比较计量单位不同的数据资料的差异程度19751975年上海市区年上海市区6 6岁男童体重与身高数据:岁男童体重与身高数据:平均数平均数标准差标准差差异系数差异系数体重体重19.3919.39千克千克2.162.16千克千克11.14%11.14%身高身高115.87115.87厘米厘米4.864.86厘米厘米4.19%4.19%本讲稿第二十六页,共
18、三十页例例2:2:比较单位相同而平均数相关较大的两组资料的差异程度。比较单位相同而平均数相关较大的两组资料的差异程度。1975年上海市区两组女童体重的数据:年上海市区两组女童体重的数据:平均数平均数标准差标准差差异系数差异系数2个月组个月组5.455.45千克千克0.620.62千克千克11.38%11.38%6岁组岁组19.0219.02千克千克2.122.12千克千克11.15%11.15%本讲稿第二十七页,共三十页3.差异系数的应用条件差异系数主要应用于平均数不等于差异系数主要应用于平均数不等于零的连续数据。零的连续数据。学科成绩可以勉强计算差异系数学科成绩可以勉强计算差异系数。本讲稿第
19、二十八页,共三十页1.1.依据客观数据,而非主观估计依据客观数据,而非主观估计2.2.计算应用全部数据,而非部分数据计算应用全部数据,而非部分数据3.3.简便易懂简便易懂4.4.计算方便计算方便5.5.具有样本稳定性具有样本稳定性6.6.适合代数运算适合代数运算 优良差异量数应具备的标准优良差异量数应具备的标准本讲稿第二十九页,共三十页各种差异量数的关系各种差异量数的关系S=1.2533AD=1.4826QS=1.2533AD=1.4826QAD=0.7979S=1.1829QAD=0.7979S=1.1829QQ=0.6745S=0.8453ADQ=0.6745S=0.8453AD本讲稿第三十页,共三十页