《离中趋势测量法精选文档.ppt》由会员分享,可在线阅读,更多相关《离中趋势测量法精选文档.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、离中趋势测量法离中趋势测量法本讲稿第一页,共二十三页 所谓离中趋势,是指数列中各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数代表性低。例如有例如有A A、B B、C C、DD四组学生各四组学生各5 5人的成绩如下:人的成绩如下:A A组:组:60 60,6060,6060,6060,6060 B B组:组:5858,5959,6060,6161,6262 C C组:组:4040,5050,6060,7070,8080 D D组:组:8080,8080,8080,8080,8080 数据显示,平均数相同,离势可能不同;平均数不数据显示,平均数相同,离势可能不同;平均数不同
2、,离势可能相同。同,离势可能相同。本讲稿第二页,共二十三页2022/9/212 变异指标如按数量关系来分有以下两类;变异指标如按数量关系来分有以下两类;n n凡用绝对数来表达的变异指标,统称绝对离势凡用绝对数来表达的变异指标,统称绝对离势凡用绝对数来表达的变异指标,统称绝对离势凡用绝对数来表达的变异指标,统称绝对离势;n n凡用相对数来表达的变异指标,统称相对离势凡用相对数来表达的变异指标,统称相对离势凡用相对数来表达的变异指标,统称相对离势凡用相对数来表达的变异指标,统称相对离势;主要有极差、平均差、四分位差、标准差等。主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。变异指标变异
3、指标用以反映总体各单位标志值的变动范围或参差程度,用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。与平均指标相对应,从另一个侧面反映了总体的特征。本讲稿第三页,共二十三页2022/9/213第一节 全距与四分位差1.1.全距全距全距全距(Range)(Range)R=X R=Xmaxmax X Xminmin 例例 求求7474,8484,6969,9191,8787,7474,6969这些数字这些数字的全距。的全距。解解 把数字按顺序重新排列:把数字按顺序重新排列:6969,6969,7474,7474,8484,8787,9191,显然有,显然
4、有 R=XR=Xmaxmax X Xminmin 916991692222全距(全距(全距(全距(R R):最大值和最小值之差。也叫):最大值和最小值之差。也叫):最大值和最小值之差。也叫):最大值和最小值之差。也叫极差极差极差极差。全距越全距越全距越全距越大,表示变动越大。大,表示变动越大。大,表示变动越大。大,表示变动越大。本讲稿第四页,共二十三页2022/9/214 运用上述方法计算左边数列的全距对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:(1 1)用组值最
5、大组的组中值减去最小组的组中值)用组值最大组的组中值减去最小组的组中值 (2 2)用组值最大组的上限减去最小组的下限)用组值最大组的上限减去最小组的下限 (3 3)用组值最大组的组中值减去最小组的下限;)用组值最大组的组中值减去最小组的下限;或最大组的上限减去最小组的组中值或最大组的上限减去最小组的组中值本讲稿第五页,共二十三页2022/9/215优点:优点:缺点:缺点:计算简单、计算简单、计算简单、计算简单、直观。直观。直观。直观。(1 1)受极端值影响大;)受极端值影响大;)受极端值影响大;)受极端值影响大;(2 2)没有量度中间各个单位间的差异没有量度中间各个单位间的差异没有量度中间各个
6、单位间的差异没有量度中间各个单位间的差异性,数据利用率性,数据利用率性,数据利用率性,数据利用率 低,信息丧失严重;低,信息丧失严重;低,信息丧失严重;低,信息丧失严重;(3 3)受抽样变动影响大,大样本)受抽样变动影响大,大样本)受抽样变动影响大,大样本)受抽样变动影响大,大样本全距比小样本全距大。全距比小样本全距大。全距比小样本全距大。全距比小样本全距大。本讲稿第六页,共二十三页2022/9/2162.2.四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)第三四分位数和第一四分位数的半距。第三四分位数和第一四分位数的半距。第三四
7、分位数和第一四分位数的半距。第三四分位数和第一四分位数的半距。避免全距受极端值影响大的缺点。避免全距受极端值影响大的缺点。避免全距受极端值影响大的缺点。避免全距受极端值影响大的缺点。求下列两组成绩的四分位差:求下列两组成绩的四分位差:求下列两组成绩的四分位差:求下列两组成绩的四分位差:A:78 80 82 85 89 87 90 86 79 88 84 81A:78 80 82 85 89 87 90 86 79 88 84 81B:55 68 78 88 99 100 98 90 85 83 84 81B:55 68 78 88 99 100 98 90 85 83 84 81 请大家计算一
8、下,看能否算对本讲稿第七页,共二十三页2022/9/217第二节 平均差(Mean absolute deviation(Mean absolute deviation)要测定变量值的离中趋势,尤其是要测定各变量要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差。算各变量值与算术平均数的离差。平均差是平均差是平均差是平均差是离差绝对值离差绝对值离差绝对值离差绝对值的算术平均数。(的算术平均数。(的算术平均数。(的算术平均数。(mean deviation)mean deviati
9、on)1.1.对于未分组资料对于未分组资料对于未分组资料对于未分组资料 A D=A D=2.2.对于分组资料对于分组资料对于分组资料对于分组资料 A D=A D=3.3.平均差的性质平均差的性质平均差的性质平均差的性质 在受抽样变动、极端值影响,处理不确定组距方面均同于算在受抽样变动、极端值影响,处理不确定组距方面均同于算在受抽样变动、极端值影响,处理不确定组距方面均同于算在受抽样变动、极端值影响,处理不确定组距方面均同于算术平均数;不适于代数运算,其理论意义不易阐述。术平均数;不适于代数运算,其理论意义不易阐述。术平均数;不适于代数运算,其理论意义不易阐述。术平均数;不适于代数运算,其理论意
10、义不易阐述。本讲稿第八页,共二十三页2022/9/218 例例例例1 1 试分别以算术平均数为基准,求试分别以算术平均数为基准,求试分别以算术平均数为基准,求试分别以算术平均数为基准,求8585,6969,6969,7474,8787,9191,7474这些数字的平均差。这些数字的平均差。这些数字的平均差。这些数字的平均差。例例例例2 2 试以算术平均数为基准,求下表所示数据试以算术平均数为基准,求下表所示数据试以算术平均数为基准,求下表所示数据试以算术平均数为基准,求下表所示数据的平均差。的平均差。的平均差。的平均差。计算左边数列的平均差本讲稿第九页,共二十三页2022/9/219第三节 标
11、准差(standard deviation)各变量值对其算术平均数的离差平方的算各变量值对其算术平均数的离差平方的算各变量值对其算术平均数的离差平方的算各变量值对其算术平均数的离差平方的算术平均数的平方根,术平均数的平方根,术平均数的平方根,术平均数的平方根,均方差,均方差,又称用又称用又称用又称用S S表示。表示。表示。表示。即克服平均差带有绝对值的缺点,又保留其即克服平均差带有绝对值的缺点,又保留其即克服平均差带有绝对值的缺点,又保留其即克服平均差带有绝对值的缺点,又保留其综合平均的优点。综合平均的优点。综合平均的优点。综合平均的优点。1.1.对于未分组资科对于未分组资科对于未分组资科对于
12、未分组资科 本讲稿第十页,共二十三页2022/9/2110 求求7272、8181、8686、6969、5757这些数字的标准差。这些数字的标准差。本讲稿第十一页,共二十三页2022/9/21112.2.对于分组资料对于分组资料对于分组资料对于分组资料 计算左边数列的标准差本讲稿第十二页,共二十三页2022/9/2112 计算左边数列的标准差 例例例例 调查大一男生调查大一男生调查大一男生调查大一男生6060人的身高情况如下表所示,求人的身高情况如下表所示,求人的身高情况如下表所示,求人的身高情况如下表所示,求他们身高的标准差。他们身高的标准差。他们身高的标准差。他们身高的标准差。本讲稿第十三
13、页,共二十三页2022/9/2113 解解解解 因为是分组资料,计算标准差运用加权式,并因为是分组资料,计算标准差运用加权式,并因为是分组资料,计算标准差运用加权式,并因为是分组资料,计算标准差运用加权式,并参见下表参见下表参见下表参见下表本讲稿第十四页,共二十三页2022/9/2114 标准差是反映总体各单位标志值的离散状况和差异标准差是反映总体各单位标志值的离散状况和差异程度的最佳测度。程度的最佳测度。(1 1)以算术平均数为基准计算的标准差比以其他任)以算术平均数为基准计算的标准差比以其他任何数值为基准计算的标准差要小。何数值为基准计算的标准差要小。“最小二乘方最小二乘方最小二乘方最小二
14、乘方”性质性质性质性质各变量值对算术平均数的离差的平方和,必定小于他们各变量值对算术平均数的离差的平方和,必定小于他们对任何其他数偏差的平方和。对任何其他数偏差的平方和。(2 2)它将总体中各单位标志值的差异全包括在内,受)它将总体中各单位标志值的差异全包括在内,受抽样变动影响小。但在受极端值影响以及处理不确定组抽样变动影响小。但在受极端值影响以及处理不确定组距方面,缺点同算术平均数。距方面,缺点同算术平均数。值得注意的是,在推论统计中我们将发现,方差是值得注意的是,在推论统计中我们将发现,方差是比标准差更有理论价值的概念。所谓方差,即标准差的比标准差更有理论价值的概念。所谓方差,即标准差的平
15、方,它直接写成平方,它直接写成 。也常被称为变异数。也常被称为变异数。3.3.标准差的性质标准差的性质标准差的性质标准差的性质本讲稿第十五页,共二十三页2022/9/21154.4.标准分标准分标准分标准分(standard score)(standard score)以离差和标准差的比值来测定变量以离差和标准差的比值来测定变量以离差和标准差的比值来测定变量以离差和标准差的比值来测定变量 与与与与 的相的相的相的相对位置。使原来不能直接比较的离差标准化,可以相对位置。使原来不能直接比较的离差标准化,可以相对位置。使原来不能直接比较的离差标准化,可以相对位置。使原来不能直接比较的离差标准化,可以
16、相互比较,加、减、平均。互比较,加、减、平均。互比较,加、减、平均。互比较,加、减、平均。(1 1)Z Z是和是和是和是和X X一一对应的变量值;一一对应的变量值;一一对应的变量值;一一对应的变量值;(2 2)Z Z分数没有单位,是一个不受原资料单位影分数没有单位,是一个不受原资料单位影分数没有单位,是一个不受原资料单位影分数没有单位,是一个不受原资料单位影响的相对数,所以可以用于不同单位资料的比较;响的相对数,所以可以用于不同单位资料的比较;响的相对数,所以可以用于不同单位资料的比较;响的相对数,所以可以用于不同单位资料的比较;(3 3)Z Z分数实际表达了变量值距总体均值有几个标分数实际表
17、达了变量值距总体均值有几个标分数实际表达了变量值距总体均值有几个标分数实际表达了变量值距总体均值有几个标准差。准差。准差。准差。本讲稿第十六页,共二十三页2022/9/2116 Z Z分数也有标准正态变量之称。按分数也有标准正态变量之称。按分数也有标准正态变量之称。按分数也有标准正态变量之称。按Z Z值大小编制值大小编制值大小编制值大小编制出的正态分布表,其用途十分广泛。出的正态分布表,其用途十分广泛。出的正态分布表,其用途十分广泛。出的正态分布表,其用途十分广泛。Z Z分数的性质:分数的性质:分数的性质:分数的性质:Z Z Z Z分数之和等于分数之和等于分数之和等于分数之和等于0 0 0 0
18、Z Z分数的算术平均数等于分数的算术平均数等于分数的算术平均数等于分数的算术平均数等于0 0Z Z分数的标准差等于分数的标准差等于分数的标准差等于分数的标准差等于1 1,方差也等于,方差也等于,方差也等于,方差也等于1 1本讲稿第十七页,共二十三页2022/9/2117第四节 相对离势 上述各种反映离中趋势的变异指标,都具有和原上述各种反映离中趋势的变异指标,都具有和原资料相同的计算单位,称绝对离势。但欲比较具有不资料相同的计算单位,称绝对离势。但欲比较具有不同单位的资料的参差程度,或比较单位虽相同而均值同单位的资料的参差程度,或比较单位虽相同而均值不相同的资料的参差程度,离势的绝对指标则很可
19、能不相同的资料的参差程度,离势的绝对指标则很可能导致某些错误结论。所以,我们还得了解和学习相对导致某些错误结论。所以,我们还得了解和学习相对离势。离势。1.1.变异系数变异系数 绝对离势统计量与其算术平均数的比率,绝对离势统计量与其算术平均数的比率,用用V V表示。变异系数是最具有代表性的相对离势。表示。变异系数是最具有代表性的相对离势。本讲稿第十八页,共二十三页2022/9/2118n n全距系数全距系数 全距系数是众数据的全全距系数是众数据的全距与其算术平均数之比,其计距与其算术平均数之比,其计算公式是算公式是n n平均差平均差系数系数 平均差系数是众数据的平平均差系数是众数据的平均差与其
20、算术平均数之比,其均差与其算术平均数之比,其计算公式是计算公式是n n标准差系数标准差系数 标准差系数是众数据的标标准差系数是众数据的标准差与其算术平均数之比,其准差与其算术平均数之比,其计算公式是计算公式是本讲稿第十九页,共二十三页2022/9/2119 2.异众比率 所谓异众比率,是指非众数的频数与总体单位数所谓异众比率,是指非众数的频数与总体单位数的比值,用的比值,用V RV R来表示来表示 其中:其中:为众数的频数;为众数的频数;是总体单位数是总体单位数 异众比率能表明众数所不能代表的那一部分异众比率能表明众数所不能代表的那一部分异众比率能表明众数所不能代表的那一部分异众比率能表明众数
21、所不能代表的那一部分变量值在总体中的比重。变量值在总体中的比重。变量值在总体中的比重。变量值在总体中的比重。本讲稿第二十页,共二十三页2022/9/2120 例例1 1:某项调查发现,现今三口之家的家庭最多:某项调查发现,现今三口之家的家庭最多(32%32%),求异众比率。某开发商根据这一报导,将房),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?积,你认为如何呢?例例2 2:设为测体重,得到成人组和婴儿组各:设为测体重,得到成人组和婴儿组各100100人的人的两个抽样总体。成人组平均体重
22、为两个抽样总体。成人组平均体重为6565千克,全距为千克,全距为1010千千克;婴儿组平均体重为克;婴儿组平均体重为4 4千克,全距为千克,全距为2.52.5千克。能否认千克。能否认为成人组体重的离势比婴儿组体重的离势大?为成人组体重的离势比婴儿组体重的离势大?例例3 3:对一个群体测量身高和体重,平均身高为:对一个群体测量身高和体重,平均身高为170.2170.2厘米,身高标准差为厘米,身高标准差为5.305.30厘米;平均体重为厘米;平均体重为7070千克,千克,体重标准差为体重标准差为4.774.77千克。比较身高和体重的离散程度。千克。比较身高和体重的离散程度。本讲稿第二十一页,共二十
23、三页2022/9/21213.3.偏态系数偏态系数 我们在前面讨论统计图时已经对频数分布的正态和我们在前面讨论统计图时已经对频数分布的正态和我们在前面讨论统计图时已经对频数分布的正态和我们在前面讨论统计图时已经对频数分布的正态和偏态有所认识。我们又看到了算术平均数与中位数、众偏态有所认识。我们又看到了算术平均数与中位数、众偏态有所认识。我们又看到了算术平均数与中位数、众偏态有所认识。我们又看到了算术平均数与中位数、众数之间存在的关系:当总体呈对称分布时,、数之间存在的关系:当总体呈对称分布时,、数之间存在的关系:当总体呈对称分布时,、数之间存在的关系:当总体呈对称分布时,、三者完全相等;当总体
24、呈不对称的偏态分布时,它们之三者完全相等;当总体呈不对称的偏态分布时,它们之三者完全相等;当总体呈不对称的偏态分布时,它们之三者完全相等;当总体呈不对称的偏态分布时,它们之间存在着数量间存在着数量间存在着数量间存在着数量(位置位置位置位置)的差异。因此,偏态可由的差异。因此,偏态可由的差异。因此,偏态可由的差异。因此,偏态可由与与与与的差来表示,即的差来表示,即的差来表示,即的差来表示,即 为了使不同数列的偏态值可比,同样可计算偏态的相为了使不同数列的偏态值可比,同样可计算偏态的相为了使不同数列的偏态值可比,同样可计算偏态的相为了使不同数列的偏态值可比,同样可计算偏态的相对数,即偏态系数,用对
25、数,即偏态系数,用对数,即偏态系数,用对数,即偏态系数,用 来表示来表示来表示来表示本讲稿第二十二页,共二十三页2022/9/2122偏斜系数是以标准差为单位的算术平均偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在数与众数的离差,其取值一般在0 0与土与土3 3间。间。偏斜系数为偏斜系数为0 0表示对称分布,偏斜系数为或则表示对称分布,偏斜系数为或则表示极右或极左偏态。表示极右或极左偏态。年龄年龄人数人数15152525252535353535454545455555555565 65 3 3 7 71212181810 10 讨论左边数列关于年龄的偏态和偏态系数本讲稿第二十三页,共二十三页2022/9/2123