《2022年第三章统计学教案 .pdf》由会员分享,可在线阅读,更多相关《2022年第三章统计学教案 .pdf(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学习必备欢迎下载第三章统计分布的数值特征只知道什么是统计分布是不够的,还必须学会对其进行量化描述。描述统计分布的重要的特征值有两个, 一个是说明其集中趋势的平均指标,另一个是说明其离散程度的变异指标。这一对矛盾的指标分别从不同角度反映了统计分布的分布特点,它们相辅相成,相互补充,缺一不可。 本章着重就这两个指标展开讨论,介绍了它们的理论、方法与应用,充分理解掌握本章的内容,对于以后各章节的学习尤为重要。本章的目的与要求通过本章学习, 要求学生在了解总体分布的两个重要特征值就是平均指标与变异指标的前提下,着重掌握这两个指标的计算方法及其数学性质;明确反映集中趋势的各种平均指标的计算特点与作用、反
2、映离散程度的各种变异指标的计算特点与作用;还要学会利用这两个特征值得各自数学性质,采用简捷法计算算术平均数和标准差,以提高计算效率;此外,算术、调和与几何平均数三者之间的关系,算术平均数与众数、中位数之间的关系等也是学生应充分理解掌握的内容。本章主要内容(计划学时7 )一、分布的集中趋势(1)数值平均数1、算术平均数2、调和平均数3、几何平均数二、分布的集中趋势(2)位置平均数1、众数2、中位数3、其他分位数三、分布的离中趋势变异指标1、变异全距2、平均差3、标准差4、变异系数学习重点一、重点掌握各种平均数的特点、应用条件、应用范围和计算方法,及其相互之间的关系;二、了解变异指标的意义和作用,
3、熟练掌握各种变异指标的计算方法,尤其应重点掌握标准差的计算与应用;三、理解掌握算术平均数与标准差的数学性质,并且能利用其数学性质进行简捷计算;四、明确平均指标与变异指标的相互关系及其运用原则。学习难点一、各种平均指标的应用条件、运用范围,尤其是加权算术权数的选择;二、根据所掌握的资料,应选择算术平均或调和平均方法; 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 23 页学习必备欢迎下载三、标准差的理论依据及其计算方法,尤其是成数标准差的计算更是初学者不易掌握的问题。第一节分布的集中趋势( 1)数值平均数一、统计平均数1、反映总体分布的
4、集中趋势2、反映统计数列所达到的一般水平(静态、动态)3、与强度相对数的区别二、算术平均数(用Ax表示)(一)算术平均数的基本内容:算术平均数总体单位总量总体标志总量(二)简单算术平均数nxnxxxxniinA121可简写为:nxxA式中:xi为变量值n 是总体单位数为总和符号例 31.1 从某味精厂的生产线上随机抽取了10 包味精,测得每包净重分别为(单位:克)499 497 501 499 502 503 500 499 498 500 将此十个数据相加除以十就是算术平均数(结果为499.8 克) 。(三)加权算术平均数对平均数的大小起着权衡轻重作用的数称为权数1、用绝对数作权数niini
5、iinnnAffxffffxfxfxx11212211可简写为:fxfxA(特点:先乘后除)式中:x 为变量值,精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 23 页学习必备欢迎下载f 是各变量值出现的次数计算见例31.2 例 31.2 某工厂一生产班组150 名工人日产零件数如下:日产零件数(件)组中值x 工人数f 人数比重ffx f ffx300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 3 12 24 57 30 18
6、6 2 8 16 38 20 12 4 750 4200 10800 31350 19500 13500 5100 5.0 28.0 72.0 209.0 130.0 90.0 34.0 合计150 100 85200 568.0 15085200fxfxA568(件)2、用相对数作权数ffxffxffxffxxnnA2211(特点:先除后乘)计算见例31.2 ffxxA568(件)两者的关系如下:ffxffxffxffxxnnA2211ffxffxffxnn2211fxf3、简单算术平均数与加权算术平均数的关系当f1 = f2 = = fn时nnnAffffxfxfxx212211fnfxx
7、xn)(21nxfnxf精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 23 页学习必备欢迎下载(四)算术平均数的数学性质1、算术平均数与总体单位数的乘积等于各变量值总和; (1)简单式xnx(2)加权式xffx2、各变量值与算术平均数离差之和等于0;(1)简单式)(xx0 (2)加权式fxx)(0 3、各变量值与其算术平均数离差的平方之和为最小值;(1)简单式2)(xx为最小值证明:设xx02020)()()(xxxxxx)()(2)()(0202xxxxxxnxx因为:0)(xx,所以20220)()()(xxnxxxx式中20)(
8、xxn0 ,所以2)(xx为最小(2)加权式fxx2)(为最小值4、各变量值加减一任意数A,算术平均数也加减这一任意数A;(1)简单式精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 23 页学习必备欢迎下载AxnAx)((2)加权式AxffAx)(5、各变量值乘除于一任意数d,算术平均数也乘除于d;(1)简单式dxndx(2)加权式dxffdx综合第四、第五数学性质得:xbabxa证明:bxa= nbxa)(= nxbna= a bx说明对被平均的变量施加某种线性变换,新变量的算术平均数就等于对原变量的算术平均数施加同样线性变换的结果。
9、6、两个独立变量和的平均数,等于这两个独立变量平均数的和。即yxyx证明:yx= mnyxmjniji11)(= mnynxmjniji11)(= mnynxmnimjji11精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 23 页学习必备欢迎下载= mynxmjjnii11= yx这一结论还可以推广到任意多个变量。(五)算术平均数的简捷计算00)(xdffdxxx(根据第4 和第5 个数学性质,算术平均数的简捷计算公式还可以写出许多种)例 31.2 某工厂一生产班组150 名工人日产零件数如下:日产零件数(件)组中值x 工人数f x
10、550 100550 xfx100550300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 3 12 24 57 30 18 6 300 200 100 0 100 200 300 3 2 1 0 1 2 3 9 24 24 0 30 36 18 合计150 27 设: x0550 , d 100 ,00)(xdffdxxx55010015027 568(件)三、调和平均数(用Hx表示)(一)调和平均数的数学意义调和平均数是各变量值倒数的算术平均数的倒数,所以也称倒数平均数。即12111
11、1Hnnnxxxxx(二)调和平均数的统计意义统计上的调和平均数要求其计算结果、分析结论要与算术平均数的相同,即,要保证仍然是 “总体标志总量与总体单位总量的比”。1、简单调和平均数:1Hnxx(见例 31.3)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 23 页学习必备欢迎下载2、加权调和平均数:1Hmxmx(见例 3 1.4)(当各种价格所购买的金额不是1 元,而是 mi元,这时计算平均价格就应采用加权调和平均数的方法)例 31.3 某蔬菜价格资料如下:价格(元 /500 克) x购买数量( 500 克) f购买金额(元)xf早
12、市午市晚市0.50 0.40 0.25 1 1 1 0.50 0.40 0.25 合计3 1.15 计算平均价格:383.0315.1nxxA(元 /500 克)价格(元 /500 克) x购买金额(元)m购买数量( 500 克) m/x 早市午市晚市0.50 0.40 0.25 1 1 1 2.0 2.5 4.0 合计3 8.5 计算平均价格:3 53. 05. 831xnxH(元 /500 克)当购买的金额不是1 元而是多元时,按加权调和平均数的方法计算:例 31.4 某蔬菜价格资料如下:价格(元 /500 克) x购买金额(元)m购买数量( 500 克) m/x 早市午市晚市0.50 0
13、.40 0.25 20 40 15 40 100 60 合计75 200 计算平均价格:375.075200 xmmxH(元 /500 克)计算时,可根据变量的计量单位(元/500 克)确定分子分母。当已知分母,未知分子时,采用算术平均的方法计算;当已知分子,未知分母时,采用调和平均的方法计算;本例已知购买金额(已知分子,分母未知),应采用调和平均的方法计算平均数。3、加权调和平均数与加权算术平均数的关系当x f = m 时,f =xm, 则精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 23 页学习必备欢迎下载fxf=mxm1(三)调
14、和平均数与算术平均数的计算要点1、当现象总体的总量资料是由各个个体的数值相加所得时,用算术或调和平均的方法计算平均数。2、当掌握算式的分母资料(即总体单位总量),未知分子资料(即总体标志总量),采用算术的方法; 当掌握算式的分子资料(即总体标志总量),未知分母资料(即总体单位总量),采用调和的方法。3、选择单位数加权时,采用算术平均方法;而选择标志总量加权时,则采用调和平均的方法。4、对相对数或平均数求平均时,计算时的计算形式应与被平均的相对数或平均数的原形式保持一致。四、几何平均数(用Gx表示)(当现象总体的量与各个个体的量之间的关系为积商关系时,用几何平均的方法计算平均数)(一)简单几何平
15、均数12nnGnxxxxx(二)加权几何平均数121212nnffffffffGnxxxxx显然,几何平均数是n 个变量值连乘积的n 次方根,适用于计算平均比率或平均速度时,且统计中运用较多的是简单几何平均数。将几何平均数采用对数的形式表示,就成为取对数以后的算术平均数,所以几何平均数也称为对数平均数。即简单式xnxxxnxnGlg1)lglg(lg1lg21加权式xffxfxfxffxnnGlg1)lglglg(1lg2211五、幂平均数对于给定的一组变量值:)(21nxxxx、,其“ k 阶幂平均数(用Mk表示) ”定义为:1、简单式Mk = kknx12、加权式Mk = kkffx1当
16、k = 1 时,则 M1就是算术平均数Ax;当 k = -1 时, M-1就是调和平均数Hx;精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 23 页学习必备欢迎下载当 k = 2 时, M 2就是平方平均数的平方根S;当 k = 0 时, M 0的极限就给出几何平均数Gx。证明:设a b 则(a - b)2 0 a2 2 ab + b2 0 a2 + b2 2 ab222ba ab令 x1 = a2 , x2 = b2上式为221xx21xx说明AxGx又:若令11x= a 2,21x= b 2则上式为21121xx2111xx211
17、12xx21xx说明GxHx所以AxGxHx又因为:222)(Axx而且2 0 所以:2x2)(Ax2xAx并且有:S AxGxHx(不考虑被平均变量的经济意义,仅从其数学意义看,同一变量按此各种不同的平均数方法计算,有以上关系)对于 Mk = kknx1,当 k 0 时为几何平均数的说明:对其两边取对数精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 23 页学习必备欢迎下载)(nxkln1lnkMk求极限kMkkk)(nxklnlimlnlim00此式的分子、分母均为无穷小量,即为00,用罗彼塔法则,分别在分子、分母上对k 求导如下:
18、nxxxnkkkkkln1limlnlim00)(nxk式中:nxxxnkkkkkln1limlnlim00)(nxk(求导法则见下)即:kkMlnlim0kkkxxxlnlim00ln Mnxln这就是一个对数平均数的式子,说明在 Mk = kknx1中,当 k 0 时为几何平均数。求导法则:xx1)(ln,aaaxxln)(第二节分布的集中趋势( 2)位置平均数一、众数(用m0表示)(一)概念:变量数列中,出现次数最多的变量值。特点:1、不受极端值的影响;2、用来说明总体中大多数单位所达到的一般水平。在实际生活中,众数被广泛运用:消费者普遍需要的鞋、帽的尺码;市场上某种商品最普遍的价格水平
19、;等(二)众数的确定精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 23 页学习必备欢迎下载1、单项变量数列:众数就是组内出现次数最多的那个变量值,在单项数列中, 有可能出现双众数;也有可能不存在集中趋势,从而众数不存在,例 32.1 某生活小区80 户居民按家庭人口数分组资料:按人口数分组(人)户数(户)户数(户)户数(户)甲(1)(2)( 3)1 2 3 4 5 8 22 32 14 4 8 27 27 14 4 16 16 16 16 16 合计80 80 80 按第一栏的分布,众数为3,出现的次数最多为32 次,单众数;按第二
20、栏的分布,众数为2 和 3,出现的次数都为27 次;双众数;按第三栏的分布,无集中趋势,众数不存在。2、组距变量数列(采用插补法,原理见下图)(1)下限公式:m0 = L + dffffffmmmmmm)()(111000000(2)上限公式:m0 = U - dffffffmmmmmm)()(111000000式中:L 与 U 分别表示众数所在组的下限和上限;d 为数所在组的组距;100、mmff和10mf分别为众数所在组、前一组和后一组的次数。f 例 3 2.2 某工厂一生产班组150 名工人日产零件数如下:d L m0U 01mf01mf0mf12精选学习资料 - - - - - - -
21、 - - 名师归纳总结 - - - - - - -第 11 页,共 23 页学习必备欢迎下载日产零件数(件)组中值(x )工人数(f )300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 3 12 24 57 30 18 6 合计150 生产 500 600 件的工人数最多57 人,众数在此组内:m0 = L + dffffffmmmmmm)()(1110000001 0 0305724572457500)( 555(件)一般地说,当数列中,数据分布存在明显的集中趋势,且有显著的极端值时
22、,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为多众数,也等于没有众数)。二、中位数(用me表示)(一)概念:将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。特点:1、不受极端值的影响;2、在总体各标志值的差异较大时,具有较强的代表性。(二)中位数的确定1、对于未分组的资料方法:(1)先将总体各单位的标志值按大小顺序排列, (2)确定中位数所在位置中位数项次21n(3)在此位置上的变量值就是中位数2、对于单项分组的资料方法:(1)先对分组资料计算向上(或向下)累计频数(或频率)(2)确定中位数所在位置中位数项次21f
23、(3)在此位置上的变量值就是中位数3、对于组距分组的资料(采用插补法,原理见下图)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 23 页学习必备欢迎下载 f(1)下限公式:me = L + dfSfem12(2)上限公式:me = U - dfSfem12两式中, S1和 S1分别是中位数所在组前面和后面各组的累计次数对于组距分组的资料1、先对分组资料计算向上(或向下)累计频数(或频率)2、确定中位数所在位置中位数项次2f3、由累计次数栏找到中位数所在组,再利用计算公式计算中位数例 3 2.3 某工厂一生产班组150 名工人日产零件
24、数如下:日产零件数(件)组中值( x)工人数( f)向上累计向下累计300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 6 18 30 60 21 12 3 6 24 54 114 135 147 150 150 144 126 96 36 15 3 合计150 下限公式计算:me = L + dfSfem1210060542150500535(件)L meUS1S12femf精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 23
25、 页学习必备欢迎下载上限公式计算me = U - dfSfem1210060362150600535(件)三、算术平均数、众数与中位数之间的关系英国统计学家皮尔生认为,许多非对称(轻微偏斜)的钟型分布, 中位数到算术平均数之间的距离大约相当于中位数到众数距离的一半。其经验公式为(其中之一):)(30emxmx如果是对称分布,则x、m0和 me三者集中于一点第三节分布的离中趋势 变异指标一、变异指标概述(一)概念:反映总体各单位标志变异程度的统计分析指标叫变异指标,也称标志变动度。(二)作用:1、反映总体分布的离散程度;2、说明平均数的代表性大小;(见例 33.1)3、说明事物在发展变化过程中的
26、节奏性和均衡性;4、说明产品质量的稳定性。二、变异指标种类及其计算(一)变异全距(简称全距,用R 表示) (见例 33.1)R xmaxxmin例 33.1 有甲、乙、丙三个学习小组,分别都是5 个人,他们的学习成绩如下:单位:分序号1 2 3 4 5 平均R A.D甲75 75 75 75 75 75 0 0 乙70 72 75 78 80 75 10 3.2 丙50 60 75 90 100 75 50 16 (二)平均差(用A.D 表示)(见例 33.1)1、简单式A.Dnxx精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 23
27、 页学习必备欢迎下载2、加权式A.Dffxx优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。一般情况下都是通过计算另一种标志变异指标标准差, 来反映总体内部各单位标志值的差异状况。(三)标准差(用或)(xVar表示)(标准差的平方叫方差,用2表示)第一、关于变量总体的标准差(用x表示)1、简单式nxxx2)(2、加权式ffxxx2)(或ffxxx2)(例 3 3.2 某工厂一生产班组150 名工人日产零件数如下:日产零件数(件)组中值x 工人数f x xx=568 ( x x)
28、2 ( x x)2 f300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 3 12 24 57 30 18 6 318 218 118 18 82 182 282 101124 47524 13924 324 6724 33124 79524 303372 570288 334176 18468 201720 596232 477144 合计150 2501400 ffxxx2)(1502501400129.14(件)标准差的特点:1、不易受极端数值的影响,能综合反映全部单位标志值的实际
29、差异程度;2、用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算。标准差(或方差)是统计分析中最常用、最重要的变异指标。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 23 页学习必备欢迎下载3、方差的数学性质(1)常数的方差等于0 ;即Var ( c ) = 0 既然是常数,就不存在变异,所以其变异指标为0 。(2)各变量值加减一任意常数A ,方差不变; (即所谓的平移不变)Var ( x A ) = Var ( x ) 证明:由于AxAx,所以Var ( x A ) = nAxAx2)(= n
30、AxAx2)(= nxx2)(= Var ( x ) (3)各变量值乘除以一任意数d,方差将乘除以这个数的平方,(而标准差也将乘除于d ) ;即Var ( dx ) = d 2Var(x)证明:由于xdxd,所以Var (dx ) = ndxdx2)(= nxddx2)(= nxxd22)(= )(2xVard(4) 两个独立变量和或差的方差,等于这两个独立变量方差的和;即Var ( x y ) Var ( x )Var ( y ) 证明:Var ( x y ) = mnyxyxnimjji121)()(= mnyxyxnimjji112)()(= mnyyxxnimjji112)()(精选学
31、习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 23 页学习必备欢迎下载= mnyyxxyyxxnimjjiji1122)(2)()(= mnxxyyyynxxmjniniijji11122 )()(2)()(=mnyyxxyynxxmnimjnimjjiji111122)()(2)()(因为niixx1)(= 0 、)(1mjjyy= 0 ,所以Var ( x y ) = mnyynxxmnimjji1122)()(= myynxxmjjnii1212)()(= Var ( x ) + Var ( y ) (5) 变量方差等于这个变量的平
32、方平均数减去这个变量平均数的平方; 即Var ( x ) E ( x2)E ( x )2或222)(xxx证明:对于20220)()()(xxnxxxx两边同除以n 并移项得20202)()()(xxnxxnxx令 x0等于零得222)()(xnxnxx即2x= 22)(xx(6)对于同一变量分布,其标准差始终不会小于平均差。即A.Dx x证明:由于2x= 22)(xx,而且2 0 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 17 页,共 23 页学习必备欢迎下载所以2x2)(xnxxxn22221221)(nxxxn两边开平方即得:A.Dx
33、x基利比(用rG表示)xxGDAr当总体服从正态分布时,基利比为2xxGDAr0.798 4、标准差(方差)的简捷计算2020)()(ffdxxffdxxdx(根据方差的第2、3 和 5 数学性质)例 3 1.2 某工厂一生产班组150 名工人日产零件数如下:日产零件数(件)组中值x 工人数f 100550 xfx100550fx2)100550(300 以下300 400 400 500 500 600 600 700 700 800 800 以上250 350 450 550 650 750 850 3 12 24 57 30 18 6 3 2 1 0 1 2 3 9 24 24 0 30
34、 36 18 27 48 24 0 30 72 54 合计150 27 255 设: x0550 , d 100 ,2020)()(ffdxxffdxxdx2)15027(120255100129.14(件)第二、关于属性总体的标准差(用p表示)(统计总体中的各个单位,有的具备某种属性,有的不具备某种属性,对于此类问题的研究,其总精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 18 页,共 23 页学习必备欢迎下载体称为属性总体)对于总体中的单位,只具有“是”或“否”、 “有”或“无”两种不同属性的标志,统计上称为是非标志,也叫交替标志。社会经济现
35、象是错综复杂的,统计所涉及的问题经常也是复杂多样的。当统计研究的是现象的是与否、有与无、属于或不属于、具备或不具备等这些问题时,均可按属性总体的是非标志进行处理。所以,对于这方面问题的研究,也是统计分析中重要的不可缺少的一个部分。是非标志的量化处理赋予变量值( x )单位数( f )具备某属性(是、有)不具某属性(非、无)1(或0)0(或1)N1N0p qN1其中:NNp1,NNq0所以:p q 1 由于 p 和 q 都是相对数,所以,习惯上都称其为成数。1、是非标志的平均数(用px表示)pxp说明:变量值(x)单位数(f)单位比重(成数)ffx1 0N1N0p qp 0 N1p是非标志的平均
36、数为:pffxxp例如:检验200 件产品的质量问题,结果有16 件不合格(即变量值中有16 个 0) ,184件合格(即变量值中有184 个 1) 。所以,是非标志的平均数,就是将这184 个 1 和 16 个 0相加除于200,结果就是0.92(即合格率)2、是非标志的标准差(用p表示))1(pppffff精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 19 页,共 23 页学习必备欢迎下载说明:变量值单位比重离差离差平方加权xffxx2)(xxffxx2)(1 0p q1p 0p( 1p)2 ( 0p)2(1p)2 p(0p)2q1q2p +
37、 p2q 是非标志的标准差为:)1(22ppqpqppqp第三、总方差和组内方差、组间方差(在分组条件下计算的方差,只是组与组之间的差别程度,并非变量值之间的真正离差)1、总方差( 2总)反映总体各单位标志值的真正差异程度的方差2总= niifjniijfxxi1112)(2、组内方差(2内)组距数列中,反映各组内部变量值变异程度的方差就是组内方差ifjiijifxxi122)(实际上,在组距数列中常用此方差近似地反映总体的变异程度。3、组间方差( 2间)用组中值计算,反映了组与组之间的差异程度的方差2间= niiniiiffxx112)(在组距数列中,此方差通常是不知道的。式中:n为组数fi
38、为各组单位数xij( i = 1、 2 n )( j = 1、2 fi )为变量值,即所有数据ix为各组平均数x为总平均数精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 20 页,共 23 页学习必备欢迎下载则有总方差等于组间方差加组内方差平均数,即总方差(2总)= 组内方差平均数(2内)+ 组间方差(2间)niifjniijfxxi1112)(= niiiniiniiniiiffxxff121112)(简单表示为:2总= 2内+ 2间这就是组距分组情况下的“方差加法定理”。证明:2总= niifjniijfxxi1112)(= niifjniii
39、ijfxxxxi1112)()(= niifjniiiijiiijfxxxxxxxxi11122)(2)()(=niifjniiijfjiniiiniiijfxxxxfxxxxii11111212)()(2)()(由于各组的ifjiijxx1)(等于零,所以上式= niifjniiiniiijffxxxxi111212)()(= niiiniiniinifjiijffxxfxxi1211112)()(精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 21 页,共 23 页学习必备欢迎下载= niiiniiniiniiifjiijffxxfffxxi1
40、211112)()(= niiiniiniiniiiffxxff121112)(所以2总= 2内+ 2间在随机抽样中, 分类抽样是一种将随机抽样与统计分组两种科学方法有机结合运用的抽样方法,它减小了方差,也就提高了样本的代表性。(四)变异系数(用V 表示)变异系数包含全距系数( VR)、平均差系数 (VAD)和标准差系数(V),最常用的是标准差系数。1、全距系数%100 xRVR2、平均差系数%100 xDAVAD3、标准差系数%100 xVx第三节分布的偏度与峰度集中趋势和离散程度是统计分布的两个重要特征值,但要更全面的了解统计分布的特点,还需要知道分布的形状是否对称、偏斜的方向和程度以及尖
41、峭或扁平的程度如何等。偏度与峰度就是对这些分布特征的进一步描述。一、统计动差1、原点矩k ffxk2、中心矩k ffxxk)(二、偏度精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 22 页,共 23 页学习必备欢迎下载偏度是用于衡量统计分布的不对称程度或偏斜程度的,其指标为偏度系数,用 表示。公式如下: 232333)(可见,偏度系数是变量的三阶中心矩除以标准差的三次方。如果分布是对称的,三阶中心矩3等于 0,即 0。如果分布是不对称的,三阶中心矩3就不等于0,使得 或大于 0 或小于 0。当 大于 0 时为右偏斜, 当 小于 0 时为左偏斜。
42、且的绝对值越大,表示偏斜的程度就越大;的绝对值越小,表示偏斜的程度就越小。三、峰度峰度是反映分布曲线的尖峭或扁平形状的,其分析指标为峰度系数,用表示,公式如下: ffxx4444)(33 可见,峰度系数 是变量的四阶中心矩除以标准差的四次方减3 所得。峰度系数如果大于0,表示分布比正态分布更集中在平均数周围,分布呈尖峰状态,为尖顶分布;如果小于0,表示分布比正态分布更分散,分布呈低峰状态,较扁平,为平顶分布。第四节平均指标与变异指标的分析与应用一、所研究社会经济现象应具同质性二、应该用组平均数补充说明总平均数三、平均指标应与变异指标结合应用应完成的作业(书后 P104)一、 P104P107 的选择、判断与填空题要求全做(可直接做在习题上)二、做好复习工作的同时,可通过P107 的第 1、3、5、7、8 等简答题加以思考本章的主要内容。三、计算题选做第1、3、4、5、7 题(要求书面完成)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 23 页,共 23 页