《第06和07次授课第五章 平均指标.ppt》由会员分享,可在线阅读,更多相关《第06和07次授课第五章 平均指标.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 平均指标平均指标1、平均指标体系、平均指标体系2、数值平均数的适用情形、数值平均数的适用情形3、中位数的计算、中位数的计算4、众数的计算、众数的计算5、变异指标的类型、变异指标的类型6、变异系数的计算、变异系数的计算平均指标的概念及体系平均指标的概念及体系平均指标是对总体单位之间的差异情况进行描述的指标,平均指标既平均指标是对总体单位之间的差异情况进行描述的指标,平均指标既反映总体的平均水平,也能反映总体内部的变异程度。反映总体的平均水平,也能反映总体内部的变异程度。平均指标体系包括反映总体平均指标体系包括反映总体集中趋势集中趋势的平均指标(狭义的平均指标)的平均指标(狭义的平均
2、指标)和反映总体的和反映总体的离中趋势离中趋势(分散程度)的平均指标(即变异指标)两类。(分散程度)的平均指标(即变异指标)两类。集中趋势的平均指标有集中趋势的平均指标有离中趋势的平均指标包括全距、平均差、标准差和变异系数。离中趋势的平均指标包括全距、平均差、标准差和变异系数。数值平均数算术平均数适用数据之间是适用数据之间是相加关系,知道相加关系,知道变量值和各组次变量值和各组次数数调和平均数H 适用数据之间是适用数据之间是相加关系,知道相加关系,知道变量值和各组组变量值和各组组内和内和几何平均数G适用数据之间是适用数据之间是相乘关系,相乘关系,简单平均数适用于未分组资料加权平均数适用于分组资
3、料简单算术平均数简单算术平均数适用于数据之间是相加关系的原始资料。适用于数据之间是相加关系的原始资料。例如:某班例如:某班20位同学的统计学考试成绩(分)位同学的统计学考试成绩(分)分别为分别为80、76、82、85、76、90、95、53、68、70、72、95、63、81、48、87、93、66、75、56。则该班的平均成绩为则该班的平均成绩为X=X/N=1511/20=75.55(分)(分)加权算术平均数加权算术平均数适用于数据之间是相加关系的分组数据。适用于数据之间是相加关系的分组数据。例如(单项式次数分布数列)例如(单项式次数分布数列)某企业某天某企业某天30名工人产量情况如表所示:
4、名工人产量情况如表所示:平均产量平均产量X=XF/F=1842/30=61.4按产量分组(X)人数(F)5558626365 2 610 8 4合计30例如例如(组距式次数分布数列)(组距式次数分布数列)平均成绩平均成绩X=XF/F=2310/30=77按成绩分组人数(F)组中值(X)60以下607070808090 90以上 2 610 8 45565758595合计30调和平均数调和平均数适用于数据之间是相加关系的资料,已知各组的组内和,适用于数据之间是相加关系的资料,已知各组的组内和,但未知各组次数的数据类型。但未知各组次数的数据类型。例如例如平均成绩平均成绩H=M/M/X=2310/3
5、0=77按成绩分组M(组内和)组中值(X)M/X=F60以下60707080809090以上1103907506803805565758595261084合计 231030几何平均数几何平均数适用于数据之间是相乘关系的数据。例如:平均发展速度G=X=105.97%年份发展速度0102030405 102%105%106%108%109%N中位数(中位数(Me)中位数是位置平均数,它是将总体单位的标中位数是位置平均数,它是将总体单位的标志值按大小顺序排列,处于标志值数列中点志值按大小顺序排列,处于标志值数列中点位置上的位置上的标志值就是中位数标志值就是中位数,以此反映总体,以此反映总体的集中趋势
6、情况。的集中趋势情况。与该指标类似的指标还有四分位数和百分位与该指标类似的指标还有四分位数和百分位数等。数等。中位数的确定中位数的确定一、根据原始资料的确定步骤一、根据原始资料的确定步骤1、将原始资料排序;、将原始资料排序;2、计算中位数的位次:、计算中位数的位次:N+1/23、确定中位数、确定中位数当当N为奇数时,为奇数时,Me=X(N+1)/2当当N为偶数时,为偶数时,Me=X N/2+X(N+2)/2/2例如例如3、5、7、8、9、11、14位次位次=(7+1)/2=4Me=X4=83、5、7、8、9、11、14、15位次位次=(8+1)/2=4.5Me=(X 4+X5)/2=(8+9)
7、/2=8.5二、根据单项式次数分布数二、根据单项式次数分布数列确定步骤列确定步骤1、编制累计次数分布、编制累计次数分布2、计算中位数位次、计算中位数位次(F+1)/23、寻找中位数在那组(累、寻找中位数在那组(累计次数首次超过中位数位次计次数首次超过中位数位次的组)的组)4、Me=该组的变量值该组的变量值例如:例如:位次位次=(31+1)/2=16Me=27特殊情况,当特殊情况,当F为偶数时,为偶数时,且(且(F+1)/2只比上一个累只比上一个累计次数大计次数大0.5时,时,Me=(该组变量值(该组变量值+上组变上组变量值)量值)/2人数 累计次数22252729305810535132328
8、31合计31三、根据组距式次数分布数列三、根据组距式次数分布数列确定中位数确定中位数1、编制累计次数分布、编制累计次数分布2、中位数位次、中位数位次F/23、寻找中位数在那组(累计、寻找中位数在那组(累计次数首次超过中位数位次的组)次数首次超过中位数位次的组)4、按公式计算中位数(、按公式计算中位数(注意注意编制向下累计次数分布时只能编制向下累计次数分布时只能使用上限公式。编制向上累计使用上限公式。编制向上累计次数分布时只能使用下限公式。次数分布时只能使用下限公式。)Me=L+(F/2-Sm-1)/fmXdMe=70+(16-13)/10X10=73人数 累计次数60以下60-7070-808
9、0-9090以上581054513232832合计32Me-L F/2-Sm-1U-L Sm-Sm-1Me=L+(F/2-Sm-1)/fmXdFF/2MeSm-1LUSm=众数(众数(MO)众数也是位置平均数,它是指总体中出现频众数也是位置平均数,它是指总体中出现频率最多的标志值。以此标志值来反映总体的率最多的标志值。以此标志值来反映总体的集中趋势情况。集中趋势情况。众数的确定众数的确定一、一、根据未分组资料不能确定众数根据未分组资料不能确定众数二、二、根据单项式次数分布数列确定步骤根据单项式次数分布数列确定步骤1、比较次数,找出、比较次数,找出MaxF=Fi2、确定众数所在组,、确定众数所在
10、组,MaxF所在组即众数所在组即众数所在组。所在组。3、Mo=Xi例如例如MaxF=F3=10众数在第三组众数在第三组Mo=X3=27人数2225272930581053合计31众数的确定众数的确定三、三、根据组距式次数分布数列计算众数根据组距式次数分布数列计算众数的步骤的步骤1、比较次数,找出、比较次数,找出MaxF=Fi2、确定众数所在组,、确定众数所在组,MaxF所在组即众所在组即众数所在组。数所在组。3、根据公式计算、根据公式计算MoMo=L+1/(1+2)XdMo=U-2/(1+2)Xd1=fm-f(m-1)2=fm-f(m+1)Mo=70+2/(2+5)X10=72.86人数60以
11、下60-7070-8080-9090以上581054合计321 mo-L2 U-moMo=L+1/(1+2)XdMo=U-2/(1+2)Xdfmfm-1fm+1L moU=X、me与与mo之间的关系之间的关系一、从图形的角度看一、从图形的角度看总体对称分布时,总体对称分布时,X=me=mo总体右偏分布时。总体右偏分布时。momeX总体左偏分布时,总体左偏分布时,X me mo二、从数量上二、从数量上(皮尔逊经验公式皮尔逊经验公式)me-mo=2 me-X该公式不能随意使用,只有当总体资料未该公式不能随意使用,只有当总体资料未知的情况下方可使用,当总体资料已知的知的情况下方可使用,当总体资料已知
12、的情况下,应分别计算三个平均数情况下,应分别计算三个平均数数值平均数与位置平均数的区别数值平均数与位置平均数的区别1、精确性、精确性数值平均数是依据所有总体单位的标志值计算的得数值平均数是依据所有总体单位的标志值计算的得到的,所以结果精确;到的,所以结果精确;位置平均数是根据特殊位置上的标志值来确定的,位置平均数是根据特殊位置上的标志值来确定的,未能考虑到全部标志值的情况,所以结果不是十分未能考虑到全部标志值的情况,所以结果不是十分精确。精确。2、抗干扰性、抗干扰性数值平均数抗干扰性较差,容易受到极端值的影响数值平均数抗干扰性较差,容易受到极端值的影响位置平均数抗干扰性较强,不容易受极端值的影
13、响位置平均数抗干扰性较强,不容易受极端值的影响变异指标变异指标(反映离中趋势的平均指标反映离中趋势的平均指标)除了可以使用平均数去描述和反映总体的集除了可以使用平均数去描述和反映总体的集中趋势之外,还需要使用变异指标去描述和中趋势之外,还需要使用变异指标去描述和反映总体的离中趋势(分散程度)。反映总体的离中趋势(分散程度)。变异指标通常需要通过变异指标通常需要通过对比来使用对比来使用,单独使,单独使用一个变异指标去说明一个总体分散与否是用一个变异指标去说明一个总体分散与否是不可能的,只能通过两个总体的变异指标对不可能的,只能通过两个总体的变异指标对比来说明谁更分散,谁更集中。比来说明谁更分散,
14、谁更集中。变异指标的类型:变异指标的类型:R、AD、V一、全距(一、全距(R)是指总体中各标志值变动的最大范围。该指标容易受极端是指总体中各标志值变动的最大范围。该指标容易受极端值影响。值影响。(一)根据未分组资料计算(是真实的全距)(一)根据未分组资料计算(是真实的全距)1、排序;、排序;2、寻找、寻找MaxX和和MinX,3、R=MaxX-MinX(二)根据单项式次数分布数列计算(是真实的全距)(二)根据单项式次数分布数列计算(是真实的全距)R=XN-X1(三)根据组距式次数分布数列计算(三)根据组距式次数分布数列计算1、闭口组:、闭口组:R=UN-L1;R不小于真实的全距不小于真实的全距
15、2、开口组:、开口组:R=(LN+dN-1)-(U1-d2);R可能大于真实的全可能大于真实的全距,也可能小于真实的全距。还可能正好等于真实的全距距,也可能小于真实的全距。还可能正好等于真实的全距注:类似的变异指标有四分位差,它是指四分之三位置上注:类似的变异指标有四分位差,它是指四分之三位置上的标志值与四分之一位置上的标志值相减的差额。消除全的标志值与四分之一位置上的标志值相减的差额。消除全距受极端值影响的弊端。距受极端值影响的弊端。例例128、32、24、25、34、45、181、排序:、排序:18、24、25、28、32、34、452、MaxX=45;MinX=18;3、R=45-18=
16、27例例2 R=XN-X1=32-25=7按产量分组按产量分组人数人数2527293132581052合计合计30例例3:原始数据为:原始数据为35、56、62、64、68、71、72、73、75、77、79、80、81、86、87、88、91、95、96。编制的分组资料如右表编制的分组资料如右表真实的全距为真实的全距为96-35=61根据组距式次数分布数列计算根据组距式次数分布数列计算的的R=100-30=70R不小于真实的全距不小于真实的全距按成绩分组按成绩分组人数人数30-6060-7070-8080-9090-10023653合计合计19例例4:原始数据为:原始数据为35、56、62、
17、64、68、71、72、73、75、77、79、80、81、86、87、88、91、95、96。编制的分组资料如右表编制的分组资料如右表真实的全距为真实的全距为96-35=61根据组距式次数分布数列计算根据组距式次数分布数列计算的的R=90+(90-80)-60-(70-60)=50R小于真实的全距小于真实的全距按成绩分组按成绩分组人数人数60以下以下60-7070-8080-9090以上以上23653合计合计19例例6:原始数据为:原始数据为46、56、62、64、68、71、72、73、75、77、79、80、81、86、87、88、91、95、96。编制的分组资料如右表编制的分组资料如右
18、表真实的全距为真实的全距为96-46=50根据组距式次数分布数列计算根据组距式次数分布数列计算的的R=90+(90-80)-60-(70-60)=50R等于真实的全距等于真实的全距按成绩分组按成绩分组人数人数60以下以下60-7070-8080-9090以上以上23653合计合计19例例5:原始数据为:原始数据为52、56、62、64、68、71、72、73、75、77、79、80、81、86、87、88、91、95、96。编制的分组资料如右表编制的分组资料如右表真实的全距为真实的全距为96-52=44根据组距式次数分布数列计算根据组距式次数分布数列计算的的R=90+(90-80)-60-(7
19、0-60)=50R大于真实的全距大于真实的全距按成绩分组按成绩分组人数人数60以下以下60-7070-8080-9090以上以上23653合计合计19二、平均差(二、平均差(AD)由于由于X将标志值将标志值Xi的差异抽象(平均)了,的差异抽象(平均)了,所以每一个所以每一个Xi与与X之间都有存在差距,该差之间都有存在差距,该差距距Xi-X称为离差,该离差有正有负,所有的称为离差,该离差有正有负,所有的离差之和等于零。离差之和等于零。平均差即平均绝对离差,是对离差的平均差即平均绝对离差,是对离差的绝对绝对值值进行平均。进行平均。Xi-X N Xi-X F FAD=AD=例例6总体的原始资料:总体
20、的原始资料:3、4、5、6、7X=5 3-5+4-5+5-5+6-5+7-5 5 AD=1.2例例7总体资料如下表总体资料如下表X=1430/20=76.5 55-76.5*1+95-76.5*2 20按成绩分组按成绩分组人数人数F组中值组中值XXFX-X F60以下以下60-7070-8080-9090以上以上13104255657585955519575034019021.534.5 15 34 37合计合计201430 142=7.1AD=三、标准差(三、标准差()和方差()和方差()标准差和平均差的设计原理是一样的,都是标准差和平均差的设计原理是一样的,都是对离差去求平均数,不同的是在
21、于消除离差对离差去求平均数,不同的是在于消除离差的正负上采取的方法不同,标准差是通过先的正负上采取的方法不同,标准差是通过先平方后开方的方式去消除正负的。平方后开方的方式去消除正负的。(Xi-X)(Xi-X)F N F标准差的平方即为方差标准差的平方即为方差。2=222例例8总体的原始资料:总体的原始资料:3、4、5、6、7X=5 (3-5)+(4-5)+(5-5)+(6-5)+(7-5)5 =1.4122222例例9总体资料如下表总体资料如下表X=1430/20=76.5 (55-76.5)*1+(95-76.5)*2 20按成绩分组按成绩分组人数人数F组中值组中值XXF(X-X)F60以下
22、以下60-7070-8080-9090以上以上131042556575859555195750340190462.25396.75 22.5 289 684.5合计合计201430 1855=9.63=222是非标志(交替标志)的平均数及标准差是非标志(交替标志)的平均数及标准差一、各总体单位在某个标志上表现出来的情况只有两种情一、各总体单位在某个标志上表现出来的情况只有两种情况的,该标志即为是非标志(交替标志)。例如:人类的况的,该标志即为是非标志(交替标志)。例如:人类的性别(男、女),学生考试成绩(及格、不及格)、产品性别(男、女),学生考试成绩(及格、不及格)、产品质量(合格、不合格)
23、等。质量(合格、不合格)等。二、成数(二、成数(P、Q)P:具有某属性的总体单位数占总体单位总数的比重(合:具有某属性的总体单位数占总体单位总数的比重(合格率、及格率)格率、及格率)Q:不具有某属性的总体单位数占总体单位总数的比重:不具有某属性的总体单位数占总体单位总数的比重(不合格率、不及格率)(不合格率、不及格率)三、交替标志的平均数三、交替标志的平均数XP=P四、交替标志的标准差四、交替标志的标准差P=PQ方差加法定理方差加法定理总方差总方差=组内方差的平均数组内方差的平均数+组间方差组间方差 =i +80、85、96、110、125、130、145、160总平均数平均数X=116.37
24、5总方差方差 =718.23分成两组分成两组100以下:以下:80、85、96100以上:以上:110、125、130、145、160第一组的平均数第一组的平均数X1=87;组内方差;组内方差1=44.67第二组的平均数第二组的平均数X2=134;组内方差;组内方差2=294组内方差的平均数组内方差的平均数i =(44.67*3+294*5)/8=200.5组间方差组间方差 =(87-116.375)*3+(134-116.375)*5/8=517.73200.5+517.73=718.232222222222R、AD、的分析:的分析:当当两个两个总体的平均数相等体的平均数相等时,哪个,哪个总
25、体的体的R、AD、越大越大说说明明该总该总体的分散程度越大。越小体的分散程度越大。越小说说明明该该总总体的分散程度越小。体的分散程度越小。当当两个两个总体的平均数不相等体的平均数不相等时,不能使用,不能使用R、AD、去直接比去直接比较较两个两个总总体。体。例如:例如:甲地区收入:甲地区收入:900、1000、1100乙地区收入:乙地区收入:999000、1000000、1001000R甲甲=200;R乙乙=2000但甲地区比乙地区收入差异更大,但甲地区比乙地区收入差异更大,说明甲地区的明甲地区的分散程度更大。分散程度更大。变异系数(变异系数(V)为了解决平均数不相等时无法使用为了解决平均数不相
26、等时无法使用R、AD、去分析去分析总总体的分散程度的体的分散程度的问题问题,因此,在,因此,在这这种情况下,可以使用种情况下,可以使用变变异系数去比异系数去比较较分析。分析。变变异系数在异系数在设计时设计时,将,将R、AD、分分别别除以除以X,消除了平均数的影响消,便于不同,消除了平均数的影响消,便于不同总总体比体比较较。变变异系数有多种:异系数有多种:VR、VAD、VVR=R/X;VAD=AD/X;V=/X变异指标的实际运用变异指标的实际运用在企业进行财务管理中,风险是一个需要考虑的因素,例在企业进行财务管理中,风险是一个需要考虑的因素,例如,在企业进行投资时,由于投资项目未来所能带来的收如
27、,在企业进行投资时,由于投资项目未来所能带来的收益受市场的影响,所以具有很大的不确定性,所以在进行益受市场的影响,所以具有很大的不确定性,所以在进行投资(特别是长期投资)时,要按风险大小来调整投资报投资(特别是长期投资)时,要按风险大小来调整投资报酬率和按风险大小折算各年的收益。酬率和按风险大小折算各年的收益。变异系数反映的是总体的分散程度和离中趋势,这也正好变异系数反映的是总体的分散程度和离中趋势,这也正好对总体的不确定性进行了描述,所以在财务管理中刻度风对总体的不确定性进行了描述,所以在财务管理中刻度风险的大小就是用变异系数的。险的大小就是用变异系数的。K=RF+RR=RF+bVK为投资总
28、报酬率为投资总报酬率RF为无风险报酬率为无风险报酬率RR为风险报酬率为风险报酬率b为风险报酬系数为风险报酬系数V为标准离差率(即变异系数)为标准离差率(即变异系数)偏度系数和峰度系数偏度系数和峰度系数偏度系数是对总体图形的偏向(左、右)和程度进偏度系数是对总体图形的偏向(左、右)和程度进行描述的指标。峰度系数是对总体图形的尖峭程度行描述的指标。峰度系数是对总体图形的尖峭程度(高、低)进行描述的指标。(高、低)进行描述的指标。矩(动差):原本是物理中的力学概念,现用于统矩(动差):原本是物理中的力学概念,现用于统计学中,计学中,矩的基本形式矩的基本形式 (Xi-a)F F上式称为上式称为K阶矩阶矩k=k原点矩(原点矩(a=0)Xi F F上式称为上式称为K阶原点矩。阶原点矩。一阶原点矩就是算术平均数。一阶原点矩就是算术平均数。中心矩中心矩(a=X)(Xi-X)F F上式称为上式称为K阶中心矩阶中心矩二阶中心矩就是方差二阶中心矩就是方差kk=kk=偏度系数(偏度系数()3 0,分布为正偏(右偏);,分布为正偏(右偏);0,分布为对称,分布为对称0,分布为负偏(左偏),分布为负偏(左偏)=3000峰度系数(峰度系数()4 0,分布为高峰度,分布为高峰度 0,分布为正态峰度,分布为正态峰度 0,分布为低峰度,分布为低峰度=-34 0 0 0