《第二章 第五节统计数据的特征描述.ppt》由会员分享,可在线阅读,更多相关《第二章 第五节统计数据的特征描述.ppt(112页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五节 统计数据的特征描述 综合指标从它们的作用和方法特点的角度可概括为三类:总量指标(又称绝对指标)、相对指标和平均指标。本节主要讲解内容 第一、第一、总量指标总量指标 第二、第二、相对指标相对指标 第三、第三、平均指标平均指标 第四、第四、变变异指标异指标 第五、第五、案例研究案例研究第一、总量指标 一、总量指标的概念和作用 二、总量指标的种类 三、总量指标的计算 四、我国国民经济的主要总量指标一、总量指标的概念和作用总量指标是反映社会经济现象在一定时间、地点、条件下的总规模或总水平的统计指标。表现形式:绝对数,有名数。例:2005年我国国内生产总值GDP为8964亿元 财政收入2004.
2、8亿元 粮食产量37911万吨二、总量指标的种类q按反映内容分:总体单位总量:总体单位数,如企业数、学校数、职工人数、学生人数等。总体标志总量:总体单位数量标志值之和,如总产量、总产值、工资总额、税金总额等。按反映时间状况不同分:时期指标:在某一时期发展过程的总数量,如某种产品的产量、商品销售量(额)、工资总额、国民(内)生产总值、人口增长量、人口出生数等。时点指标:在某一时刻上状况的总量,如人口数、商品库存量、固定资产的价值等。时期指标和时点指标的区别:时期指标连续计数,时点指标间断计数;时期指标具有累加性,时点指标不具有累加性;时期指标受时期长短影响,时点指标不受时点间隔影响。三、总量指标
3、的计算总量指标计算应注意的问题 同类现象才能加总;明确总量指标的含义 在统计汇总时,必须有统一的计量单位。计量单位实物单位 自然单位:人、辆 度量衡单位:千克、吨 双重单位或多重单位:千瓦/台 复合单位:吨公里货币单位 现行价 不变价劳动单位:工时、工日四、我国国民经济的主要总量指标社会总产值也称社会总产品,是以货币表现的各物质生产部门在一定时期内生产的社会产品总量,即物质生产部门的总产出。它反映一个国家(或地区)在一定时期内物质生产的总成果。从使用价值看,社会总产值可分为生产资料和消费资料两大类;从价值角度看,社会总产值可分为:生产过程中消耗掉的生产资料转移的价值(物质消费);劳动者新创造的
4、价值,其中包括工资、利润、税金和利息等。可见,社会总产值的价值构成为C+V+M。国民经济中的物质生产部门是指工业、农业、建筑业、货物运输业、邮电业和商业。其中商业包括饮食业和批发、零售业。工业总产值采用“工厂法”计算;农业总产值采用“产品法”计算。增加值企业或部门在一定时期内从事生产经营活动所增加的价值。增加值=总产值-中间投入国内生产总值(Gross Domestic Product,GDP)一个国家常住单位在一定时期内所生产和提供的最终使用的产品和服务的总价值。国内生产总值是SNA核算体系中一个重要的综合性指标,也是我国新国民经济核算体系中的核心指标,它是一个生产性指标。国内生产总值的计算
5、,有生产法、收入法和支出法三种。生产法:国内生产总值=各部门增加值之和增加值=总产出中间消费收入法:国内生产总值固定资产折旧劳动者报酬生产税净额营业盈余支出法:国内生产总值总消费总投资净出口生产使用总产出中间消费固定资产折旧劳动者报酬生产税补贴营业盈余28229.315662.91322.26476.81570.8689.73886.3居民消费社会消费固定资产投资库存增加出口进口6537.31463.04183.3627.01728.11972.3例,设某地区某年的有关资料如下表所示,试根据表中资料,用三种方法计算国内生产总值。生产法:国内生产总值=总产出中间消费=28229.315662.9
6、=12566.4(亿元)收入法:增加值固定资产折旧劳动者报酬生产税净额营业盈余=1322.2+6476.8+(1570.8-689.7)+3886.3=12566.4(亿元)支出法:国内生产总值总消费总投资净出口=(6537.3+1463)+(4183.3+627)+(1728.11972.3)=12566.4(亿元)国内生产总值与社会总产值、社会净产值的区别主要是:统计的范围不同。国内生产总值的统计范围覆盖整个国民经济的各个部门;而社会总产值、社会净产值的统计范围只限于物质生产部门。价值构成不同。国内生产总值为C1+V+M,不包括中间消耗的产品价值,但包括固定资产折旧;社会总产值的价值构成为
7、C+V+M;社会净产值的价值构成为V+M。计算方法不同。社会净产值的计算方法一般有两种:生产法(即社会总产值减物质消耗价值后所余部分);分配法(将国民收入初次分配的各项目加总求得)。而国内生产总值和社会总产值的计算方法如上所述。国民生产总值(Gross National Produat,GNP):国民总收入=国内生产总值+国外要素收入净额=国内生产总值+来自国外的劳动者报酬和财产收入外国从本国获得的劳动者报酬和财产收入国民生产总值反映了本国常住单位原始收入的总和,因此,国民生产总值不是一个生产的概念,而是一个收产概念。在联合国的新SNA核算体系中已将国民生产总值改称为国民总收入。第二、相对指标
8、一、相对指标的概念和作用二、相对指标的种类和计算方法三、正确运用相对指标的原则一、相对指标的概念和作用概念 相对指标是两个有联系的指标数值对比的结果。作用:综合反映社会经济现象之间的比例关系使不能直接对比的事物进行比较便于记忆 相对指标的表现形式 有名数:以分子、分母的双重单位表示 例:人口密度(人/平方公里)人均国民生产总值(元/人)无名数 系数 倍数 成数:1成=10%百分数:%1/100 千分数:1/1000二、相对指标的种类和计算方法计划完成程度相对指标计划完成程度相对指标计划完成相对数的一般公式 计划完成相对数的计算根据总量指标计算 某厂计划完成工业增加值200万元,实际完成220万
9、元,则:根据相对指标计算计划完成程度例:某厂计划2006年劳动生产率要比上年提高4%,实际提高5%,则即:超额0.96%完成计划。例:某企业计划产品单位成本比上年降低5%,实际降低6%,则即:成本降低率比计划多完成1.05%。例 单位:万元商场2005年2005年实际销售额2006年2005年增长%计划实际完成计划%销售额比重%销售额比重%甲120030122430.9102110011.27乙100025102625.9102.690014.0丙180045171043.295.016404.3合计400010039601003640长期计划的检查水平法 例:某钢铁公司“十五”计划规定钢产量
10、达到年产钢材630万吨,计划的执行情况如下表:时间2001年2002年2003年2004年2005年上半年下半年一季度二季度三季度四季度一季度二季度三季度四季度产量万吨420448238266140140147154161178182182合计万吨602合计万吨x640合计万吨703某钢铁公司计划执行情况表该公司2005年共产钢材703(161+178+182+182)所以其计划完成程度计算如下:计划完成程度=表明超额1159%完成了计划。这类计划完成的时间是以整个计划期内连续一年(够12个月,可以跨年度)的实际完成数达到计划规定水平的时间为准,以后的时间即为提前完成计划的时间了。如以2004
11、年第三季度到2005年的第二季度这四个季度里,钢总产量已达640万吨,表明到此已超额完成了计划,且提前完成计划的时间为:2个季度+X (14090)X+147+154+161+(17890)(90X)=630 X=23.6824天累计法 例:某钢铁公司“十五”计划规定钢产量达到2400万吨,计划的执行情况如下表:时间2001年2002年2003年2004年2005年上半年下半年一季度二季度三季度四季度一季度二季度三季度四季度产量万吨420448238266140140147154161178182182合计万吨2474合计万吨2656某钢铁公司计划执行情况表该公司“十五”期间共产钢材2646万
12、吨,其计划完成程度为:2656/2400=11.67%其提前完成时间为:1个季度+X X=7418290=36.5937天结构相对指标结构相对指标定义计算:例比例相对指标比例相对指标定义计算 在上例中某班男女生比例为3:1。比较相对指标比较相对指标定义例:中国国土面积为960万平方公里,美国为937万平方公里,两者之比为强度相对指标强度相对指标定义例:1998年末我国人口密度动态相对指标动态相对指标定义例:温州市1-3季度工业总产值同比增度17%三、正确运用相对指标的原则*注意可比性*总量指标和相对指标结合起来使用*多种相对指标结合使用第三、平均指标在社会经济统计中常用的平均指标有:本部分主要
13、总内容:一、平均指标的概念和作用 二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系一、平均指标的概念和作用概念概念:平均指标是指在同质总体内将各单位的数量差异抽象化,反映总体一般水平的代表值。特点:*将数量差异抽象化*必须具有同质性*反映总体变量值的集中趋势作用作用:*可用于同类现象在不同空间的比*可用于同类现象在不同时间的比*作为评判事物的标准*可进行数量估算二、算术平均数基本公式在计算算术平均数时,分子与分母必须同属一个总体,在经济内容上有着从属关系,即分子数值是分母各单位标志值的总和。也就是说,分子与分母具有一一对应的关系,有一个总体单位必有一个标
14、志值与之对应。只有这样计算出的平均指标才能表明总体的一般水平。正是 这点上,平均数与强度相对数表现出性质上的差异。强度相对数是两个有联系的不同总体的总量指标对比,这两个总量指标没有依附关系,而只是在经济内容上存在客观联系。以此标准来衡量,职工平均工资、农民人均粮食产量等是平均数;而人均收入、人均粮食产量是强度相对数。算术平均数的计算方法例,某车间24名工人对某种零件的生产情况如下表所示,求平均日产量。平均日产量:日产量(件)1819202122合计工人数(人)4395324各组产量(件)725718010566480拓展:这就是加权算术平均数的基本公式。例,表4-6某厂工人生产情况2ndF,O
15、N,20,M+;21,4,M+;22,6,M+;23,8,M+;24,12,M+;25,10,M+;26,7,M+;27,2,M+;xM 结果为23.88 在分组资料时,x用组中值代替。在分组资料时,x用组中值代替。可见,加权算术平均数不但受各组标志值x的影响,而且也受各组次数f的影响。次数越多对标志总量的影响越大,次数越少对标志总量的影响越小。各组标志次数的多少在平均数的计算中具有权衡轻重的作用,因此,在统计上又称为权数。权数有两种形式:一种是以绝对数表示,称次数或频数;另一种是以比重表示,称频率。同一总体资料,用这两种权数所计算的加权算术平均数完全相同。权数采用频率形式计算平均数时,表现为
16、:例略当各个标志值的权数都完全相等时,权数就失去了权衡轻重的作用,这时候,加权算术平均数就成为简单算术平均数。即:当时 ,则 这就是简单算术平均数的计算公式。例:5名工人日产零件数为12,13,14,14,15件,计算平均每人日产量。算法:用存储功能算:12,M+,13,M+,14,M+,14,M+,15,M+,RM,5,=计算结果 13.6,注意:每次开机后按xM键,清内存。用统计功能计算开机,2ndF,ON,在0的上方出现STAT12,M+;13,M+;14,M+;14,M+;15,M+;xM出现结果13.6算术平均数的数学性质算术平均数与总体单位数的乘积等于总体各单位标志值的总和。简单算
17、术平均数:加权算术平均数:如果每个变量值都加或减任意数值A,则平均数也要增多或减少这个数A。简单算术平均数:,加权算术平均数:,如果每个变量值都乘以或除以一个任意数值A,则平均数也乘以或除以这个数A。简单算术平均数:,加权算术平均数:,各个变量值与算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:各个变量值与算术平均数的离差平方之和等于最小值。简单算术平均数:设为任意数,则 为最小值。加权算术平均数:设 为任意数,则 为最小值。调和平均数是各个算术平均数倒数的算术平均数的倒数,是在资料受到限制的条件下算术平均数的一种变形。那么,如何判断在什么情况下可以采用算术平均数或调和平均数呢?关
18、键在于以算术平均数的基本公式为依据(),如果缺分子资料,可用简单或加权算术平均数形式计算,如缺分母资料,可用简单或加权调和平均数计算。总之,根据所掌握产资料条件来决定。在已知每种价格x、销售量f时,求平均价格用加权算术平均数。在已知每种价格x、销售额m时,求平均价格用加权调和平均数。三、调和平均数简单调和平均数简单调和平均数例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1斤,求平均价格。例2:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1元,求平均价格。在例1中,用简单算术平均数在例2中,先求早、中
19、、晚购买的斤数。早 1/0.5=2(斤)中 1/0.4=2.5(斤)晚 1/0.25=4(斤)实际上,例2是用下列公式计算:这就是简单调和平均数的公式。加权调和平均数加权调和平均数例3:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买2元、3元、4元,求平均价格。这就是加权调和平均数公式:调和平均数是各个算术平均数倒数的算术平均数的倒数,是算术平均数的一种变形。在已知每种价格x、销售量f时,求平均价格用加权算术平均数。在已知每种价格x、销售额m时,求平均价格用加权调和平均数。四、几何平均数几何平均数是n项变量值连乘积的n次方根。例:1994-1998年
20、我国工业品的产量分别是上年的107.6%、102.5%、100.6%、102.7%、102.2%,计算这5年的平均发展速度。简单几何平均数简单几何平均数1.067,1.067,1.025,1.025,1.006,1.006,1.027,1.027,1.022,=,2ndF,1.022,=,2ndF,5,=,5,=出现结果出现结果:1.03091.0309即即103.1%103.1%加权几何平均数加权几何平均数例:某投资银行25年的年利率分别是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。1.03,1.03,(,1.05,y,(,1.05,yx,4,),(,1.08,y
21、,(,1.08,yx,8,),(,1.1,y,(,1.1,yx,10,),(,1.15,y,(,1.15,yx,2,),=,2ndF,=,2ndF,25,=,25,=出现结果:出现结果:1.0861.086即即108.6%108.6%五、众数(M0)众数的概念众数的概念众数是总体中出现次数最多的标志值。它能直观地说明客观现象分配中的集中趋势,用字母M M0 0表示。例如某车间80名工人中技术等级为4级的有58人,人数最多,则4级为众数。用它表示该车间工人技术等级的一般水平。如果总体中出现次数最多的标志值不是一个,而是两个,那么,合起来就是复(双)众数。由众数的定义可看出众数存在的条件:就是总体
22、的单位数较多,各标志值的次数分配又有明显的集中趋势时才存在众数;如果总体单位数很少,尽管次数分配较集中,那么计算出来的众数意义就不大;如果总体单位数较多,但次数分配不集中,即各单位的标志值在总体分布中出现的比重较均匀,那么也无所谓众数。众数是由标志值出现次数多少决定的,不受资料中极端数值的影响,这样增强了众数对总体一般水平的代表性。根据变量数列的不同种类,确定众数可采用不同的方法。众数的计算方法众数的计算方法单项数列确定众数观察次数,出现次数最多的标志值就是众数。这种方法比较简单。如下表所列:表 某种商品的价格情况 价格(元)销售数量(公斤)2.002.403.004.00206014080合
23、计上面数列中价格为3.00元的商品销售量最多,即出现次数最多,则众数M M0 0=3.00元。组距数列确定众数观察次数,首先由最多次数来确定众数所在组,然后再用比例插值法推算众数的近似值。其计算公式为:下限公式:上限公式:式中:、分别表示众数所在组的下限、上限;表示众数所在组与以前一组次数之差;表示众数所在组与以后一组次数之差;d表示众数所在组的组距。由于各组次数可以用绝对数表示,亦可以用相对数表示,因而,根据次数来确定众数时,既可以根据绝对次数计算,也可以根据相对次数计算。例:某班学生统计学考试成绩情况表学生成绩x学生人数f学生人数比重(%)50以下506060707080809090以上2
24、414461042.55.017.557.512.55.0合计80100.0按绝对数计算:下限公式:按相对数计算:上限公式:众数的特点众数的特点从众数的计算可看到众数的特点:众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受极端值和开口组数列的影响,从而增强了对变量数列一般水平的代表性。众数是一个不容易确定的平均指标,当分布没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。六、中位数(Me)中位数的概念:中位数是将各单位标志值按大小排列,居于中间位置的那个标志值就是中位数。中位数的计算:未分组资料:先将数据按从小到大顺序排列,如项数
25、为奇数,居于中间的哪个单位标志值。中位数位次 例:有9个数字,2,3,5,6,9,10,11,13,14中位数为第5个,即9。先将数据按从小到大顺序排列,如项数为偶数,中位数为居于中间的那2个单位标志值的平均值。例:有10个数字,2,3,5,6,9,10,11,13,14,15中位数为第5个和第6个的平均值,即9.5。如为单项式分组资料,要将次数进行累计,中位数为居于中间位置所对应的标志值。中位数的位次 例:某厂工人日产零件中位数计算表 中位数位置=80/2=40 按向上累计次数,到34所在组为54,到32所在组为27,故中位数应在34所在组,即中位数=34。如分组资料为组距式,应先按的公式
26、求出中位数所在组的位置,然后再用比例插值法确定中位数的值。其计算公式如下:下限公式(向上累计时用)上限公式(向下累计时用)式中:、分别表示中位数所在组的下限、上限;中位数所在组的次数;中位数所在组以前各组的累计次数;中位数所在组以后各组的累计次数;总次数;d中位数所在组的组距。例:某班学生统计学期末考试成绩情况表学生成绩(分)学生人数(人)人数向上累计人数向下累计50以下506060707080809090以上241446104262066768080787460144合计80中位数位次204066中位数在7080这一组代入下限公式计算:七、各种平均数之间的关系算术平均数、几何平均数和调和平均
27、算术平均数、几何平均数和调和平均数之间的关系数之间的关系 可以证明:设有两个不等的数值 、,则 又即:也即:因此,这种关系,推广到有限的几个变量值也同样成立例:假定5个工人,他们的劳动生产率水平分别是:10件/小时、12件/小时、15件/小时、20件/小时、30件/小时,则他们的劳动生产率正指标的平均数:根据两个正数值计算的结果:如上例中 算算术术平平均均数数()、众众数数(M M0 0)中中位位数数(MeMe)三者的关系三者的关系总体次数分配为对称的钟形分布时,三个平均数相等,即 =Me=M0;当总体分布呈右偏时,则:Me M0;当总体分布呈右偏时,则:Me Me M0 分布为左偏。第四、标
28、志变动度一、标志变动度的意义和作用一、标志变动度的意义和作用二、全距二、全距三、平均三、平均差差四、标准四、标准差差五、离散系数五、离散系数六、用六、用EXCELEXCEL计算计算 描述统计量描述统计量一、标志变动度的意义和作用标志变动度的概念标志变动度的概念标志变动度是描述总体各单位标志值差别大小程度的指标,又称离散程度或离中程度。例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73从下图可以看出甲组离散程度大,乙组离散程度小。70707070标志变动度的作用标志变动度的作用标志变动度是评价平均数代表性的依据。标
29、志变动度反映社会经济活动过程的均衡性或协调性,以及产品质量的稳定性。二、全距全距的概念与计算全距的概念与计算 全距是总体各单位标志的最大值和最小值之差。R=Xmax-Xmin例:在第三章学生外语成绩例中,最低分为48分,最高分为96分,全距=96-48=48(分)全距的特点全距的特点计算方便、易于理解指标粗糙三、平均差平均差的概念与计算 平均差是各单位标志值对平均数离差绝对值的平均数。计算公式平均差的特点:计算方便、易于理解指标粗糙四、标准差标准差的概念与计算 平均差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。计算公式五、离散系数标志变动度的数值大小,不仅受离散程度影响,而且还受
30、平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。例:有两组工人日产量甲组:60、65、70、75、80乙组:2、5、7、9、12 不能简单断言甲组离散程度大于乙组离散程度可以计算离散系数 本例中即乙组的离散程度大于甲组。由此可见,当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。六、用EXCEL计算描述统计量用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数据分析”工具。第一次使用“数据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具
31、”菜单中就会出现“数据分析”。打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。在“输入区域”中输入A1:A21。由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复选框。单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中出现输出地址“$B$1”,这是输出结果的左上角起始位置。单击“汇总统计”,如不选此项,则Excel省略部分输出结果。单击“确定”按钮,将产生输出结果,如下图所示:在上表中:平均
32、算术平均数标准误差估计标准误差,在抽样调查一章会讲到中值中位数模式众数标准偏差样本标准差s,分母除以n-1样本方差s平方峰值反映钟形分布峰高的一个指标偏斜度反映偏斜程度的一个指标区域全距,等于最大值减最小值计数单位数返回本章首页返回本章首页第五节 案例研究:“Old Faithful”间歇喷泉的喷发间歇喷泉是一种向空中喷出热水和热气的温泉,其名字的由来是因为这种喷泉要经过一段相对稳定的状态后才能喷发。有时它喷射的时间间隔不太稳定。Ohio(俄亥俄)州黄石国家公园中的“Old Faithful”间歇喷泉是世界上最著名的间歇喷泉之一。参观者们都希望到公园后不用等多久就能看到喷泉的喷发。国家公园的服
33、务部门就在喷泉处安装了一个指示牌预报下次喷泉喷发的时间如下表所示。开始时间持续时间预测区间预测下一次喷发时间6:351分55秒58分7:33am7:32接近4秒82分8:54am8:591分51秒58分9:57am10:124分33秒89分11:41am11:461分42秒58分12:44am中午吃饭 2:061分41秒55分3:01am注:数据来源:应用线性回归第二版,作者:SWeisberg。“Old Faithful”间歇喷泉喷发时间表那么,公园是如何得到这个结果的呢?为了了解喷泉喷发间隔时间的规律,以1978年8月至1979年8月间喷泉222次喷发)的间隔时间记录为样本(见上表)进行分
34、析。打开”4数据描述.xls”工作簿,“喷泉“工作表。单击“工具”菜单,选择“数据分析”选项,打开“直方图”对话框。在输入区域输入单元格C1:C223,选择“标志”,在输出区域中输入单元格“D1”,选择“图表输出”,单击“确定”按钮。将所得的直方图进行修饰,便得到下图:从图中可以看出,喷泉喷发的间隔时间一般在40100分钟内变动。但是,在数据中明显地存在两个子群,它们的中心大约分别在喷发间隔55分钟和80分钟,这样在图形中间形成一个缺口。然而我们利用描述统计分析工具所得的结果与此便大不一样。利用描述统计分析工具分析该喷泉的间隔时间,方法如下:打开“4数据描述.xls”工作簿,选择“喷泉”工作表
35、。从“工具”菜单中选择“数据分析”选项,打开“描述统计”对话框。在输入区域中输入“C1:C223”,选择标志位于第一行。“输出区域”选择D19。选择“汇总统计”和“平均数置信度”,单击“确定”按钮,结果如下表所示。“Old Faithfaul”喷泉间隔时间描述统计表 (表一)(表二)统计指标数值 平均数71.00901标准误差0.859024中位数75众数75标准差12.799018样本方差163.8189峰度-0.48552统计指标数值 偏度-0.48552全距53最小值42最大值95合计15764单位数222置信度1.692928由于描述统计指标的概括性与抽象性,容易使人对事物的真实情况产
36、生误解。例如:从上表中可以看出平均间隔时间大约为71分钟。事实上,间歇时间大致呈现双峰分布,因而这一平均数并不能确切描述上述两个子群中任何一个子群的特征。按喷发持续的时间将观察值分成两组,可以对两种喷发的不同特性在更多细节上作出检测。下表是以喷发持续的时间是少于还是大于3分钟为依据分组,分别列出喷发间歇时间的主要统计指标。喷泉喷发间歇时间的主要描述统计指标 间歇时间统计指标喷发时间3分钟样本数67155平均数54.46378.161标准差6.29896.8911最小值42.00053.000中位数53.00078.000最大值78.00095.000根据上述统计指标和图表,可以得出一个简单的预测规律:一个持续时间少于3分钟的喷发将必然伴随着一个大约55分钟的间歇;一个持续时间大于3分钟的喷发将必然伴随着一个大约80分钟的间歇。并且,后者这种较长的间歇发生的可能性为67%。这样,通过一个非常简单的规则,国家公园的工作人员能够保证来黄石公园的游客不用等很长时间就会观看到“旧费尔斯福”间歇喷泉的喷发。ThankThank youyou very much!very much!