《统计学——统计数据的描述老.pptx》由会员分享,可在线阅读,更多相关《统计学——统计数据的描述老.pptx(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第三章 统计数据的描述第一节第一节 总量指标(绝对水平)总量指标(绝对水平)一、总量指标的概念与作用 1、概念:反映客观现象总规模、总水平的指标。2、表现形式:绝对数、有名数。3、特点:总量指标的数值大小与总体范围有关 总体范围越大,总量指标数值越大,反之亦反。4、作用 (1)认识社会经济现象总体的起点 (2)制定政策、编制计划、实行经营管理的主要依据。(3)计算相对指标与平均指标的基础。第1页/共71页2STAT二、总量指标的种类(一)按反映现象总体内容的不同,可分为:1、总体单位总量:反映总体所有单位总数的指标。2、总体标志总量:反映总体中各单位标志值总和的指标。(二)按指标反映的时间状
2、况不同,可分为:1、时期指标:反映现象在一段时期发展变化的总量指标。2、时点指标:反映现象在某个时点所达总量的指标。(三)按计量单位的不同,可分为:1、实物量指标:能直接反映现象的实物内容,但缺少综合性。2、价值指标:综合性能强,但不能直接反映现象的实物内容。实物量指标应与价值量指标结合运用。3、劳动量单位:如工时、工日等。第2页/共71页3第三章 统计数据的描述 3、时期指标与时点指标的区别 (1)统计的连续性 A、时期指标具有连续统计的特点 B、时点指标不需要进行连续统计 (2)统计的可加性 A、时期指标不同时期的数值可以累计 B、时点指标不同时期的数值不能累计 (3)指标数值与时间长短有
3、无直接关系 A、时期指标数值与时间长短有直接关系;B、时点指标数值与时间长短无直接关系。第3页/共71页4第三章 统计数据的描述第二节第二节 相对指标(相对水平)相对指标(相对水平)一、相对指标的意义及表现形式(一)相对指标的概念 1、定义:两个相互联系的指标数值对比的比值(相对水平)2、基本公式:比数/基数 A/B3、数值表现形式:无名数或复名数。无名数包括(1)系数:B=1且A、B相差不大时;(2)倍数:B=1且A大于B很多;(3)成数:B=10;(4)百分数:B=100;(5)千分数:B=1000且A小于B很多。4、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系第4页/共
4、71页5第三章 统计数据的描述 1、基本计算(1)计划任务数以绝对数、平均数形式出现;例某年某企业工业增加值计划指标为200万元,实际该年该企业完成产值220万元,则5、类型 包括:计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数六种。二、几种常用的相对指标(一)计划完成程度相对指标第5页/共71页6第三章 统计数据的描述(2)计划任务数以相对数形式出现例某厂计划今年的消耗比上年降5%,产值增8%。实际完成情况是:消耗降6%,产值升7%,试分别计算其计划完成程度。解:消耗计划完成程度=经济类指标可区分为逆指标:数值越小越好的指标。所以小于逆指标:数值越小越好的指标
5、。所以小于100%100%为超额完成计划。为超额完成计划。解:产值计划完成程度=第6页/共71页7第三章 统计数据的描述正指标:数值越大越好的指标,所以大于正指标:数值越大越好的指标,所以大于100%100%为超额完成计划为超额完成计划。(3)计划执行进度=累计完成数/计划任务数*主管部门所属单位总的计划完成情况第7页/共71页8第三章 统计数据的描述STAT 2、注意的问题(1)分子分母属于同一总体;(2)分子分母不可逆(位置不可互换);(3)各部分所占比重之和必须等于100%。3、作用 (1)可以揭示总体结构特征;(2)可以从总体结构的变动中观察现象的变化过程及发展趋势。(二)结构相对指标
6、第8页/共71页9第三章 统计数据的描述STAT (三)比例相对数2、注意的问题(1)分子分母属于同一总体;(2)分子分母可逆。3、作用:研究现象的比例是否协调及其规律。如新生儿性别比、积累率与消费率等。(四)比较相对数第9页/共71页10第三章 统计数据的描述STAT2、注意的问题(1)分子分母属于不同总体;(2)分子分母可逆;3、作用:反映现象发展的不平衡程度。(五)强度相对数 1、公式2、作用(1)反映现象发展的强度;例:2006年人均钢产量 中国 322.22公斤/人 俄罗斯 495.68公斤/人 日本 911.18公斤/人 德国 564.25公斤/人 美国 329.31公斤/人第10
7、页/共71页11第三章 统计数据的描述STAT(2)反映现象分布的密度;例人口密度=人口数/国土面积,2007年资料(人/平方公里)中国:141;新加坡:6660;孟加拉国:1218;日本:351;德国:236;美国:33;俄罗斯:9;加拿大:4;澳大利亚:3;蒙古:2;(3)反映公共设施服务的普遍程度。例每千人医疗机构床位数=医疗机构床位数/人口数(千人)2008年有关资料(单位:张/千人)北京:6.99;上海:7.00;天津:4.73;新疆:4.65;辽宁:4.31;安徽:2.37;江西:2.29;贵州:2.06。第11页/共71页12第三章 统计数据的描述STAT3、注意的问题(1)可以
8、是复名数也可以是无名数;(2)有些强度相对数可逆(正指标与逆指标)。例如:零售商业网密度=零售商业机构数/人口数(正指标)零售商业网密度=人口数/零售商业机构数(逆指标)人均钢产量=钢产量/人口数。(不可逆)4、强度相对数与平均数的异同相同点:均有平均的含义,一般均为复名数。第12页/共71页13第三章 统计数据的描述STAT(六)动态相对数1、动态相对数=报告期水平/基期水平例某厂2008年产值为2500万元,2009年为2000万元,则其动态相对数为2500/2000=125%。2、前述相对数均为静态相对数。不同点(1)平均数分子分母属同一总体且一一对应;(2)强度相对数分子分母属不同总体
9、且不一一对应。第13页/共71页14第三章 统计数据的描述STAT三、计算和运用相对指标的原则(一)可比性原则 1、内容的可比:分子分母的经济内容应有联系,对比有意义;2、范围的可比;3、计量单位、价格与计算方法的可比;(二)相对数与绝对数结合运用的原则 例 粮食产量 比上年增长%比上年增长的绝对数 甲地 1000万斤 10%100万斤 乙地 100万斤 10%10万斤第14页/共71页15第三章 统计数据的描述STAT第三节第三节 集中趋势(平均水平)的测度集中趋势(平均水平)的测度一、平均指标的概念与类型次数分配数列的两个重要特征:集中趋势与离中趋势。集中趋势集中趋势:中中间水平或平均水平
10、(重心)。集中趋势即多数单位都靠近中间水平的两侧,越靠近中间水平,出现的次数越多,反之亦反。离中趋势离中趋势:离开中间水平的趋势,即出现次数分散在中间水平的两侧,形成分散,即离中趋势。第15页/共71页16第三章 统计数据的描述STAT测定集中趋势的指标主要有平均指标1、平均指标的定义:反映同类现象一般水平一般水平的统计指标。2、特点(1)将各单位的数量差异抽象化,即消除离差;(2)反映次数分布的集中趋势,即找出中心;(3)是总体各单位某一数量标志值的代表水平。第16页/共71页17第三章 统计数据的描述STAT3、平均指标的种类第17页/共71页18第三章 统计数据的描述STAT 二、计算平
11、均数 (一)算术平均数 1、基本公式=总体标志总量/总体单位总量 2、算术平均数的计算 未分组资料已分组资料 注意:加权算术平均数不仅受各组变量值大小的影响,还受各组次数多少的影响。次数因其对平均的结果有权衡轻重的作用,因此,也叫权数。第18页/共71页19第三章 统计数据的描述STAT 权数的种类 A、绝对权数(次数)f B、相对权数(频率或比重)f/f 只有当各组的次数不相等时,次数才具有权数的作用。由此可见,简单算术平均数是加权算术平均数的一个特例。第19页/共71页20第三章 统计数据的描述STAT 组 距 数 列 算 术 平 均 数 的 计 算 例 1 1 人 年 龄:1 5,1 7
12、,1 9,2 0,2 2,2 2,2 3,2 3,2 5,2 6,3 0。求 平 均 年 龄。组距数列算术平均数的计算:以组中值代替组平均数后计算组距数列算术平均数的计算:以组中值代替组平均数后计算。(近似值)第20页/共71页21第三章 统计数据的描述STAT 是非标志平均数的计算:A:是非标志将总体全部单位划分为“是”或“否”两类的标志B、哑变量(01变量)第21页/共71页22第三章 统计数据的描述STAT3、算术平均数的数学性质 (1)各变量值与其算术平均数的离差之和为零。即第22页/共71页23第三章 统计数据的描述STAT(2)各变量值与其算术平均数的离差平方和为最小值。第23页/
13、共71页24STAT(二)调和平均数 调和平均数:变量值倒数的算术平均数的倒数。1、简单调和平均数:(各变量值均为一个单位时使用)例某种蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各买1斤,求平均价格。(算术平均法)例类似地某人早、中、晚各买1元,求平均价格。解:式中:x代表各个变量值,n代表变量值项数第24页/共71页25第三章 统计数据的描述STAT2、加权调和平均数:(各变量值为不等单位时使用)第25页/共71页26第三章 统计数据的描述STAT 基本公式:算术平均数=标志总量/总体总量算术平均数与调和平均数的适用前提A、已知基本公式母项资料用算术平均数计算;(子项
14、资料未知)B、已知基本公式子项资料用调和平均数计算(母项资料未知)调和平均数是算术平均数的变形第26页/共71页27第三章 统计数据的描述STAT(三)、几何平均数1、定义:n个变量值连乘积的n次方根。2、适用前提:总体标志总量=总体各单位标志值,宜计算比率或速度的平均数。3、公式:4、注意:当观察值有一项为零或负值时,不宜用几何平均数计算。5、如用同一数据分别计算算术平均数、调和平均数和几何平均数时,则有如下关系:第27页/共71页28第三章 统计数据的描述STAT三、位置平均数(一)中位数1、定义:将变量值按大小次序排列,处于中间位置的变量值即为中位数 Me例某科室由9人组成,其年龄分别为
15、:24,25,25,26,2626,27,28,29,552、计算(1)当资料未分组时,中点位置=(n+1)/2;当n为奇数时,Me=中间位置的那个变量值;当n为偶数时,如24,25,25,2624,25,25,26,26,27,28,29 Me=中间位置两侧的两个变量值的简单平均。(2)当资料已分组且形成单项式变量数列时,中点位置=f/2第28页/共71页29第三章 统计数据的描述STAT例中位=180/2=第90个人,所以 Me 应是第90个人的年龄。所以 Me=18岁。第29页/共71页30第三章 统计数据的描述STAT(3)资料已分组且形成组距式变量数列 (A)L为中位数所在组的下限,
16、U为上限;(B)i为中位数所在组的组距;(C)Sm-1 为小于中位数的各组次数之和;(D)Sm+1为大于中位数的各组次数之和;(E)fm为中位数所在组的次数。第30页/共71页31第三章 统计数据的描述STAT例 下限公式:上限公式:并且:第31页/共71页32第三章 统计数据的描述STAT推导:假定中位数组的变量值呈均匀分布,则采用比例插值法得 50 60 70(L)80(U)90 100 xy 10 30 60 110 150 180Me=L+x=U-y(Sm-1)第90个人第32页/共71页33第三章 统计数据的描述STAT3、特点(1)不受极端值的影响,比较稳健。(2)中位数的取值只与
17、中间位置的一或两个数值有关,利用信息不充分,忽略了其它数据的大小,并且不适合于代数运算。第33页/共71页34第三章 统计数据的描述STAT(二)众数1、定义:出现次数最多的变量值。用Mo表示。A、20,15,18,20,20,22,20,23;n=8 Mo=20B、20,20,15,19,19,20,19,25;n=8 Mo=20 Mo=19C、10,11,13,16,15,25,8,12;n=8,但没有众数2、计算(1)当资料为单项式数列时。先确定众数组 再确定众数:Mo=18第34页/共71页35第三章 统计数据的描述STAT(2)当资料为组距式数列时。先确定众数组;再用下述公式计算:符
18、号含义:(A)L为众数组的下限,U为上限;(B)i为众数组的组距;(C)1=fmfm-1,即众数组的次数与前一组次数之差;2=fm fm+1,即众数组的次数与后一组次数之差。第35页/共71页36第三章 统计数据的描述STAT40 50 60 70 80 90 10050 40 30 20 10A G FBCED人数产值x y(L)(U)Mo=L+x=U-yO第36页/共71页37第三章 统计数据的描述STAT40 50 60 70 80 90 10050 40 30 20 10A G FBCED人数产值x y(L)(U)Mo=L+x=U-yO第37页/共71页38第三章 统计数据的描述STA
19、T众数取值的特点:众数在众数组的位置与相邻两组的次数有关,众数在众数组的位置始终偏向相邻组中次数较大的组,当相邻两组的次数相等时,众数则是众数组的组中值。3、特点(1)优点:不受极端值的影响。(2)缺点:未利用所有信息,缺乏敏感性和不适合代数运算第38页/共71页39第三章 统计数据的描述STAT四、算术平均数、中位数、众数的比较(一)三者间的关系1、数量关系(1)对称分布:此处三者均等于35。第39页/共71页40第三章 统计数据的描述STAT(2)偏态分布A、右(正)偏:第40页/共71页41第三章 统计数据的描述STATB、左(负)偏:第41页/共71页42第三章 统计数据的描述STAT
20、2、卡尔皮尔逊经验公式:适度偏斜情况下,众数与中位数之间的距离,大约为中位数到算术平均数之间距离的两倍。第42页/共71页43第三章 统计数据的描述STAT(二)众数、中位数和算术平均数的特点和应用场合 众数是一组数据分布的峰值,不受极端值影响,其缺点是不具有唯一性(有时有多个众数,有时没有)。当数据的分布具有明显的集中趋势时,尤其对于偏态分布时,众数的代表性比均值好;中位数是一组数据中间位置上的代表值,不受极端值影响。对于偏态分布的数据,中位数的代表性比均值好;算术平均数是就全部数据计算的,具有优良的数学性质,是应用最为广泛的集中趋势测度值,其主要缺点是易受极端值影响。算术平均数适用于数据呈
21、对称分布或接近于对称分布。第43页/共71页44第三章 统计数据的描述STAT 五、计算和应用平均数的原则 1、注意观察总体的同质性;2、应用组平均数补充说明总体平均数;3、注意极端值的影响。第44页/共71页45第三章 统计数据的描述STAT第四节第四节 离散趋势的测度离散趋势的测度 平均指标只能反映现象的集中趋势而不能反映总体各单位标志值的差异程度。例集中趋势和离散程度是总体分布的两个重要特征。一、离散趋势指标的概念与作用 1、概念:离散趋势指标是反映总体各单位标志值差异(离散)程度的指标。又称标志变动指标、离散程度指标等。平均指标与离散趋势指标的区别:平均指标考虑的是如何消除离差,显示集
22、中趋势。而离散趋势指标考虑的是如何计算离差,反映离散的程度及离差的大小。第45页/共71页46第三章 统计数据的描述STAT 2、作 用(1)衡 量 平 均 数 代 表 性 的 大 小。(2)反映变量值分布的离中趋势和离散程度。第46页/共71页47第三章 统计数据的描述STAT(3)反映社会经济现象的均衡性和稳定性。如甲、乙两工厂某年四个季度的产量资料如下(单位:万件):甲:65、68、72、75,平均每季产量为70万件;乙:34,51,95,100,平均每季产量为70万件。二、离散趋势指标的种类(一)全距(极差)特点1、优点:意义明确,简单方便。2、缺点:比较粗略,未考虑中间变量值的离散情
23、况。第47页/共71页48第三章 统计数据的描述STAT(二)平均差(A.D)1、概念:平均差是总体各单位标志值与其算术平均数离差绝对值的算术平均数。2、计算:简单平均差:A.D=加权平均差:A.D=(适用未分组资料)(适用已分组资料)第48页/共71页49第三章 统计数据的描述STAT 简单平均差计算举例:第49页/共71页50第三章 统计数据的描述STAT 加权平均差计算举例:第50页/共71页51第三章 统计数据的描述STAT 判 定 准 则:3、特点 (1)充分考虑了每一数值的离中情况,在反映离中趋势方面比较 灵敏,计算方法亦比较简单。(2)绝对值运算给数学处理带来很多不便。第51页/
24、共71页52第三章 统计数据的描述STAT(三)方差与标准差 1、概念:方差():总体各单位标志值与其算术平均数离差离差平平方方的算术平均数算术平均数;标准差():总体各单位标志值与其算术平均数离差平方的算术平均数的平方根平方根。2、基本计算:(简单标准差)(加权标准差)第52页/共71页53第三章 统计数据的描述STAT 简单方差与简单标准差计算举例:第53页/共71页54第三章 统计数据的描述STAT 加权式方差与加权标准差计算举例:第54页/共71页55第三章 统计数据的描述STAT3、是非标志标准差的计算:4、判定原则和特点:根据同一资料计算:第55页/共71页56第三章 统计数据的描
25、述STAT 特点:充分考虑了每一数值的离中情况,且避免了取绝对值不方便数学处理的缺点,故运用广泛。5、方差、标准差的简捷计算法=同理,则有第56页/共71页57第三章 统计数据的描述STAT例第57页/共71页58第三章 统计数据的描述STAT 6、方差的数学性质:总体各单位标志值与其算术平均数的方差 最小。第58页/共71页59第三章 统计数据的描述STAT例已知各变量值与任意数的方差为500,而这个任意数与变量值平均数之差为12,试确定变量值的方差。第59页/共71页60第三章 统计数据的描述STAT7、方差加法定理及计算例11人日产量(件)如下:15,17,19,20,22,22,23,
26、23,25,26,30。试求其总方差。第60页/共71页61第三章 统计数据的描述STAT例11人日产量(件):15,17,19,20,22,22,23,23,25,26,30。第61页/共71页62(4)平均组内方差:各组内方差的平均数。(分组条件下)第62页/共71页63第三章 统计数据的描述STAT例11人日产量(件)如下15,17,19,20,22,22,23,23,25,26,30。结论:原始资料是计算总方差;分组资料情况下,组内方差无法计算,因此,根据分组资料计算的方差实际上是组间方差。第63页/共71页64第三章 统计数据的描述STAT(四)离散系数(相对离中趋势)1、前述离散趋
27、势指标的特点:A、均带有与原资料相同的计量单位属绝对数和平均数离散指标;B、只有当两总体性质相同、平均数相同时才可用来比较平均数的 代表性。例:不同性质的绝对量不可直接对比例:体重 举重 相对水平某人 120斤 50斤 50/120=42%某只蚂蚁 1克 6克 6/1=600%2、离散系数的特点:A、可用于两个总体平均水平不同时;B、可用于两个总体性质不同或计量单位不同时。第64页/共71页65第三章 统计数据的描述STAT3、计算公式第65页/共71页66第三章 统计数据的描述STAT 判定原则:越大,说明数据越分散,的代表性越小;越小,说明数据越集中,的代表性越大。同理:越大,说明数据越分
28、散,的代表性越小;越小,说明数据越集中,的代表性越大。第66页/共71页67STAT 第五节第五节 相对位置测度及异常值的检测相对位置测度及异常值的检测 一、一、Z分数分数 z分数通常被称为标准化数值。z可以解释为观察值偏离平均数的标准差个数。第三章 统计数据的描述第67页/共71页68STAT 二、二、切贝谢夫定理定理 在任何任何数据集中,出现在算术平均数左右Z倍范围之内的数据比例至少至少为(11/Z2),Z是大于1的任意数值。例有一组顾客购物付款时等候时间的资料,已知等候时间的均值为4分钟,标准差为0.9分钟,则至少为至少为0 0至少为至少为7575至少为至少为8989特点:具有普遍性但比较保守。第三章 统计数据的描述第68页/共71页69STAT 三、三、经验法则经验法则 当资料呈对称分布对称分布时,则有-3 -2 -1 1 2 3第三章 统计数据的描述第69页/共71页70STAT 四、异常值检测 异常值:非正常大或非正常小的数值。检测:计算标准化数值(Z分数),Z分数小于-3或大于+3的数据为异常值。第三章 统计数据的描述第70页/共71页71感谢您的观看!第71页/共71页