《第3章统计数据的整理与显示精选PPT.ppt》由会员分享,可在线阅读,更多相关《第3章统计数据的整理与显示精选PPT.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3章统计数据的整理与显示第1页,本讲稿共37页3.1 数据整理的意义及程序 3.1.1 3.1.1 数据整理的意义数据整理的意义数据整理的意义数据整理的意义统计数据整理就是指根据统计研究目的,将统计调查所统计数据整理就是指根据统计研究目的,将统计调查所统计数据整理就是指根据统计研究目的,将统计调查所统计数据整理就是指根据统计研究目的,将统计调查所得的原始数据进行科学的分类汇总,或对已经加工的次得的原始数据进行科学的分类汇总,或对已经加工的次得的原始数据进行科学的分类汇总,或对已经加工的次得的原始数据进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的级资料进行
2、再加工,为统计分析准备系统化、条理化的级资料进行再加工,为统计分析准备系统化、条理化的级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。综合资料的工作过程。综合资料的工作过程。综合资料的工作过程。从统计工作的全过程来讲,统计数据整理是统计工从统计工作的全过程来讲,统计数据整理是统计工从统计工作的全过程来讲,统计数据整理是统计工从统计工作的全过程来讲,统计数据整理是统计工作过程的第三阶段。它在统计工作中起着承前启后作过程的第三阶段。它在统计工作中起着承前启后作过程的第三阶段。它在统计工作中起着承前启后作过程的第三阶段。它在统计工作中起着承前启后的作用。的作用。的作用。的作用。因
3、此,统计整理的正确与否,将直接影响到对现象总体数因此,统计整理的正确与否,将直接影响到对现象总体数因此,统计整理的正确与否,将直接影响到对现象总体数因此,统计整理的正确与否,将直接影响到对现象总体数量特征描述的准确性。量特征描述的准确性。量特征描述的准确性。量特征描述的准确性。第2页,本讲稿共37页3.1.2 数据整理的程序数据整理的程序统计数据整理中必须遵循的原则是:要在统计数据整理中必须遵循的原则是:要在对所研究的社会经济现象进行深刻分析的对所研究的社会经济现象进行深刻分析的基础上,抓住最基本、最能说明问题本质基础上,抓住最基本、最能说明问题本质特征的统计分组和统计指标对统计资料进特征的统
4、计分组和统计指标对统计资料进行加工整理。行加工整理。数据整理的基本程序如下:数据整理的基本程序如下:第3页,本讲稿共37页1.1.设计和编制统计数据的整理方案设计和编制统计数据的整理方案设计和编制统计数据的整理方案设计和编制统计数据的整理方案2.2.对调查获得的数据进行审核对调查获得的数据进行审核对调查获得的数据进行审核对调查获得的数据进行审核 (1 1)对原始数据进行审核对原始数据进行审核对原始数据进行审核对原始数据进行审核 (2 2)对二手数据进行审核)对二手数据进行审核)对二手数据进行审核)对二手数据进行审核 (3 3)数据筛选数据筛选数据筛选数据筛选 3.3.按照一定的组织方式和方法对
5、调查所得数据进行分组、按照一定的组织方式和方法对调查所得数据进行分组、按照一定的组织方式和方法对调查所得数据进行分组、按照一定的组织方式和方法对调查所得数据进行分组、编码、汇总和计算编码、汇总和计算编码、汇总和计算编码、汇总和计算4.4.对整理好的统计数据再次进行审核,及时更正汇总过对整理好的统计数据再次进行审核,及时更正汇总过对整理好的统计数据再次进行审核,及时更正汇总过对整理好的统计数据再次进行审核,及时更正汇总过程中产生的各种差错程中产生的各种差错程中产生的各种差错程中产生的各种差错5.5.将汇总整理的结果编制成统计表或绘制统计图,简明将汇总整理的结果编制成统计表或绘制统计图,简明将汇总
6、整理的结果编制成统计表或绘制统计图,简明将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征扼要地表明现象的数量特征扼要地表明现象的数量特征扼要地表明现象的数量特征6.6.积累、公布和管理统计数据积累、公布和管理统计数据积累、公布和管理统计数据积累、公布和管理统计数据 第4页,本讲稿共37页3.2 统计分组统计分组3.2.1 3.2.1 统计分组的意义统计分组的意义统计分组的意义统计分组的意义1 1统计分组的概念统计分组的概念统计分组的概念统计分组的概念统计分组是指根据事物内在的特点和统计研究的需统计分组是指根据事物内在的特点和统计研究的需统计分组是指根据事物内在的特点和统计
7、研究的需统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部要,将统计总体按照一定的标志区分为若干组成部要,将统计总体按照一定的标志区分为若干组成部要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。分的一种统计方法。分的一种统计方法。分的一种统计方法。其目的是把同质总体中的具有不同性质的单位分开,其目的是把同质总体中的具有不同性质的单位分开,其目的是把同质总体中的具有不同性质的单位分开,其目的是把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起,保持各组内统计资料把性质相同的单位合在一起,保持各组内统计资料把性质相同的单位合在一起,保
8、持各组内统计资料把性质相同的单位合在一起,保持各组内统计资料的一致性和组间资料的差异性,以便进一步运用各的一致性和组间资料的差异性,以便进一步运用各的一致性和组间资料的差异性,以便进一步运用各的一致性和组间资料的差异性,以便进一步运用各种统计方法研究现象的数量表现和数量关系,从而种统计方法研究现象的数量表现和数量关系,从而种统计方法研究现象的数量表现和数量关系,从而种统计方法研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律。正确地认识事物的本质及其规律。正确地认识事物的本质及其规律。正确地认识事物的本质及其规律。第5页,本讲稿共37页2 2统计分组的原则统计分组的原则(1 1)穷
9、尽原则)穷尽原则穷尽原则就是使总体中的每一个单位都有组可归,或者穷尽原则就是使总体中的每一个单位都有组可归,或者说各分组的空间足以容纳总体所有的单位。说各分组的空间足以容纳总体所有的单位。(2 2)互斥原则)互斥原则互斥原则就是在特定的分组标志下,总体中任何一互斥原则就是在特定的分组标志下,总体中任何一个单位只能归属于某一组,而不能同时或可能归属个单位只能归属于某一组,而不能同时或可能归属于几个组。于几个组。第6页,本讲稿共37页3 3统计分组的作用统计分组的作用统计分组的作用统计分组的作用(1 1)可以区分现象质的差别)可以区分现象质的差别)可以区分现象质的差别)可以区分现象质的差别统计分组
10、的根本作用在于区分现象质的差别。统计分组的根本作用在于区分现象质的差别。统计分组的根本作用在于区分现象质的差别。统计分组的根本作用在于区分现象质的差别。(2 2)可以分析总体内部结构和总体结构特征)可以分析总体内部结构和总体结构特征)可以分析总体内部结构和总体结构特征)可以分析总体内部结构和总体结构特征当研究目的在于探讨总体在某一标志上的构成,而将当研究目的在于探讨总体在某一标志上的构成,而将当研究目的在于探讨总体在某一标志上的构成,而将当研究目的在于探讨总体在某一标志上的构成,而将总体划分为若干组成部分以显示所研究标志的结构时,总体划分为若干组成部分以显示所研究标志的结构时,总体划分为若干组
11、成部分以显示所研究标志的结构时,总体划分为若干组成部分以显示所研究标志的结构时,这种分组称为结构分组。这种分组称为结构分组。这种分组称为结构分组。这种分组称为结构分组。(3 3)可以揭示现象之间的依存关系)可以揭示现象之间的依存关系)可以揭示现象之间的依存关系)可以揭示现象之间的依存关系当研究目的在于探讨同一总体范围内两个可变标志当研究目的在于探讨同一总体范围内两个可变标志当研究目的在于探讨同一总体范围内两个可变标志当研究目的在于探讨同一总体范围内两个可变标志的依存关系时,可以将其中一个可变标志(自变量)的依存关系时,可以将其中一个可变标志(自变量)的依存关系时,可以将其中一个可变标志(自变量
12、)的依存关系时,可以将其中一个可变标志(自变量)作为分组标志,以观察另一标志(因变量)相应的作为分组标志,以观察另一标志(因变量)相应的作为分组标志,以观察另一标志(因变量)相应的作为分组标志,以观察另一标志(因变量)相应的变动情况。这种分组称为分析分组,它可以揭示现变动情况。这种分组称为分析分组,它可以揭示现变动情况。这种分组称为分析分组,它可以揭示现变动情况。这种分组称为分析分组,它可以揭示现象之间的依存关系。象之间的依存关系。象之间的依存关系。象之间的依存关系。第7页,本讲稿共37页4统计分组的种类统计分组的种类(1)品质分组(或称属性分组)品质分组(或称属性分组)即按品质标志进行分组。
13、一般地,对于类即按品质标志进行分组。一般地,对于类别数据,采用品质分组。别数据,采用品质分组。(2)数量分组(或称变量分组)数量分组(或称变量分组)即按数量标志分组,数量标志的变异性体即按数量标志分组,数量标志的变异性体现在它不断变动的数量上,故也称为变量现在它不断变动的数量上,故也称为变量分组。分组。品质分组所形成的数列称为品质数列,变品质分组所形成的数列称为品质数列,变量分组所形成的数列称为变量数列。量分组所形成的数列称为变量数列。第8页,本讲稿共37页3.2.2 3.2.2 统计分组体系统计分组体系统计分组体系统计分组体系1 1简单分组与平行分组体系简单分组与平行分组体系简单分组与平行分
14、组体系简单分组与平行分组体系简单分组就是对研究现象按一个标志进行分组,它只简单分组就是对研究现象按一个标志进行分组,它只简单分组就是对研究现象按一个标志进行分组,它只简单分组就是对研究现象按一个标志进行分组,它只能从某一方面说明和反映事物的分布状况和内部结构。能从某一方面说明和反映事物的分布状况和内部结构。能从某一方面说明和反映事物的分布状况和内部结构。能从某一方面说明和反映事物的分布状况和内部结构。对同一个总体选择两个或两个以上的标志分别进行简对同一个总体选择两个或两个以上的标志分别进行简对同一个总体选择两个或两个以上的标志分别进行简对同一个总体选择两个或两个以上的标志分别进行简单分组,就形
15、成平行分组体系。单分组,就形成平行分组体系。单分组,就形成平行分组体系。单分组,就形成平行分组体系。2 2复合分组体系复合分组体系复合分组体系复合分组体系复合分组就是用两个或两个以上标志层叠起来进行分组,复合分组就是用两个或两个以上标志层叠起来进行分组,复合分组就是用两个或两个以上标志层叠起来进行分组,复合分组就是用两个或两个以上标志层叠起来进行分组,即先按一个标志分组,在此基础上再按第二个标志分小组,即先按一个标志分组,在此基础上再按第二个标志分小组,即先按一个标志分组,在此基础上再按第二个标志分小组,即先按一个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组。复
16、合分组所形成又再层叠地按第三个标志分成更小的组。复合分组所形成又再层叠地按第三个标志分成更小的组。复合分组所形成又再层叠地按第三个标志分成更小的组。复合分组所形成的分组体系叫做复合分组体系。的分组体系叫做复合分组体系。的分组体系叫做复合分组体系。的分组体系叫做复合分组体系。第9页,本讲稿共37页3.2.3 3.2.3 分组标志的选择分组标志的选择分组标志的选择分组标志的选择统计分组中关键的问题在于选择分组标志和各组界限统计分组中关键的问题在于选择分组标志和各组界限统计分组中关键的问题在于选择分组标志和各组界限统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心
17、问题。的划分,而选择分组标志则是统计分组的核心问题。的划分,而选择分组标志则是统计分组的核心问题。的划分,而选择分组标志则是统计分组的核心问题。分组标志就是将统计总体区分为各个性质不同的组的分组标志就是将统计总体区分为各个性质不同的组的分组标志就是将统计总体区分为各个性质不同的组的分组标志就是将统计总体区分为各个性质不同的组的标准或根据。标准或根据。标准或根据。标准或根据。为确保分组后的各组能够正确反映事物内部的规律性,选为确保分组后的各组能够正确反映事物内部的规律性,选为确保分组后的各组能够正确反映事物内部的规律性,选为确保分组后的各组能够正确反映事物内部的规律性,选择分组标志时应遵循以下原
18、则:择分组标志时应遵循以下原则:择分组标志时应遵循以下原则:择分组标志时应遵循以下原则:1 1根据统计研究的目的与任务选择分组标志根据统计研究的目的与任务选择分组标志根据统计研究的目的与任务选择分组标志根据统计研究的目的与任务选择分组标志 2 2在若干个标志中要抓住具有本质性或主要的标在若干个标志中要抓住具有本质性或主要的标在若干个标志中要抓住具有本质性或主要的标在若干个标志中要抓住具有本质性或主要的标志作为分组依据志作为分组依据志作为分组依据志作为分组依据 3 3根据现象所处的历史条件或经济条件来选择标志根据现象所处的历史条件或经济条件来选择标志根据现象所处的历史条件或经济条件来选择标志根据
19、现象所处的历史条件或经济条件来选择标志 第10页,本讲稿共37页3.2.4 统计分组的方法统计分组的方法1品质分组的方法品质分组的方法按品质标志分组法分组就是选择反映事物按品质标志分组法分组就是选择反映事物属性差异的品质标志为分组标志,在品质属性差异的品质标志为分组标志,在品质标志的变异范围内划定各组界限,将总体标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。划分成为若干个性质不同的组成部分。在选择分组标志时,一般情况下不会发生在选择分组标志时,一般情况下不会发生困难,所出现的问题是各级界限的具体确困难,所出现的问题是各级界限的具体确定。在统计实践中,为了保证各种分类的定
20、。在统计实践中,为了保证各种分类的统一性和完整性,国家对某些重要的现象统一性和完整性,国家对某些重要的现象制定了统一的分类目录,如制定了统一的分类目录,如工业部门分工业部门分类目录类目录、产品分类目录产品分类目录等。等。第11页,本讲稿共37页2数量分组的方法数量分组的方法按数量标志分组就是按反映事物数量差异按数量标志分组就是按反映事物数量差异的数量标志为分组标志,并在数量标志的的数量标志为分组标志,并在数量标志的变异范围内,将总体划分为性质不同的若变异范围内,将总体划分为性质不同的若干组成部分。干组成部分。应该指出,在选择数量标志以后,分组过应该指出,在选择数量标志以后,分组过程中对于总体应
21、分为多少组,各组的界限程中对于总体应分为多少组,各组的界限怎样确定,这是一个比较复杂的问题。怎样确定,这是一个比较复杂的问题。分组不恰当,一方面不能反映出事物本身分组不恰当,一方面不能反映出事物本身所具有的内在结构,另一方面也不能反映所具有的内在结构,另一方面也不能反映事物的本质和规律,这就要求组数和组限事物的本质和规律,这就要求组数和组限的确定要恰当、科学。的确定要恰当、科学。第12页,本讲稿共37页3.3 频数分布频数分布3.3.1 频数分布的概念频数分布的概念在统计分组的基础上,将总体中所有单位在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在按组归类整理,形成总体
22、中各个单位数在各组间的分配,叫做频数分布。各组间的分配,叫做频数分布。分布在各组中的个体单位数叫做次数或频分布在各组中的个体单位数叫做次数或频数,频数大小决定该组标志值作用的强度。数,频数大小决定该组标志值作用的强度。各组次数与总次数之比叫做比率或频率,各组次数与总次数之比叫做比率或频率,频率表明各组值的相对作用强度。频率表明各组值的相对作用强度。第13页,本讲稿共37页将各组别与次数按一定的次序排列所形成将各组别与次数按一定的次序排列所形成的数列称作频数分布数列,简称分布数列,的数列称作频数分布数列,简称分布数列,又称分配数列或频数分配。又称分配数列或频数分配。任何分布数列都必须满足两个条件
23、:任何分布数列都必须满足两个条件:各各组频率都是介于组频率都是介于0和和1之间的一个分数;之间的一个分数;各组的频率总和等于各组的频率总和等于1(或(或100)。)。分布数列反映了所研究的总体中所有的单分布数列反映了所研究的总体中所有的单位数在各组内的分布状态和总体的分布特位数在各组内的分布状态和总体的分布特征,并据以研究总体某一标志的平均水平征,并据以研究总体某一标志的平均水平及其变动的规律。及其变动的规律。第14页,本讲稿共37页按品质标志分组编制的分布数列叫做品质按品质标志分组编制的分布数列叫做品质分布数列或属性分布数列,简称为品质数分布数列或属性分布数列,简称为品质数列。列。品质数列由
24、组的名称和各组的次数两个要品质数列由组的名称和各组的次数两个要素构成。品质数列的编制程序一般比较简素构成。品质数列的编制程序一般比较简单,其步骤见图单,其步骤见图3-1。原始数据原始数据分分组归类组归类合合计计(形成次数分布)(形成次数分布)制作制作统计统计表表制作制作统计统计表表图图3-1 品品质质数列的数列的编编制程序制程序第15页,本讲稿共37页3.3.2 变量数列变量数列变量数列是依据数量标志分组编制的分布变量数列是依据数量标志分组编制的分布数列,它是一种区分事物数量差别的分布数列,它是一种区分事物数量差别的分布数列,反映了总体在一定时间上的量变状数列,反映了总体在一定时间上的量变状态
25、或量变过程,并从这种量的差别中来反态或量变过程,并从这种量的差别中来反映事物质的差别。映事物质的差别。按数量标志分组应注意如下两个问题:按数量标志分组应注意如下两个问题:分组时各组数量界限必须能反映事物质的分组时各组数量界限必须能反映事物质的差别。差别。应根据被研究的现象总体的数量应根据被研究的现象总体的数量特征,采用适当的分组形式,确定适当的特征,采用适当的分组形式,确定适当的组距、组限。组距、组限。第16页,本讲稿共37页1单项式分组与组距式分组单项式分组与组距式分组单项式分组就是用一个变量值作为一组,单项式分组就是用一个变量值作为一组,形成单项式变量数列。形成单项式变量数列。单项式分组一
26、般适用于离散型变量且变量单项式分组一般适用于离散型变量且变量变动范围不大的场合。变动范围不大的场合。组距式分组就是将变量依次划分为几段区组距式分组就是将变量依次划分为几段区间,一段区间表现为间,一段区间表现为“从从到到”的距的距离,把一段区间内的所有变量值归为一组,离,把一段区间内的所有变量值归为一组,形成组距式变量数列。形成组距式变量数列。对于连续型变量或者变动范围较大的离散对于连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。型变量,适宜采用组距式分组。第17页,本讲稿共37页2间断组距式分组和连续组距式分组间断组距式分组和连续组距式分组在组距式分组中,每组包含了许多变量值,在组
27、距式分组中,每组包含了许多变量值,每一组变量值中,其最小值为下限,最大每一组变量值中,其最小值为下限,最大值为上限,组距是上下限之间的距离,相值为上限,组距是上下限之间的距离,相邻两组的界限称为组限。邻两组的界限称为组限。凡是组限不相连的,称为间断组距式分组。凡是组限不相连的,称为间断组距式分组。例如,儿童按年龄可分为:例如,儿童按年龄可分为:1岁以下,岁以下,l2岁,岁,35岁,岁,611岁,岁,1214岁。岁。凡是组限相连(或称相重叠的),即以同凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为连一数值作为相邻两组的共同界限,称为连续组距式分组。例如学生按其成绩分为:续
28、组距式分组。例如学生按其成绩分为:60分以下,分以下,6070分,分,7080分,分,8090分,分,90l00分。分。第18页,本讲稿共37页3 3等距分组与异距分组等距分组与异距分组按数量标志进行组距式分组,还可分为等按数量标志进行组距式分组,还可分为等距分组和异距(或称不等距)分组。等距距分组和异距(或称不等距)分组。等距分组就是标志值在各组保持相等的组距,分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。即各组的标志值变动都限于相同的范围。异距分组就是标志值在各组的组距不全相异距分组就是标志值在各组的组距不全相等。等。凡是在标志值变动比较均匀的情况下,都凡是在标志
29、值变动比较均匀的情况下,都可采用等距分组。等距分组有很多好处,可采用等距分组。等距分组有很多好处,它便于计算,便于绘制统计图。它便于计算,便于绘制统计图。第19页,本讲稿共37页在下列场合下,必须考虑采用异距分组。在下列场合下,必须考虑采用异距分组。在下列场合下,必须考虑采用异距分组。在下列场合下,必须考虑采用异距分组。(1 1)标志值分布很不均匀的场合)标志值分布很不均匀的场合)标志值分布很不均匀的场合)标志值分布很不均匀的场合(2 2)标志值变动相等的量具有不同意义的场合)标志值变动相等的量具有不同意义的场合)标志值变动相等的量具有不同意义的场合)标志值变动相等的量具有不同意义的场合(3
30、3)标值按一定比例发展变化的场合)标值按一定比例发展变化的场合)标值按一定比例发展变化的场合)标值按一定比例发展变化的场合 对于异距分组,由于各组次数的多少还受到组距不同对于异距分组,由于各组次数的多少还受到组距不同对于异距分组,由于各组次数的多少还受到组距不同对于异距分组,由于各组次数的多少还受到组距不同的影响,各组的频数可能会随着组距的扩大而增加,的影响,各组的频数可能会随着组距的扩大而增加,的影响,各组的频数可能会随着组距的扩大而增加,的影响,各组的频数可能会随着组距的扩大而增加,随着组距的缩小而减少。随着组距的缩小而减少。随着组距的缩小而减少。随着组距的缩小而减少。为消除异距分组所造成
31、的这种影响,须计算频数密为消除异距分组所造成的这种影响,须计算频数密为消除异距分组所造成的这种影响,须计算频数密为消除异距分组所造成的这种影响,须计算频数密度(或称次数密度)和频率密度,其计算公式如下:度(或称次数密度)和频率密度,其计算公式如下:度(或称次数密度)和频率密度,其计算公式如下:度(或称次数密度)和频率密度,其计算公式如下:(3-13-1)第20页,本讲稿共37页4组距、组数、组限与组中值的计算组距、组数、组限与组中值的计算组距就是各组上下限之间的距离。组距的组距就是各组上下限之间的距离。组距的大小应适度,以符合分组的要求为原则。大小应适度,以符合分组的要求为原则。组距与分组的组
32、数有密切的关系,它们实组距与分组的组数有密切的关系,它们实质上是一个问题的两个方面。组距大,则质上是一个问题的两个方面。组距大,则分成的组数就相应地少;组距小,则分成分成的组数就相应地少;组距小,则分成的组数就多。的组数就多。组数过少,容易把不同质的单位归并在一组数过少,容易把不同质的单位归并在一个组内;组数过多,又容易把同质的单位个组内;组数过多,又容易把同质的单位分散于许多组中,两者都不能很好地达到分散于许多组中,两者都不能很好地达到分组的基本要求。分组的基本要求。第21页,本讲稿共37页决定组数的多少并无规则可言,必须凭借经验和所研究问决定组数的多少并无规则可言,必须凭借经验和所研究问决
33、定组数的多少并无规则可言,必须凭借经验和所研究问决定组数的多少并无规则可言,必须凭借经验和所研究问题的性质做出判断。这里介绍一个确定组数和组距的经验题的性质做出判断。这里介绍一个确定组数和组距的经验题的性质做出判断。这里介绍一个确定组数和组距的经验题的性质做出判断。这里介绍一个确定组数和组距的经验公式,这一公式是美国学者斯特杰斯(公式,这一公式是美国学者斯特杰斯(公式,这一公式是美国学者斯特杰斯(公式,这一公式是美国学者斯特杰斯(H.A.SturgesH.A.Sturges)创用的,称为斯特杰斯经验公式,即:创用的,称为斯特杰斯经验公式,即:创用的,称为斯特杰斯经验公式,即:创用的,称为斯特杰
34、斯经验公式,即:(3-23-2)(3-33-3)式中:式中:式中:式中:k k为组数;为组数;为组数;为组数;NN为总体单位数;为总体单位数;为总体单位数;为总体单位数;d d为组距;为组距;为组距;为组距;R R为全为全为全为全距,即最大变量值距,即最大变量值距,即最大变量值距,即最大变量值x xmaxmax与最小变量值与最小变量值与最小变量值与最小变量值x xminmin之差。之差。之差。之差。第22页,本讲稿共37页上下限之间的中点数值称为组中值,组中上下限之间的中点数值称为组中值,组中值的计算公式为:值的计算公式为:(3-4)在计算平均指标或进行其他统计分析时,在计算平均指标或进行其他
35、统计分析时,常以组中值来代表各组标志值的平均水平。常以组中值来代表各组标志值的平均水平。当各组标志值均匀分布时,组中值代表各当各组标志值均匀分布时,组中值代表各组标志值的水平的代表性就高。组标志值的水平的代表性就高。第23页,本讲稿共37页在编制组距数列时,为避免出现空白组,在编制组距数列时,为避免出现空白组,同时又能使个别特大或特小的变量值不致同时又能使个别特大或特小的变量值不致无组可归,往往在首末两组使用开口组。无组可归,往往在首末两组使用开口组。一般假定开口组的组距等于相邻组的组距。一般假定开口组的组距等于相邻组的组距。因此,首组和末组的组中值计算公式为:因此,首组和末组的组中值计算公式
36、为:(3-73-7)(3-83-8)第24页,本讲稿共37页组距变量数列的编制程序见图组距变量数列的编制程序见图3-2。计算全距确定组数、组距确定组限合计(形成次数分布)制作统计表分组归类图3-2 组距变量数列的编制程序 原始数据序列化第25页,本讲稿共37页3.3.3 累计频数与累计频率累计频数与累计频率 向上累计是指将各组频数和频率由变量值小向上累计是指将各组频数和频率由变量值小的组向变量值大的组累计,表明累计到该组的组向变量值大的组累计,表明累计到该组上限以下各组的总次数和所占的总比重;上限以下各组的总次数和所占的总比重;向下累计是指将各组频数和频率由变量值大向下累计是指将各组频数和频率
37、由变量值大的组向变量值小的组累计,表明累计到该组的组向变量值小的组累计,表明累计到该组下限以上各组的总次数和所占的总比重。下限以上各组的总次数和所占的总比重。第26页,本讲稿共37页3.4 数据整理的组织和技术数据整理的组织和技术 3.4.1 数据整理的组织形式数据整理的组织形式 统计汇总的组织形式基本有三种:统计汇总的组织形式基本有三种:集中汇总集中汇总 逐级汇总逐级汇总 综合汇总综合汇总 第27页,本讲稿共37页3.4.2 数据整理的技术数据整理的技术 手工汇总手工汇总电子计算机数据处理技术电子计算机数据处理技术第28页,本讲稿共37页3.5 统计表和统计图统计表和统计图 3.5.1 统计
38、表统计表1.统计表的概念统计表的概念狭义的统计表专指分析表和容纳各种统计狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表,资料的表格,也就是通常所说的统计表,它清楚地、有条理地显示统计资料,直观它清楚地、有条理地显示统计资料,直观地反映统计分布特征。地反映统计分布特征。第29页,本讲稿共37页2统计表的构成统计表的构成(1)从形式上统计表由总标题、横行标题、)从形式上统计表由总标题、横行标题、纵栏标题和指标数值四部分组成纵栏标题和指标数值四部分组成(2)从内容上统计表由主词栏和宾词栏两)从内容上统计表由主词栏和宾词栏两部分组成部分组成 第30页,本讲稿共37页3统计表的分
39、类统计表的分类(1)按主词的结构分类,根据主词是否分)按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和组和分组的程度,分为简单表、分组表和复合表复合表(2)按宾词的设计分类,可分为宾词简单)按宾词的设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列三种排列、分组平行排列和分组层叠排列三种第31页,本讲稿共37页3统计表的设计统计表的设计(1)标题设计)标题设计(2)线条的绘制)线条的绘制(3)合计栏的设置)合计栏的设置(4)指标数值)指标数值(5)计量单位)计量单位(6)注解或资料来源)注解或资料来源第32页,本讲稿共37页3.5.2 统计图统计图1定类数据的图示定类
40、数据的图示(1)条形图()条形图(bar chart)(2)饼图()饼图(pie chart)2定序数据的图示定序数据的图示 上面介绍的定类数据的图示方法,也都适上面介绍的定类数据的图示方法,也都适用于定序数据。用于定序数据。(1)累计频数分布图。)累计频数分布图。(2)环形图()环形图(annular chart)第33页,本讲稿共37页3定量数据的图示定量数据的图示(1)直方图()直方图(histogram)(2)折线图)折线图(3)曲线图)曲线图 第34页,本讲稿共37页3.5.3 频数分布的类型频数分布的类型 1钟型分布钟型分布钟型分布的特征是钟型分布的特征是“两头大,中间小两头大,中
41、间小”,即靠近中间的变量值分布的次数多,靠近即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,其曲线图宛如一两边的变量分布次数少,其曲线图宛如一口古钟。口古钟。2U型分布型分布U型分布的特征与钟型分布相反,靠近中间型分布的特征与钟型分布相反,靠近中间的变量值分布的次数少,靠近两端的变量的变量值分布的次数少,靠近两端的变量值分布次数多,形成值分布次数多,形成“两头大、中间小两头大、中间小”的的U字型分布。字型分布。第35页,本讲稿共37页3J型分布型分布(1)正型)正型J分布分布是指随着变量值的增加,分布的次数也随是指随着变量值的增加,分布的次数也随之增加,绘成曲线图,形若英文字母之增加
42、,绘成曲线图,形若英文字母“J”,(2)反型)反型J分布分布是指随着变量值的增加,分布的次数随之是指随着变量值的增加,分布的次数随之减少,绘成曲线图,形若反写英文字母减少,绘成曲线图,形若反写英文字母“J”。第36页,本讲稿共37页频数分布的类型频数分布的类型对称分布对称分布对称分布对称分布对称分布对称分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布正正正正正正J J J型分布型分布型分布型分布型分布型分布反反反反反反J J J型分布型分布型分布型分布型分布型分布U UU型分布型分布型分布型分布型分布型分布几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布第37页,本讲稿共37页