《统计学基础第三章 统计整理.doc》由会员分享,可在线阅读,更多相关《统计学基础第三章 统计整理.doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流统计学基础 第三章 统计整理【精品文档】第 12 页第三章 统计整理【教学目的】1.深刻理解统计分组的作用,并且能够对不同的社会经济现象进行统计分组2.运用分配数列对原始数据进行系统整理3.制作统计表,运用计算机绘制统计图【教学重点】1.能够对不同的社会经济现象进行统计分组2.运用分配数列对原始数据进行系统整理3.制作统计表,运用计算机绘制统计图【教学难点】1.运用分配数列对原始数据进行系统整理2.制作统计表,运用计算机绘制统计图【教学时数】教学学时为8课时【教学内容参考】 第一节 统计整理的意义 一、统计整理的意义 统计整理,就是根据统计研究的目的和任
2、务的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化,从而得到表现总体特征的综合统计资料的工作过程。对于已整理过的初级资料进行再整理,也属于统计整理。 统计调查取得的各种原始资料是分散的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的总体情况与全貌。因此,只有对这些资料进行加工、整理,才能认识事物的总体及其内部联系。例如,工业企业普查中,所调查的每个工业企业资料,只能说明每个工业企业的经济类型、注册资本、职工人数、工业总产值、工业增加值、实现利税等具体情况。必须通过对所有资料进行分组、汇总等加工处理后,才能得到全国工业企业的综合情况
3、,从而分析工业企业的构成、经营状况等,达到对全国工业企业的全面的、系统的认识。 统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。因此,资料整理得是否正确,直接决定着整个统计研究任务的完成,不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值。因此,必须十分重视统计整理工作。二、统计整理的步骤统计整理的基本步骤是:(一)对原始资料进行审查。 1.审查被调查单位的资料是否齐全;2.应审查数据是否准确。审查的办法主要有:逻辑审查:主要是从定性角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。例如,儿童年龄段的人所填的职
4、务是高级工程师,对此显然违背逻辑的项目,应予以纠正。 计算审查:是指审查调查表中的各项数据在计算结果和计算方法上有无错误。例如各分项数字之和是否等于相应的合计数,各结构之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同等。(二)对各项原始资料进行分组并综合汇总,计算出总体总量指标。(三)将汇总的结果,以统计表或统计图的形式表现出来。(四)将统计资料进行系统积累。第二节 统计分组一、统计分组的概念 统计分组是根据研究任务的要求和现象总体内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计分析方法。统计分组的目的就是揭示各组之间性质上的差异。分组的目的是使组与组之间产生性
5、质上的差异,而使各自组内性质相同。 二、统计分组的作用 统计分组在统计分析中具有重要的作用,主要表现在以下几方面: 1.零星分散的统计资料,经过统计分组后,可以发现其特点及规律性 【案例】 某公司有100名工人,平均分成10个小组,生产定额为每人每天生产零部件500件,2月10日每个工人的完成生产定额情况如下(单位:件):一组:520 520 520 520 550 550 580 580 580 580二组:540 540 540 540 540 540 540 540 540 540三组:540 540 540 540 540 540 540 540 580 580四组:520 520 5
6、20 520 530 500 500 500 500 500五组:510 510 520 520 520 500 510 510 500 500六组:530 530 530 540 620 620 620 620 720 720七组:720 720 630 630 630 630 620 620 620 620八组:650 650 650 650 650 650 650 650 650 650九组:580 580 580 580 580 580 580 580 580 580十组:480 480 480 480 480 450 450 420 430 430从上面资料中,我们只能大体看出各组完
7、成生产定额情况有高有低,而很难看出100人总的情况及特点。下面将资料进行分组并汇总进行观察,见表3-1。表3-1 某公司工人完成生产定额情况按完成件数分组(件)工人人数(人)500以下1050055048550600166006501265070010700以上4合 计100 从表3-1的资料中,我们可以对该车间生产情况做出综合评价,指出其特点:90%以上的工人完成了生产定额;在完成生产定额的工人中,略超过生产定额的工人(完成500550件)占48%,超过生产定额较多的工人占42%。总的结论是该公司工人生产定额完成得比较好,绝大部分能完成或超额完成生产定额。如果不经过上述分组,就难以观察出这些
8、特点。2.把复杂现象总体区分为各个性质不同的组成部分,以认识现象之间质的差别在复杂社会经济现象中,往往要将社会经济现象总体划分为性质不同的类型,这是统计工作中应用最广泛、最主要的分组。这种分组也称为国民经济分类。【案例】我国经济成分按所有制形式划分为公有制经济和非公有制经济。3.把不同时间的同一标志的内部结构资料排列起来,可以反映总体内部结构的变化将社会经济现象总体按照某个标志分成若干组成部分,并计算总体内部各组成部分占总体的比重,以揭示总体内部的构成,表明部分与总体、部分与部分之间的关系。【案例】改革开放以来我国第一、第二、第三产业之间的关系见表3-2。 表3-2 国内生产总值中各产业比例构
9、成表 单位:% 1983年1988年1993年1998年2003年2007年第一产业33.225.719.717.612.811.3第二产业44.443.846.646.246.048.6其中:工业39.938.440.240.340.543.0建筑业4.55.46.45.95.55.6第三产业22.430.533.736.241.240.1其中:交通运输、仓储和邮电业4.64.56.15.55.85.9批发和零售业3.39.98.08.28.27.3 资料来源:2008年中国统计年鉴。 从表中的各组构成情况,可以看到国民经济内部产业结构随着时间的推移不断地发生变化,尤其明显的是,第三产业的比
10、例在逐渐上升,说明人民的消费水平在不断提高。4.可以揭示现象之间的依存关系一切社会经济现象都不是孤立的,而是互相联系、互相依存、互相制约的。【案例】工业企业中,劳动生产率与利润的依存关系;商业企业中,商品销售额与流通费用的关系;人口统计中,吸烟者与肺癌患者的关系等都可以通过分组来解释。三、统计分组的方法统计分组的关键问题是正确地选择分组标志与划分各组界限。(一)选择分组标志的原则1.要根据研究的目的与任务选择分组标志我们之所以选择一定的标志对总体分组,是为了达到一定的研究目的,完成一定的研究任务。研究目的不同,选用的分组标志也有所不同。【案例】以某地区全部居民为总体,如果要研究其生活水平情况,
11、则应将户均收入或人均收入等作为分组标志;如果要研究其居住的情况,则用人均居住面积等作为分组标志。【能力训练】对工人总体,如果研究目的是分析工人的文化素质,那么应选择的分组标志是什么?如果研究目的是分析工人的劳动能力状况,又应选择什么作为分组标志呢?2.要选择能够反映事物本质或主要特征的标志在一定的研究目的下,往往会有若干个与研究目的有关联的标志可供我们选择,这时,就应选择与研究目的关系最密切、最能反映现象本质特征的作为分组标志。【案例】研究职工生活水平情况,可以用职工的收入水平作为分组标志,也可以用职工家庭成员平均收入水平作为分组标志。究竟选用哪个分组标志更能充分反映职工的生活水平呢?我们知道
12、,职工的收入水平并不能确切反映职工的生活水平,还要看其赡养的家庭人口数以及其他家庭成员的收入。因此,选用职工收入水平作为分组标志不够恰当,而应选用职工家庭成员平均收入水平作为分组标志。3.要根据现象的历史条件及经济条件来选择【案例】研究职工生活水平时,要划分出困难户有多少,应选用什么作为划分标准?显然要根据当时的物价水平及经济条件来确定,而且各个年代的标准也是不同的。又如,解决温饱问题的标准、贫困县的标准、达到小康水平的标准等都要依据所处的历史、经济条件来确定。 (二)统计分组的种类 1.根据分组标志的性质不同分为两种:(1)按品质标志分组。按品质标志分组就是用反映事物属性的标志作为分组标志,
13、它可以将总体单位划分为若干性质不同的组成部分。【案例】职工按性别、文化程度、技术等级、籍贯等标志分组;企业按经济类型、轻重工业、企业规模等标志分组等。(2)按数量标志分组。按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体各单位划分为若干个组。【案例】按家庭人口数对居民家庭的分组,按学习成绩将学生划分为成绩不同的组。 2.根据分组标志的个数不同分为两种:(1)简单分组。简单分组是指按一个标志进行分组,只反映总体某一方面的数量状态和结构特征。比如职工按性别分组,企业按经济类型分组等。(2)复合分组。复合分组是指按两个或两个以上标志重叠分组,即先按一个主要标志分组,然后再按另一个从属标
14、志在已分好的各组中分组。比如,人口按性别先作简单分组,分为男、女两组后,再按受教育程度分为大学文化程度、中学文化程度等组。复合分组能对总体做出更加全面和深入的分析,反映其内部类型和结构特征。但复合分组的组数将随着分组标志个数的增加而成倍地增加。因此,在进行复合分组时,分组标志个数不宜过多,要适当加以控制。 (三)统计分组体系 1.统计分组体系的概念 统计分组体系是根据统计分析的要求,通过对同一总体进行多种不同分组而形成的一种相互联系、相互补充,从多方面反映总体内部关系的分组体系。在统计分析中,不论是简单分组还是复合分组,都只能对客观现象从一个方面或几个方面进行研究分析,不能说明现象的全貌,而统
15、计分组体系则从不同的角度来对总体进行系统全面的观察分析。它适用于对复杂现象总体的系统研究。 2.统计分组体系的种类 统计分组体系分为平行分组体系和复合分组体系两种。(1)平行分组体系。平行分组体系是对总体采用两个或两个以上标志分别进行简单分组。【案例】研究大学生毕业就业情况,可以采用以下平行分组体系:项目按学历分组按性别分组按学科性质分组本科专科男学生女学生文科理科就业人数合计 (2)复合分组体系。复合分组体系是对总体同时选择两个或两个以上的分组标志重叠起来进行分组。【案例】研究大学生毕业就业情况,可以采用以下平行分组体系:大学生分组就业人数本科文科男学生女学生小计理科男学生女学生小计专科文科
16、男学生女学生小计理科男学生女学生小计合 计第三节 分配数列一、分配数列的概念与种类将总体按某一标志进行分组,并按一定顺序排列出每组的总体单位数,所得到的数列称为分配数列,又称次数分配或次数分布。在分配数列中,分布在各组的总体单位数叫做次数,又称频数。各组次数与总次数之比称为比率,又称频率。由此可见,分配数列有两个组成要素:一个是分组,另一个是次数或频率。分配数列是统计整理的结果,是进行统计描述和统计分析的重要方法。它可以表明总体分布特征及内部结构情况,并可据此研究总体单位某一标志的平均水平及其变动的规律性。分配数列根据分组标志的性质不同,可以分为品质数列与变量数列。 (一)品质数列它是按品质标
17、志分组形成的,用来观察总体单位中不同属性的单位分布情况的数列。【案例】我国2000年第五次人口普查中,人口按民族、性别、籍贯等分组所形成的数列都属于品质数列。表3-4是人口按性别分组形成的品质数列。 表3-4 2000年我国人口性别构成情况人口按性别分组人口数(万人)占总人口的比重(%)男6535551.63女6122848.37合 计126583100品质数列的编制比较简单,但要注意在分组时,应包括分组标志的所有表现,不能有遗漏,各种表现要互相独立,不得相融。 (二)变量数列 变量数列是按数量标志分组形成的,用来观察总体中不同变量值在各组的分布情况的数列。变量分为离散型变量和连续型变量。对这
18、两类变量,在编制变量数列时,其方法是不相同的:对于连续型变量一般只能按组距式分组,即以变量值的一定变动范围为一组,编制组距式变量数列(简称组距数列,参见表3-3);对于离散型变量一般按单项式分组,即将每个变量值作为一组,编制单项式变量数列(简称单项数列,参见表3-5)。但在实际应用时,如果连续型变量的变量值数目不多,数值变动幅度不大,就可以编制单项式变量数列;如果离散型变量的变量值数目很多,又无法一一列举,就可以编制组距式变量数列。在组距式变量数列中,需要明确以下各要素: 1.组限。组距式变量数列中,各组的界限称为组限。组限分为上限和下限。下限是每组最小的标志值,上限是每组最大的标志值。如果各
19、组的组限都齐全,称为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。 (1)划分连续型变量组限时,采用“重叠分组”和“上限不在内”原则,每组变量值都以下限为起点,上限为极限,但不包括上限。 (2)划分离散型变量组限时,相邻组的上下限应当间断,但在实际中为求简便也可采用“重叠分组”,参见表3-6。此外,当变量出现极大值或极小值时,可采用开口组,即用以下或以上表示。 2.组距。每组下限与上限之间的距离称为组距。即组距=上限-下限组距式变量数列,有等距和不等距两种。等距变量数列,是指各组的组距都相等。适用于现象变动比较均匀的情况。例如收入水平分组、单位面积农产品产量分组等。不等距变量数
20、列,是指各组的组距不都相等。适用于现象的变动不均匀或是为研究特定的研究目的编制不等距变量数列。例如人口的年龄分组常采用不等距分组。不等距变量数列中,可以用次数密度来反映各组实际次数的分布情况。即次数密度=次数组距 3.组中值。每组下限与上限之间的中点数值称为组中值。即组中值=(上限+下限)/2开口组的组中值计算公式如下: 缺下限组的组中值=(该组上限-邻组组距)/2 缺上限组的组中值=(该组下限+邻组组距)/2 组距式分组掩盖了各组标志值的分布情况,为了反映各组标志值的一般水平,通常用组中值作为各组的代表值。利用组中值的前提是:假定各组变量值的分布是均匀的或对称的。但在实际工作中大多数资料并非
21、如此,因此,组中值作为各组的代表值只是一个近似值。二、变量数列的编制(一)单项式变量数列的编制【案例】某生产车间50名工人日加工零件数(单位:个)如下:117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121试编制单项式变量数列。首先,将总体各单位标志值由小到大排列
22、:107 108 108 110 112 112 113 114 115 117117 117 118 118 118 119 120 120 121 122122 122 122 123 123 123 123 124 124 124125 125 126 126 127 127 127 128 128 129130 131 133 133 134 134 135 137 139 139 其次,以总体各单位标志值为各组标志值,以总体各单位标志值出现的次数为各组次数,编制单项式变量数列,见表3-5。表3-5 某车间50名工人日加工零件数分组表 零件数(个)频数(人)零件数(个)频数(人)零件数
23、(个)频数(人)107111911282108212021291110112111301112212241311113112341332114112431342115112521351117312621371118312731392通过所给资料我们编制成了单项式变量数列,但却很难看出50名工人日加工零件数的分布特点。因为该资料中,变量值不但多达27个,而且变量值由107139变动的范围也比较大,即使能一一列举,也不适宜编制单项式变量数列。如果编制成组距式变量数列,又会是什么结果呢?(二)组距式变量数列的编制【案例】仍以上题为例,编制组距式变量数列。编制过程如下:第一步,计算全距。将总体各单位标
24、志值由小到大排列,找出最大标志值与最小标志值,二者之差就是全距。上例中全距=139-107=32(件)。第二步,确定组数和组距。 在同一变量数列中,组数与组距相互制约,组距大,组数就少;组距小,组数就多。组数与组距的确定,应力求符合现象的实际情况,充分体现总体分布的特征。二者谁先被确定,应视具体情况全面考虑。如果先确定组距,除考虑上述要求外,还要充分考虑原始资料分配的集中程度或集中趋势,以及组内的同质性、组间的差异性。一般来讲,组数确定为57为宜。上例中,组距为5件,相应的组数为7组。第三步,确定组限和组中值。确定组限要考虑以下几点:1.最小组的下限(起点值)可以略低于最小变量值,最大组的上限
25、(终点值)可以略高于最大变量值;2.如果组距是5,10,100,则每组的下限最好是它的倍数;3.组限的具体表示方法,应视变量的性质而定。第四步,计算各组次数和组中值,见表3-6。表3-6 某车间50名工人日加工零件数分组表按零件数分组(个/人)频数(人)频率(%)组中值(个/人)10511036107.5110115510112.5115120816117.51201251428122.51251301020127.5130135612132.513514048137.5合 计50100从组距式变量数列中可以看到,50名工人日加工零件数主要集中在115129件,占64%。在某一变量数列中标志值
26、构成的数列表示标志值的变动幅度,而频数构成的数列则表示相应标志值的作用程度。频数愈大则相应组的标志值对全体标志水平所起的作用也愈大;反之,则相应组的标志值所起的作用愈小。因此,在整理和分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志值的作用大小,即频数的大小。将各组单位数和总体单位数相比,既可以表明各组标志值出现的频率的大小,也可以表明各组标志值对总体的相对作用程度。按顺序列出各组标志值的范围(或以各组组中值来代表)和相应的频率形成的次数分布,又称统计分布。任何一个分布都必然满足:各组的频率大于0;各组的频率总和等于1(或100%)。 次数分布是统计描述的一种重要方法,在
27、自然或社会现象中,有许多变量分布是属于正态分布的。例如,人的体重、身高、单位面积的农产品产量等,这类分布以标志变量的平均值为中心,沿着对称轴向两边发展,愈接近中心,分配的次数愈多,愈远离中心,分配的次数愈少,形成“两头小,中间大”的钟形的分布曲线。 还有一种社会现象的分布和正态分布相反,是沿“两头大,中间小”的形式发展,呈“U”字形。如人口的死亡率,按年龄分布如下:04岁、特别是未满1岁的婴儿,死亡率最高,从5岁起死亡率逐渐下降,至1014岁时,达到最低水平,从15岁起又缓慢上升,50岁以后上升显著增快,到60岁以后又达到最高水平。(三)累计频数和累计频率的计算在研究次数分布的时候,我们常常还
28、需要编制累计频数数列和累计频率数列。其方法通常是首先列出各组的组限,然后依次累计到本组为止的各组频数,求得累计频数。将累计频数除以频数总和即为累计频率。承上例,累计频数与累计频率计算见表3-7。 表3-7 某车间50名工人日加工零件数分组表 按零件数分组(个/人)频数(人)频率(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)10511036365010011011551081647941151208161632428412012514283060346812513010204080204013013561246921020135140485010048合 计50100 累计频数和
29、累计频率的意义是很明显的。上表中“向上累计”栏是将各组频数和频率从变量值低的组向变量值高的组累计,故称为向上累计,各组累计数的意义是各组上限以下的累计频数或累计频率。当我们所关心的是标志值比较低的现象的次数分布情况时,通常采用向上累计,以表明在这些数值以下的所有数值所占的比重。例如,表3-7中的第一组资料说明在50个工人中,日加工零件数在109件以下的有3人,占总数的6%;第二组资料说明日加工零件数在114件以下的有8人,占总数的16%,等等。有时为表示在一定标志值以上的累计频数和累计频率,则要从变量值高的组向变量值低的组累计,来求得累计频数和累计频率,称为向下累计,见表3-7“向下累计”栏,
30、各组累计数的意义是各组下限以上的累计频数或累计频率。当我们所关心的是标志值比较高的现象的次数分布情况时,通常采用向下累计,以表明在这些数值以上的所有数值所占的比重。例如,表3-7中的第五组资料表示在50个工人中,日加工零件数在125件以上的有20人,占总数的40%,第三组资料表示日加工零件数在115件以上的有42人,占总数的84%,等等。由此可见,累计频数和累计频率可以更简便地概括总体各单位的分布特征。【能力训练】如果要对某地区的家庭按其拥有的儿童数进行分组,请问应编制单项式变量数列还是组距式变量数列?为什么?如果对某地区的所有工业企业按产值进行分组,又应编制什么样的变量数列?为什么?第四节
31、统计表和统计图一、统计表 统计调查得来的大量原始资料,经过汇总整理之后,按照规定的要求填在相应的表格内,这种填有统计资料的表格叫做统计表。统计表对表现统计资料具有重要的作用:第一,它能够把说明总体单位特征的原始资料过渡为综合反映总体数量特征的表格资料,使统计资料的表现条理化、系统化和标准化;第二,它能够科学合理地组织统计资料,便于比较对照、分析研究现象的规模、速度和比例关系。 (一)统计表的结构 1.从统计表的形式看,统计表由四部分构成:(1)总标题:它是统计表的名称,用以概括表中统计资料的主要内容。(2)横行标题:它是各组的名称,反映总体单位的分组情况。 (3)纵栏标题:它是分组标志或指标的
32、名称,说明纵栏所列各项资料的内容。 (4)数字资料:也称指标数值,它是统计表的具体内容,每一项指标数值都由相应的横行标题和纵栏标题加以限定。2.从统计表的内容看,统计表包括主词和宾词两个部分。主词是统计表所要说明的总体,以及总体的各单位、各组的名称,或者各个时期。宾词是统计表用来说明主词的各个指标,包括指标名称、单位及指标数值。【案例】一般统计表:总标题 表3-8 2002年固定资产投资情况 绝对数(亿元)纵栏标题比上年增长(%)横行标题全社会固定资产投资其中:国有及其他固定资产投资 集体经济投资 城乡居民个人投资43202数字资料16.13102017.0590211.8628015.7主词
33、栏 宾词栏(二)统计表的种类 统计表的种类可根据主词的结构来决定,按照主词是否分组和分组的程度,分为简单表、分组表和复合表。 1.简单表简单表是主词未经任何分组的统计表;主词是由总体单位名称组成的一览表;主词是由地区、国家、城市等目录组成的区域表;主词是按时间顺序组成的编年表等等。2.分组表分组表是主词按一个标志进行分组的统计表,利用分组来揭示现象的不同特征,研究总体的内部构成,分析现象之间的依存关系。 我们这里所说的简单表、分组表和复合表,是按同一个原始资料设计的,请注意它们之间的联系,特别是指标计算上的联系。 (三)统计表的编制规则 为使统计表的设计合理、科学、实用、简明、美观,在编制统计
34、表时,必须遵守以下规则:(1)统计表的各种标题,特别是总标题的表达,应该十分简明、确切,能够概括地反映出统计表的基本内容,总标题还应该标明资料所属的时间和空间。(2)统计表的左右两端习惯上均不画线,采用开口式。 (3)如果统计表的栏数较多,通常要加以编号,主词和计量单位等栏,用(甲)、(乙)、(丙)等文字标明;宾词指标各栏,用(1)、(2)、(3)等数字编号。各栏之间若有计算关系,可以用数字符号表示。如(3)=(2)(1),表示第(3)栏等于第(2)栏乘以第(1)栏。 (4)表中数字应该填写整齐,对准位数,当数字为0或因数小可忽略不计时,要写上0;当缺乏某项资料时,用符号“”表示;不应有数字时
35、用符号“”表示。 (5)表中的横行“合计”,一般列在最后一行(或最前一行),表中纵栏的“合计”一般列在最前一栏。 (6)统计表中必须注明数字资料的计量单位,当表中只有一种计量单位时,可以把它写在表头的右上方。如果表中需要分别注明不同的单位,横行的计量单位可以专设一栏;纵栏的计量单位,要与纵栏标题写在一起,用小字标写。 (7)必要时,统计表应加注说明或注解。例如,某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补的,这些都要加以说明。此外还要注明统计资料的来源,以便查考。说明或注解一般写在表的下端。编制实用、美观的统计表,关键在于实践,通过经常观察、揣摩并动手绘制,才能熟
36、练掌握。二、统计图 (一)统计图的概念 统计图是利用几何图形或具体形象表现统计资料的一种形式。用统计图表现统计资料,具有鲜明醒目、富于表现、易于理解的特点,因而绘制统计图是统计整理的重要内容之一。 统计图可以表明现象的规模、水平、结构、对比关系、依存关系、发展趋势和分布状况,有利于进行统计分析和研究。目前主要利用Excel绘制统计图。 (二)统计图的种类 常用的统计图主要有几何图、象形图、统计地图等。可以应用Excel制作统计表和统计图。附录 应用Excel作频数分布表和图形一、应用Excel作频数分布表(一)定量分析数据整理分析1.使用频数函数编制频数分布表2.使用“数据分析”工具编制频数分
37、布表(二)定性分析数据二、应用Excel绘制统计图单元实训 统计整理分析方法应用【实训目的】 统计整理是统计工作过程中的中间环节,它既是统计调查的继续,又是统计分析的前提。通过本实训的学习,目的是使学生能深刻理解统计分组的作用,掌握统计整理的分析方法,尤其是使学生能够熟练运用计算机对原始数据进行系统整理,设计统计表、制作统计图并对其进行简要分析。 【实训资料】2008年黑龙江单位GDP能耗同比下降4.75%具体详尽的资料见第三章单元实训。【实训要求】1.将此实训中反映各指标数值的统计表3-15、3-16,按照原样输入到Excel文档中。2.将Excel文档中统计表3-16和3-17的统计数据,
38、绘制折线图。【实训形式】应用Excel的输入公式法,按照实训要求,对实训资料进行统计整理。【实训时间】计划学时1学时,要求在第三章统计整理的教学内容完成后进行。【实训地点】教室或多媒体教室。项目实战整理项目资料【实战目的】通过本项目实战,使学生掌握应用统计软件(EXCEL)对统计调查收集得到的原始资料或次级资料进行分组、汇总,使之条理化、系统化的统计整理工作技能。【实战要求】结合第3章统计整理教学内容的学习,以项目小组为单位组织学生,将社会调查取得的原始资料输入到Excel文本中,或将登录相关官方网站搜索到的次级资料(例如,若想要调查我国城乡居民收入差距,就可以登录国家统计局或地方统计局网站的
39、年度统计数据,查找所需信息,以记事本格式文件保存)导入到Excel文本中,应用Excel操作方法对调查数据资料进行分组汇总,使之条理化、系统化,完成统计整理工作过程。【实战资料】通过统计调查项目实战,我们每个项目小组已经确定了各自调查课题,且以项目小组为单位展开了社会调查,取得了调查资料。现在需要将统计调查项目实战取得的调查资料,进行统计整理,使之条理化、系统化,为统计分析作准备。【实战学时】需用2学时来完成“整理项目资料”项目实战训练。【实战地点】根据项目课题实施步骤确定实战地点,完成“整理项目资料”项目实战训练:1.先在教室或自习室完成项目资料手工整理。2.然后在电子实训室将手工整理的项目资料输入Excel文本中,完成电子资料整理。【实战操作步骤】1.根据调查项目确定调查标志。2.根据调查标志多少与级次情况,设计调查表。3.将项目调查取得的相关信息输入调查表,形成调查资料。4.将调查资料进行分组、汇总,编制统计表或绘制统计图。注意:由于统计资料整理工作具有承上启下的作用,即统计整理是统计调查的继续,也是统计分析的前提,所以第四步骤的实战操作结果并入到统计分析项目实战中体现。【实战案例】大学生生活费收支状况调查统计整理实施过程