《统计基础知识第三章.ppt》由会员分享,可在线阅读,更多相关《统计基础知识第三章.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章 统计整理 第一节第一节 统计整理的内容和方法统计整理的内容和方法 一、统计整理的概念和意义 (一)统计整理的概念 统计整理是根据研究的任务和要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使其条理化、系统化,从而得到反映总体特征综合资料的过程。(二)统计整理的意义 统计整理实现了从总体单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。因而,它在统计研究中起承前启后的作用。二、统计整理的内容 包括:对原始资料进行审核和检查,对各项指标进行综合汇总并分组,编制统计表与分析表,对统计资料进行系统积累等四个方面。三、
2、统计整理的方法 统计整理的基本方法是分组、汇总和编表。一、统计分组的概念 统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。注意三点:一是统计分组的对象是总体;二是统计分组应有分组标志;三是统计分组对总体而言是“分”,对总体单位是“合”。第二节第二节 统计分组统计分组二、统计分组的作用(一)发现社会经济现象的特点与规律(二)将复杂社会经济现象划分为性质不同的各种类型(三)分析总体中各个组成部分的结构情况(四)揭示现象之间的依存关系P30三、统计分组方法(一)选择分组标志的原则1、根据研究目的和任务选择分组标志。2、选用能反映事物本质或主要特征的标志。3、根据现象
3、所处的历史、经济条件选择标志。(二)分组方法确定分组标志后,具体分组方法有:1、按品质标志与数量标志分组;2、按主要标志与辅助标志分组。四、统计分组体系 统计分组体系是根据统计分组的要求,对同一总体进行多种不同分组而形成的体系,体系中的各种分组相互联系、相互补充,可以加深人们对社会经济现象的认识。(一)简单分组与平行分组体系 将总体按一个标志分组,称为简单分组。将同一总体选择两个或两个以上的标志分别进行独立的简单分组,就形成平行分组体系。(二)复合分组与复合分组体系 对同一总体选择两个或两个以上的标志重叠起来分组,就是复合分组。多个复合分组组成的分组体系就是复合分组体系。五、统计工作中常用的分
4、组 一是按所有制性质分组;二是按国民经济行业分组;三是按单位隶属关系分组;四是按地区分组。等等。P32 第三节第三节 次数分布次数分布 一、次数分布的概念 按某一标志进行分组后的总体,再按一定的顺序进行归并排列,形成总体单位在各组间的分布,称为次数分布。次数分布是在各组按顺序排列的基础上,列出每个组的总体单位数并形成一个数列,称为次数分布数列,或简称分配数列。各组的总体单位数叫次数或频数。分配数列明显包括两个要素:分组和次数。二、分配数列的种类 根据分组标志的不同,分配数列分为品质分配数列和变量分配数列。按品质标志分组,观察总体各单位分布情况的分配数列叫品质分配数列,简称品质数列。如,表3-4
5、。表3-4 某企业职工性别情况的分配数列(品质数列)性别职工人数(人)男680女520合计1200 按数量标志分组,观察总体各单位分布情况的分配数列叫变量分配数列,简称变量数列。如,表3-5。表3-5 某地区企业销售收入情况的分配数列(变量数列)销售收入(万元)企业数(个)80-90290-1004100-11016110-1206合计28 变量数列又可分为离散变量数列和连续变量数列。连续变量数列,一般是组距式,每个组包含若干变量值;对于离散变量数列,如果变量值数目不多,可编成单项式,即以一个变量值作为一个组(或每个组只包含一个变量值),如果变量值很多,应编制成组距式。变量数列 三、变量数列的
6、编制 (一)单项式变量数列的编制方法 A、将所有变量值按由小到大或由大到小的顺序排列;B、分别汇总出每一变量值(如420件)所对应的工人数(如4人);C、将上述结果填入表3-6中。表3-6 某工厂工人完成生产定额情况变量数列(单项式)按完成生产定额分组(件)工人数(人)4204450248045008510452075304540195801762096306650127204合计合计100 (二)组距式变量数列的编制方法 仍以上述资料为例,编制方法如下:A、将所有工人完成定额情况按完成件数分组;B、汇总出每组包含的工人数;C、将每一组按由小到大的顺序排列;D、将上述结果填入表3-7中。表3-
7、7 某工厂工人完成生产定额情况变量数列(组距式)按完成件数分组(件)工人数(人)500以下10500-55042550-60017600-65015650-70012700以上4合计100 编制组距式变量数列,要注意四组基本要素:1、组距与组数 组距是指每个组变量值中最大值与最小值的差。一般把最大值叫该组的上限,把最小值叫该组的下限。组距等于上限与下限之差,即:(上限下限)。上表第二组的组距是550-500=50。组数是指将某一变量数列划分为多少组。2、等距数列与异距数列 在组距数列中,各组组距都相等的数列,叫等距数列;各组组距不相等的数列,叫异距数列(或称不等距数列)。在总体单位标志值变动比
8、较均匀时,可采用等组距分组。当总体单位标志值变动很不均匀,如急剧的增长、下降、变动幅度很大时,就应采用不等距分组。3、组限与组中值 组限是指每个组距两端的标志值,每个组的起点值称为下限(或最小值),每组的终点值称为上限(或最大值)。组中值是每个组上限与下限的中点值。即:组中值=(上限+下限)2;如,(550+500)2=525 或:下限+(上限下限)2;如,500+(550500)2=525 或:上限(上限下限)2;如,550(550500)2=525 当各组内标志值均匀分布时,组中值可以代表各组标志值的平均水平;当各组内标志值不是均匀分布时,组中值只能近似代替各组实际平均值。(第四章中有例子
9、说明)划分组限时,相邻组的上下限可以不重叠,也可以重叠。如果重叠,同上限相等的标志值应该计入下一组,即“上限不在组内”。表3-7中的第一组(500以下)和第六组(700以上)开口组的处理办法:首组开口的下限=首组上限邻组组距 表3-7中的第一组的下限=500(550500)=450 末组开口的上限=末组下限+邻组组距 表3-7中的第六组的上限=700+(700650)=750 由此可知,开口组的组中值计算方法:首组开口组的组中值=首组上限(邻组组距/2)末组开口组的组中值=末组下限+(邻组组距/2)P37 4 4、频数与频率、频数与频率 频数是指分配数列中各组的单位数,也称次数。频数愈大,则该
10、组的标志值对于总体标志水平所起的作用愈大;反之,愈小。频率是将各组的单位数(次数)与总体单位数相比,得出用百分比表示的相对数,也称比率或比重。频率可以反映各组标志值对总体的相对作用的强度和各组标志值出现概率的大小。可见,任何一个分布都必须满足:1、各组的频率大于0;(即次数必须大于1)2、各组的频率总和等于1(或100%)。四、次数分布的表示方法 (一)列表法 (二)图示法 有四种:1、直方图;2、折线图;3、曲线图;4、饼图。第四节第四节 数据的计算机录入汇总与质量控制数据的计算机录入汇总与质量控制 一、计算机汇总的步骤 (一)编制程序;(二)编码;(三)数据录入;(四)数据编辑;(五)计算
11、与制表。二、数据录入的质量控制 一是做好登记与审查工作;二是控制录入质量;三是利用计算机进行审查。第五节第五节 统计表统计表 一、统计表的概念及作用 统计表,是由纵横交叉的线条所绘制的表格,一般为统计整理与统计分析阶段使用。统计表的作用:一是阅读方便,一目了然,比较直观,可在短时间内给人以明确的概念;二是通过合理、科学地排列统计资料,便于读者进行对照比较,从而发现现象之间的规律;三是便于汇总和审查;四是便于计算和分析。二、统计表的构成和内容 统计表是由总标题、横行标题、纵栏标题和指标数值四部分构成。有些统计表在表下还有补充资料、附记、资料来源、指标计算方法、填表单位、填表人员和填表日期等。从统计表的内容看,又分为主词和宾词两个部分。主词就是统计表所要说明的总体及其分组的名称,宾词是说明总体的统计指标,包括指标名称和指标数值。需要说明,为了编排合理和阅读方便,主词和宾词的位置可以互换。三、统计表的分类(一)按作用不同分类1、调查表;2、汇总表或整理表;3、分析表。(二)按主词加工方法不同分类1、简单表;2、简单分组表;3、复合分组表。四、统计表的编制规则