《第四章 统计整理.pdf》由会员分享,可在线阅读,更多相关《第四章 统计整理.pdf(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2011-9-23 第四章 统计整理 1 第四章 统计整理 2011-9-23 第四章 统计整理 2 一、统计整理的概念、原则 和步骤 二、统计分组 三、次数分布 四、统计整理的组织和技术 五、统计表 2011-9-23 第四章 统计整理 3 一、统计整理的概念、原则和步骤一、统计整理的概念、原则和步骤 1概念 2原则 3步骤 2011-9-23 第四章 统计整理 4 1概念:概念:根据统计研究的目的,将统计调查所根据统计研究的目的,将统计调查所取得的原始资料进行科学地分类和汇总,或对已取得的原始资料进行科学地分类和汇总,或对已经加工的综合资料进行再加工,为统计分析准备经加工的综合资料进行再加
2、工,为统计分析准备系统化的、条理化的综合资料的工作过程。系统化的、条理化的综合资料的工作过程。2原则:原则:在对所研究的社会经济现象进行深刻在对所研究的社会经济现象进行深刻地政治经济分析的基础上,抓住最基本、最能说地政治经济分析的基础上,抓住最基本、最能说明问题本质特征的统计分组和统计指标对统计资明问题本质特征的统计分组和统计指标对统计资料进行加工整理。料进行加工整理。2011-9-23 第四章 统计整理 5 3步骤:a:设计和编制统计资料的汇总方案;设计和编制统计资料的汇总方案;b:对原始资料进行审核;对原始资料进行审核;c:用一定的组织方式和方法,对原始资料用一定的组织方式和方法,对原始资
3、料 进行分组、汇总和计算;进行分组、汇总和计算;d:对整理好的资料进行再一次的审核,改对整理好的资料进行再一次的审核,改 正在汇总过程中发生的各种差错;正在汇总过程中发生的各种差错;e:编制统计表。编制统计表。返回目录 2011-9-23 第四章 统计整理 6 二、统计分组二、统计分组 1.概念:概念:就是根据统计研究的需要,将统计总就是根据统计研究的需要,将统计总体按一定的标志区分为若干个组成部分的一体按一定的标志区分为若干个组成部分的一种统计方法。种统计方法。注:有两个方面的含义:注:有两个方面的含义:a:对总体而言是对总体而言是“分分”,把总体分为性质相,把总体分为性质相异的若干部分;异
4、的若干部分;b:对个体而言是对个体而言是“合合”,即将性质相同的个,即将性质相同的个体组合起来。体组合起来。2.作用:作用:根本作用在于将社会经济现象总体按根本作用在于将社会经济现象总体按照统计分析的要求区分为性质不同的各个组照统计分析的要求区分为性质不同的各个组成部分。具体为:(成部分。具体为:(见下页见下页)2011-9-23 第四章 统计整理 7 可将复杂的社会经济现象按照统计认识的要可将复杂的社会经济现象按照统计认识的要求区分为各个性质不同的组成部分;求区分为各个性质不同的组成部分;不仅可以在一般意义上认识总体的量,而且不仅可以在一般意义上认识总体的量,而且能在特殊意义上观察总体中所有
5、个体单位在能在特殊意义上观察总体中所有个体单位在各组中的分布状态和分布特征,认识总体各各组中的分布状态和分布特征,认识总体各组成部分的量;组成部分的量;将总体的分组资料与时间相联系进行统计分将总体的分组资料与时间相联系进行统计分析,可以反映总体及各组在数量上的变动情析,可以反映总体及各组在数量上的变动情况和变动规律,分析各组变动的内在原因,况和变动规律,分析各组变动的内在原因,而且可以认识由于各组变动速度不同而形成而且可以认识由于各组变动速度不同而形成总体中性质不同的各组地位的改变情况,从总体中性质不同的各组地位的改变情况,从而获得对总体由量变到质变的认识;而获得对总体由量变到质变的认识;将各
6、种性质上有关的分组资料联系起来进行将各种性质上有关的分组资料联系起来进行统计分析,还可观察不同社会经济观察总体统计分析,还可观察不同社会经济观察总体之间数量上的依存关系。之间数量上的依存关系。2011-9-23 第四章 统计整理 8 3.统计分组的方法统计分组的方法 注:统计分组的关键在于选择分组标志和划分各组界限,注:统计分组的关键在于选择分组标志和划分各组界限,其中选择分组标志是统计分组的核心问题。其中选择分组标志是统计分组的核心问题。选择分组标志:选择分组标志:确定将总体区分为各个性质不同的组的标确定将总体区分为各个性质不同的组的标 准或依据。准或依据。划分各组界限:划分各组界限:在分组
7、标志变异范围内,划定各相邻组间在分组标志变异范围内,划定各相邻组间 的性质界限和数量界限。的性质界限和数量界限。统计总体可按品质标志分组,也可按数量标志分组。统计总体可按品质标志分组,也可按数量标志分组。品质标志分组品质标志分组是选择反映事物属性差异的品质标志为志。是选择反映事物属性差异的品质标志为志。例:人的性别分为男、女两组。例:人的性别分为男、女两组。数量标志分组数量标志分组是选择反映事物数量差异的数量标志为分组是选择反映事物数量差异的数量标志为分组 标志,并在数量标志变异范围内规定各组界限,将总体划标志,并在数量标志变异范围内规定各组界限,将总体划 分为性质不同的若干组成部分。分为性质
8、不同的若干组成部分。例:规定小、中、大型企业设备单项价值在例:规定小、中、大型企业设备单项价值在1000、1500、2000元以上者为固定资产,以下者为低值易耗品。元以上者为固定资产,以下者为低值易耗品。2011-9-23 第四章 统计整理 9 4.统计分组体系统计分组体系 统计分组体系是根据统计分析的要求,通过对同一总体统计分组体系是根据统计分析的要求,通过对同一总体 进行多种不同分组而形成的,一种相互联系、相互补充,进行多种不同分组而形成的,一种相互联系、相互补充,能从总体在各种特殊性质意义上的量来加深社会经济现象能从总体在各种特殊性质意义上的量来加深社会经济现象 总体数量表现的认识体系。
9、总体数量表现的认识体系。形式有两种:形式有两种:简单分组和平行分组体系简单分组和平行分组体系 注:区分依据:选择分组标志多少不同。注:区分依据:选择分组标志多少不同。总体按一个标志分组称为简单分组。总体按一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分对同一总体选择两个或两个以上的标志分别进行简单分 组,就形成平行分组体系。组,就形成平行分组体系。例:为了解人口状况,分别选择性别、民族、文化程例:为了解人口状况,分别选择性别、民族、文化程 度等标志进行分组。性别:男、女;民族:汉、回、满、度等标志进行分组。性别:男、女;民族:汉、回、满、苗等;文化程度:小学、初中、高
10、中、大专、本科。苗等;文化程度:小学、初中、高中、大专、本科。2011-9-23 第四章 统计整理 10 注:每一分组只能固定一个因素对差异的影响,不能固定其他因注:每一分组只能固定一个因素对差异的影响,不能固定其他因素对差异的影响。素对差异的影响。例:人群按性别分为男、女,这样,在男子组只固定了例:人群按性别分为男、女,这样,在男子组只固定了“男性男性”因因素,即消除了素,即消除了“女性女性”的因素影响,但在该男子组中除无性别差异,的因素影响,但在该男子组中除无性别差异,其他如年龄、体重、身高等因素所产生的差异仍存在。其他如年龄、体重、身高等因素所产生的差异仍存在。复合分组和复合分组体系 对
11、同一总体选择两个或两个以上标志层叠起来进行分 组,叫做复合分组.复合分组形成复合分组体系。例:对大学的思想状况进行调查,进行复合分组 理科学生组 文科学生组 本科学生组 本科学生组 男生学生组 男生学生组 女生学生组 女生学生组 专科学生组 专科学生组 男生学生组 男生学生组 女生学生组 女生学生组 2011-9-23 第四章 统计整理 11 注:第一次分组只固定一个因素对差异的影响,第二注:第一次分组只固定一个因素对差异的影响,第二次分组则同时固定两个因素对差异的影响,当最后一次次分组则同时固定两个因素对差异的影响,当最后一次分组时,则所有被选标志对差异的影响均已固定。分组时,则所有被选标志
12、对差异的影响均已固定。5.对统计分组的再分组对统计分组的再分组 再分组有两种方法:再分组有两种方法:按原来的分组标志重划新组,并将原分组资按原来的分组标志重划新组,并将原分组资料根据新组组限按比例重新加以整理。料根据新组组限按比例重新加以整理。先划定新组,并确定新组单位数在总体中应先划定新组,并确定新组单位数在总体中应占比重,然后据以将原分组资料按比例重新加占比重,然后据以将原分组资料按比例重新加以整理。以整理。例:例:第一种方式第一种方式 设某班的某门课程测试成绩如下:设某班的某门课程测试成绩如下:2011-9-23 第四章 统计整理 12 学生成绩分组表 按成绩 分组 学生人数 学生人数
13、比重(%)100分 90-100分 80-90分 70-80分 60-70分 50-60分 40-50分 2 5 15 19 5 3 2 4 10 30 38 10 6 4 合 计 50 100%根据A表资料我们只能看到各组分数间的人数,很难看出实 质性问题。我们设“90-100”为优,8090为“良”,7080为“中”,6070为“及格”,60以下为“不及格”来进行考察,则 通过再分组得到B表。成绩分组 人数 比重(%)90-100 80-90 70-80 60-70 60以下 7 15 19 5 5 14 30 38 10 10 合 计 50 100 A表 B表 2011-9-23 第四章
14、 统计整理 13 第二种方式分组第二种方式分组 假设我们规定优占假设我们规定优占10%、良占、良占30%、中占、中占30%、及格占及格占20%、不及格占、不及格占10%,则重新整理的资,则重新整理的资料为:料为:学生类别 人数比重%学生人数 优 良 中 及格 不及格 10 30 30 20 10 5 15 15 10 5 合计 100 50 返回目录 2011-9-23 第四章 统计整理 14 三、次数分布三、次数分布 1.概念:概念:在统计分组的基础上,将总体中的所有单位按组在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,归类整理,形成总体中各个单位数
15、在各组间的分布,就叫次数分布就叫次数分布.注:注:分布在各组中的个体单位数叫分布在各组中的个体单位数叫次数次数,又称,又称频数频数。各组次数与总次数之比叫各组次数与总次数之比叫比率比率,又称,又称频率频率,将各组组,将各组组别与次数依次编表而成的数列称次数分布数列,简称别与次数依次编表而成的数列称次数分布数列,简称分布数列,又称分配数列或次数分配。分布数列,又称分配数列或次数分配。2.分类:分类:根据分组标志特征不同,分布数列可分为属性分根据分组标志特征不同,分布数列可分为属性分布数列与变量分布数列。布数列与变量分布数列。按品质标志分组形成的分布数列称为属性分布数列。按品质标志分组形成的分布数
16、列称为属性分布数列。2011-9-23 第四章 统计整理 15 例:在座的学生按性别分组,可编制形成如下属性分布例:在座的学生按性别分组,可编制形成如下属性分布数列:数列:在座学生的性别分布(在座学生的性别分布(2005年年1月月21日日X时)时)按数量标志分组形成的分布数列称为变量分布数列。按数量标志分组形成的分布数列称为变量分布数列。例:对在座学生的年龄进行调查,形成变量分布数列:例:对在座学生的年龄进行调查,形成变量分布数列:学生年龄分布学生年龄分布 性别 人数 比率 男性 女性 10 5 66.7 33.3 合计 15 100 年龄 人数 频数 20 21 22 23 24 25 2
17、1 1 2 3 1 20 10 10 20 30 10 2011-9-23 第四章 统计整理 16 3.影响次数分布的要素影响次数分布的要素 组距和组数组距和组数 变量分布数列的概念:当变量值较少时,可以按每个变量分布数列的概念:当变量值较少时,可以按每个变量值分别列组,依次分组编制而成变量分布数列。变量值分别列组,依次分组编制而成变量分布数列。例:某学院七名获科技奖的科研人员,其在去年发表论例:某学院七名获科技奖的科研人员,其在去年发表论文篇数分别为:文篇数分别为:4 7 3 6 5 4 3 组距的概念:当一组中包含多个变量值时,本组变量组距的概念:当一组中包含多个变量值时,本组变量的最大值
18、称为上限,最小值为下限,上限与下限之差称的最大值称为上限,最小值为下限,上限与下限之差称为组距,即为组距,即 组距组距=上限上限-下限。下限。组距数列:依组距分组而编制的变量数列。组距数列:依组距分组而编制的变量数列。注:组距大小与组数成反比。注:组距大小与组数成反比。2011-9-23 第四章 统计整理 17 例:在上列学生成绩的分布数列,仅分为二组:这样,由于组距较大,而由原来多组分成目前的两组。等距数列:组距数列中各组组距相等。异距数列:组距数列中各组组距不相等。注:等距数列不受组距影响,次数分布和次数密度分布相一致。学生成绩 人数 频率(%)及格 45 90 不及格 5 10 合计 5
19、0 100 2011-9-23 第四章 统计整理 18 次数密度:单位组距内分布的次数,也称为频数密度:次数密度:单位组距内分布的次数,也称为频数密度:次数密度次数密度=次数次数/组距组距 例:某课程学生成绩例:某课程学生成绩 0510155060708090100考分 组距 次数 次数密度 5060 60-70 70-80 80-90 90-100 10 10 10 10 10 3 6 13 10 2 0.3 0.6 1.3 1 0.2 00.511.55060708090100图1.1 考分、次数坐标图 图1.2 考分、次数密度坐标图 2011-9-23 第四章 统计整理 19 注:异距数
20、列各组次数受组距不同的影响。注:等距数列一般在社会经济现象性质差异的变动比较均衡的条件下使用,且我们编制数列时应尽量采用等距分组方法。注:组距的计算:i=R/K 其中R为全距,即总体内变量最大值与最小值之差,K为组数,i为组距。例:某一总体中总体单位最大值为80,最小值为40,确定分为5组,则组距为:i=R/K=(80-40)/5=8 注:实际工作中,i常取5、10的整数值,但计算时应严格按照上述的公式。2011-9-23 第四章 统计整理 20 组限与组中值 组中值:各组变量范围的中间数值,通常可根据上限、下限进行简单计算。组中值=(上限+下限)/2 注:对于“开口组”即“XX以下”或“XX
21、以上”,可先确定开口组的组限:首组假定下限=首组上限-邻组组距 末组假定上限=末组下限+邻组组距 注:当假定上、下限超越实际可能的极限时,应当将假定的上、下限定在极限值上。例:西瓜分为2斤以下、26斤、610斤、10斤以上四挡,则组距 6-2=10-6=4(斤)假定首组下限=2-4=-2(斤)不符实际情况,应定为0斤 假定末组上限=10+4=14(斤)注:上组限不在内原则。2011-9-23 第四章 统计整理 21 4.次数分布的特征 次数分布的表示方法 a.表示法:用统计表来表示次数分布,并可列入 次数分布。b.图示法:用统计图形来表示次数分布的方法,形式用(1)直方图;(2)折线图;(3)
22、曲线图。次数分布的主要类型 a.钟型分布 b.U 形分布 c.J 形分布 图例见下页 2011-9-23 第四章 统计整理 22 钟形型分布钟形型分布 例:正态分布例:正态分布 U形分布形分布 例:人口死亡率分布例:人口死亡率分布 J形分布形分布 例:经济增长趋势例:经济增长趋势 反反J形分布形分布 例:劳率例:劳率成本分布成本分布 返回目录 2011-9-23 第四章 统计整理 23 四、统计整理的组织和技术四、统计整理的组织和技术 1汇总的概念:汇总的概念:对原始资料的整理是一种汇总性整理,对原始资料的整理是一种汇总性整理,这个整理过程称为汇总。这个整理过程称为汇总。2统计汇总方案包括两个
23、方面的设计:统计汇总方案包括两个方面的设计:对于总体的处理方法;对于总体的处理方法;确定用哪些统计指标来说明总体。确定用哪些统计指标来说明总体。注:注:对总体的处理方法有三种:对总体的处理方法有三种:a.总体单位的简单排列;总体单位的简单排列;b.将所有总体单位的资料加以合计;将所有总体单位的资料加以合计;c.对总体进行各种各样的分组。对总体进行各种各样的分组。其中其中b又有两种处理方式:所有调查项目全部汇总;又有两种处理方式:所有调查项目全部汇总;根据分析研究的需要有选择地加以汇总。根据分析研究的需要有选择地加以汇总。2011-9-23 第四章 统计整理 24 3统计汇总的组织形式有两种:统
24、计汇总的组织形式有两种:逐级汇总逐级汇总(即按照一定的统计管理体制,自下(即按照一定的统计管理体制,自下而上地对调查资料逐级进行汇总);而上地对调查资料逐级进行汇总);集中汇总集中汇总(即将全部调查资料集中到组织统计(即将全部调查资料集中到组织统计调查的最高一级机关一次性汇总)。调查的最高一级机关一次性汇总)。此外也可两种结合使用。此外也可两种结合使用。4统计资料的审核有汇总前审核和汇总后审核统计资料的审核有汇总前审核和汇总后审核两个环节。两个环节。汇总前审核包括:汇总前审核包括:资料的完整性;资料的完整性;资料的及时性;资料的及时性;资料的准资料的准确性。确性。汇总后审核包括:汇总后审核包括
25、:复计审核;复计审核;表表审核;表表审核;表实审核;表实审核;对对照审核。照审核。返回目录 2011-9-23 第四章 统计整理 25 五、统计表五、统计表 1.统计表的概念:统计表是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。它的主要优点有:a.能有条理、有系统地排列统计资料,使人阅读时一目了然;b.能合理地、科学地组织统计资料,使人阅读时便于对照比较。2.统计表的设计。统计表要遵循科学、实用、简练、美观的原则。3.统计表的构成:由总标题、横行标题、纵栏标题、指标数值四个部分组成。2011-9-23 第四章 统计整理 26 例:X班X课程的学生成绩分布 总标题 成绩 学生人数(人)
26、比率(%)纵栏标题 不及格 及格 中 良 优 2 5 18 15 10 4 10 36 30 20 合计 50 100 横 栏 标 题 指 标 数 值 4.统计表的内容 统计表的内容分为主词和宾词。主词是统计表所要说明的总体;宾词是说明总体的统计指标,包括指标名称和指标数值。主词说明:总体各个单位的名称、总体的各个组或总体单位的全部。2011-9-23 第四章 统计整理 27 例:上表中例:上表中“不及格不及格”、“及格及格”、“中中”、“良良”、“优优”等等 构成主词,其他均为宾词。构成主词,其他均为宾词。注:注:通常表的主词列在横行标题位置,宾词中的指通常表的主词列在横行标题位置,宾词中的
27、指标名称列在纵栏标题的位置。但应注意有时为了方便,标名称列在纵栏标题的位置。但应注意有时为了方便,有互换位置的情况。有互换位置的情况。例:如上例变换位置:例:如上例变换位置:X班班X课程学生成绩分布课程学生成绩分布 此时,主词为“不及格”“优”,其余为宾词。但此时 主词处于纵栏标题位置,宾词处于横行标题位置。注:“合计”为宾词。成绩 不及格 及格 中 良 优 合计 人数(人)2 5 18 15 10 50 比重(%)4 10 36 30 20 100 2011-9-23 第四章 统计整理 28 5.统计表的分类统计表的分类 按作用分:按作用分:a.调查表;调查表;b.汇总表或整理表;汇总表或整
28、理表;c.分析表。分析表。按统计数列的性质分:按统计数列的性质分:a:空间数列表:空间数列表:反映同一时间条件下不同空间范围内某反映同一时间条件下不同空间范围内某项或某几项统计数列表格。项或某几项统计数列表格。例:我国三个直辖市人口数(例:我国三个直辖市人口数(1982年年7月月1日日0时)单位:人时)单位:人 b.时间数列表:在同一空间条件下不同时间阶段上的某项或某几项统计数列的表格,又称动态表。(见下表:我国历年发电总量)直辖市 人口数 北京 天津 上海 9230687 7764141 11859748 2011-9-23 第四章 统计整理 29 例:我国历年发电总量例:我国历年发电总量
29、单位:亿度单位:亿度 c.时空数列结合表:同时反映上述两方面内容的统计表。按分组的情况分类 a.简单表:总体未作任何分组,仅罗列单位名称或按时间顺序排列的表格 b.简单分组表:总体按一个标志进行分组形成的表格。例:X班X课程学生成绩表(见右上表)年份 发电量 1971 1975 1978 1980 1982 1384 1958 2566 3006 3277 例:例:X班班X课程学生成绩表课程学生成绩表 考分 人数(人)0-60 60-100 2 28 合计 30 2011-9-23 第四章 统计整理 30 c.复合分组表:复合分组表:总体按两个以上的标志进行层叠分组总体按两个以上的标志进行层叠分组形成的表格。形成的表格。例:例:将上例变换为:将上例变换为:X班班X课程学生成绩分布课程学生成绩分布 按成绩、性别分组 人数(人)060分 男生 女生 60100分 男生 女生 2 2 0 28 18 10 合计 30 返回目录