《第二章-统计资料的搜集整理与显示.ppt》由会员分享,可在线阅读,更多相关《第二章-统计资料的搜集整理与显示.ppt(99页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1-1第二章第二章 统计数据的搜集、整理与显示统计数据的搜集、整理与显示n第一节第一节 统计数据的搜集统计数据的搜集n第二节第二节 数据整理数据整理n第三节第三节 频数分布频数分布n第四节第四节 数据显示数据显示第一页,编辑于星期五:十八点 十九分。1-2第一节第一节 统计数据的搜集统计数据的搜集一、统计数据搜集概述一、统计数据搜集概述(一)统计数据搜集的概念(一)统计数据搜集的概念n1.定义:定义:统计数据搜集是根据统计研究预定的目的和统计数据搜集是根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地任务,运用科学的调查方法与手段,有计划、有组织地向客观实际采集数据的过程
2、。向客观实际采集数据的过程。 n2.2.资料类型资料类型n原始资料(初级资料):是指向调查单位搜集的尚待汇总整理,原始资料(初级资料):是指向调查单位搜集的尚待汇总整理,需要由个体过渡到总体的统计资料。需要由个体过渡到总体的统计资料。n次级资料:是指已经整理加工过,由个体过渡到总体,能够次级资料:是指已经整理加工过,由个体过渡到总体,能够在一定程度上说明总体现象的统计资料。在一定程度上说明总体现象的统计资料。n3.3.分为分为调查数据调查数据和实验数据和实验数据第二页,编辑于星期五:十八点 十九分。1-3( (二二) )统计统计数据的搜集方法数据的搜集方法 直接观察法直接观察法 报告法报告法
3、采访法采访法 登记法登记法 实验设计实验设计第三页,编辑于星期五:十八点 十九分。1-4二、统计调查的种类二、统计调查的种类n(一)按调查对象范围的不同,可分为全面调查与非全面(一)按调查对象范围的不同,可分为全面调查与非全面调查。调查。n(二)按调查登记的时间是否连续,可分为经常性调(二)按调查登记的时间是否连续,可分为经常性调查与一次性调查。查与一次性调查。n经常性调查是连续性的调查,它随着事物在时间上的发展变经常性调查是连续性的调查,它随着事物在时间上的发展变化而连续不断地进行登记。化而连续不断地进行登记。n一般调查时期现象,如:一般调查时期现象,如:产值、产量、原料消耗等产值、产量、原
4、料消耗等。n一次性调查是不连续登记的调查,它是对事物每隔一段时间后在一一次性调查是不连续登记的调查,它是对事物每隔一段时间后在一定时点上的状态进行登记。定时点上的状态进行登记。例如:人口数,固定资产总值例如:人口数,固定资产总值。n(三)按组织方式的不同,可分为定期报表制度和专门调(三)按组织方式的不同,可分为定期报表制度和专门调查。查。n定期报表:统计报表。定期报表:统计报表。n专门调查:普查;抽样调查;重点调查;典型调查等。专门调查:普查;抽样调查;重点调查;典型调查等。第四页,编辑于星期五:十八点 十九分。1-5三、统计调查的具体组织形式三、统计调查的具体组织形式(一)普查(一)普查n1
5、.普查的特点普查的特点n(1)专门组织的一次性调查。)专门组织的一次性调查。n(2)全面调查。)全面调查。n2.组织方式组织方式n(1)专门组织的普查机构派出调查人员,直接登记。)专门组织的普查机构派出调查人员,直接登记。n(2)利用调查单位的原始记录和资料,发一定的调查表格,由调查单)利用调查单位的原始记录和资料,发一定的调查表格,由调查单位填报。位填报。n3.具体组织时的基本原则:具体组织时的基本原则:n(1)规定一定的标准时点,一般是某一天或某一天的某一时刻。)规定一定的标准时点,一般是某一天或某一天的某一时刻。n(2)各调查点同时工作,以缩短调查期限,保证及时性。)各调查点同时工作,以
6、缩短调查期限,保证及时性。n(3)统一规定项目,不得任意改动。)统一规定项目,不得任意改动。n(4)尽可能按一定的周期进行,可比性。)尽可能按一定的周期进行,可比性。第五页,编辑于星期五:十八点 十九分。1-6n1953年年 第一次第一次 总人口为总人口为5.82亿,亿, 性别比性别比 为为107.6n1964年年 第二次第二次 总人口为总人口为6.95亿亿 性别比性别比 为为105.5n1982年年 第三次第三次 总人口为总人口为10.08亿亿 性别比为性别比为106.3n1990年年 第四次第四次 总人口为总人口为11.34亿亿 性别比性别比 为为106.6n2000年年 第五次第五次 总
7、人口为总人口为12.66亿亿 性别比为性别比为106.7n2010年年 第六次第六次 总人口为总人口为13.71亿亿 性别比为性别比为105.2第六页,编辑于星期五:十八点 十九分。1-7n常见的普查:常见的普查:n每隔年份的末尾数字为每隔年份的末尾数字为“0”的年份进行人口普查。的年份进行人口普查。n每隔年份的末尾数字为每隔年份的末尾数字为“3”的年份进行第三产业普查。的年份进行第三产业普查。n每隔年份的末尾数字为每隔年份的末尾数字为“5”的年份进行工业普查。的年份进行工业普查。n每隔年份的末尾数字为每隔年份的末尾数字为“7”的年份进行农业普查。的年份进行农业普查。n每隔年份的末尾数字为每隔
8、年份的末尾数字为“1”或或“6”的年份进行统计基的年份进行统计基本单位普查。本单位普查。n每隔年份的末尾数字为每隔年份的末尾数字为“3”和和“8”的年份进行经济普的年份进行经济普查。查。第七页,编辑于星期五:十八点 十九分。1-8n(二)抽样调查(二)抽样调查n1.抽样调查是一种非全面调查。它是按抽样调查是一种非全面调查。它是按随机随机原则原则从总体中抽取一部分单位作为样本进行从总体中抽取一部分单位作为样本进行观察,然后根据样本指标值去推算调查对象观察,然后根据样本指标值去推算调查对象的总体指标的一种调查。的总体指标的一种调查。n随机原则随机原则:(:(1)样本的抽取排除了人的主观随意性)样本
9、的抽取排除了人的主观随意性或目的性,每个单位的中选不中选不是主观所决定的。或目的性,每个单位的中选不中选不是主观所决定的。(2)调查对象总体中的每个单位都按照一定的、事)调查对象总体中的每个单位都按照一定的、事先已知的的概率被抽选。通常先已知的的概率被抽选。通常等概率抽样等概率抽样:每个单:每个单位有相同的中选可能性。位有相同的中选可能性。第八页,编辑于星期五:十八点 十九分。1-9 2.抽样调查的特点抽样调查的特点(1)根据部分实际资料对全部总体的数量特征)根据部分实际资料对全部总体的数量特征作出估计。作出估计。(2)按随机原则从全部总体中抽选样本单位。)按随机原则从全部总体中抽选样本单位。
10、(3) 是运用概率的估计方法是运用概率的估计方法 。n例如:通过抽样推断得出,厦大学生的平均月支出在例如:通过抽样推断得出,厦大学生的平均月支出在(820,880)元上的可靠性为)元上的可靠性为90%。(4)抽样推断的误差可以事先计算,并加以控)抽样推断的误差可以事先计算,并加以控制。制。第九页,编辑于星期五:十八点 十九分。1-10 3.抽样调查的适用范围抽样调查的适用范围(1)不可能或不必要进行全面调查的社会现象。)不可能或不必要进行全面调查的社会现象。n无限总体的调查。无限总体的调查。n破坏性的产品质量检验。破坏性的产品质量检验。n总体单位数过大。总体单位数过大。n没必要全面调查,如城乡
11、居民家计调查、民意测验等。没必要全面调查,如城乡居民家计调查、民意测验等。n特殊情况,如战备物资调查、矿产调查等特殊情况,如战备物资调查、矿产调查等(2)对普查资料进行必要的修正。)对普查资料进行必要的修正。n第六次人口普查,普查登记结束后,全国统一随机抽取第六次人口普查,普查登记结束后,全国统一随机抽取402个普查小区进行了事后质量抽样调查。抽查结果个普查小区进行了事后质量抽样调查。抽查结果显示,人口漏登率为显示,人口漏登率为0.12%。第十页,编辑于星期五:十八点 十九分。n4.抽样调查的原则:抽样调查的原则:n随机原则随机原则n最大抽样效果原则:最大抽样效果原则: (1)在既定的调查费用
12、下,抽样误差最小;)在既定的调查费用下,抽样误差最小; (2)在给定精度要求下,使调查费用最省。)在给定精度要求下,使调查费用最省。 并非抽样误差最小的方案就是最优的方案。并非抽样误差最小的方案就是最优的方案。通常,要求在给定的误差条件下,选择费用最通常,要求在给定的误差条件下,选择费用最省的抽样设计方案。省的抽样设计方案。1-11第十一页,编辑于星期五:十八点 十九分。1-12(三)统计报表:(三)统计报表: 依照国家有关法规,自上而下地统一布置,以一定的原始记录依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报为依据,按照统一的
13、表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级定期提供统计资料的一种调查方式。送程序,自下而上地逐级定期提供统计资料的一种调查方式。1.特点:有三点,见书特点:有三点,见书P18。2.局限性:局限性:(1)花费的人力物力较大)花费的人力物力较大;(2)层层上报过程中,容易受到人的主观因素的影响,)层层上报过程中,容易受到人的主观因素的影响,若统计法制不健全,又没有其他核算手段相配合,难保准若统计法制不健全,又没有其他核算手段相配合,难保准确性确性;(3)社会经济现象日新月异的状况,无法体现。)社会经济现象日新月异的状况,无法体现。 第十二页,编辑于星期五:十八点 十九分。1-1
14、3(四)重点调查:在调查对象中,只选择一部分重点(四)重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。单位进行的非全面调查。重点单位:这些单位在全部单位中只是一部分,重点单位:这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中占有绝大的比重。但它们在所研究现象的标志总量中占有绝大的比重。(五)典型调查:(五)典型调查: 根据调查目的和任务,对所研根据调查目的和任务,对所研究的现象总体进行初步分析的基础上,有意识的选究的现象总体进行初步分析的基础上,有意识的选取若干具有代表性的单位进行调查和研究,借以认取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。识
15、事物发展变化的规律。特点:(特点:(1)专门组织的非全面调查。()专门组织的非全面调查。(2)主观性。)主观性。第十三页,编辑于星期五:十八点 十九分。1-14四、统计调查体系四、统计调查体系n我国建立以必要的我国建立以必要的周期性的普查为基础周期性的普查为基础,经常性的抽经常性的抽样调查为主体样调查为主体,同时辅之以重点调查、科学推算和部分,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。全面报表综合运用的统计调查方法体系。n五、统计调查误差五、统计调查误差n 抽样误差抽样误差n 又称代表性误差。概率抽样中,抽样误差是可以估又称代表性误差。概率抽样中,抽样误差是可以估算
16、并控制的。算并控制的。n 非抽样误差非抽样误差n 登记性误差。产生原因多种多样,难以准确计量。登记性误差。产生原因多种多样,难以准确计量。第十四页,编辑于星期五:十八点 十九分。1-15n1.1.确定调查的任务与目的确定调查的任务与目的n解决为什么(解决为什么(why)why)调查?调查?n例如:例如:1.1.调查了解农村经济发展情况。调查了解农村经济发展情况。n2.第二次全国经济普查目的:第二次全国经济普查目的:全面调查了解我国第二产业和第三产业的发展规模及布局;全面调查了解我国第二产业和第三产业的发展规模及布局;了解我国产业组织、产业结构、产业技术的现状以及各了解我国产业组织、产业结构、产
17、业技术的现状以及各生产要素的构成;生产要素的构成;摸清我国各类企业和单位能源消耗的基本情况;摸清我国各类企业和单位能源消耗的基本情况;建立健全覆盖国民经济各行业的基本单位名录库、基础信息数据建立健全覆盖国民经济各行业的基本单位名录库、基础信息数据库和统计电子地理信息系统。库和统计电子地理信息系统。六、统计调查方案的设计六、统计调查方案的设计第十五页,编辑于星期五:十八点 十九分。1-16n2.2.确定调查对象、调查单位和填报单位确定调查对象、调查单位和填报单位n解决向谁解决向谁(who)(who)调查?由谁来具体提供资料?调查?由谁来具体提供资料?n第二次全国经济普查的对象:在我国境内从事第二
18、产第二次全国经济普查的对象:在我国境内从事第二产业和第三产业的全部法人单位、产业活动单位和个体业和第三产业的全部法人单位、产业活动单位和个体经营户。经营户。例例1 1:调查福建省乡镇企业经营状况。:调查福建省乡镇企业经营状况。调查对象:全省所有的乡镇企业调查对象:全省所有的乡镇企业调查单位:每个乡镇企业调查单位:每个乡镇企业填报单位:每个乡镇企业填报单位:每个乡镇企业第十六页,编辑于星期五:十八点 十九分。1-17例例2:调查目的是为了掌握全国炼钢设备情况。:调查目的是为了掌握全国炼钢设备情况。调查对象:全国所有炼钢设备调查对象:全国所有炼钢设备调查单位:每台炼钢设备调查单位:每台炼钢设备填报
19、单位:具有炼钢设备的每个冶金企业填报单位:具有炼钢设备的每个冶金企业n3.确定调查项目确定调查项目n解决向调查单位调查什么解决向调查单位调查什么(what)?n调查项目是指总体要用哪些指标来反映,以及调查项目是指总体要用哪些指标来反映,以及这些指标要怎样落实到这些指标要怎样落实到总体单位的标志总体单位的标志上。上。n4.调查表格和问卷的设计调查表格和问卷的设计 第十七页,编辑于星期五:十八点 十九分。1-18n5.确定调查时间(确定调查时间(when)n调查时间有两种涵义,即调查资料所属时间和调查工作期调查时间有两种涵义,即调查资料所属时间和调查工作期限。限。n调查时间是指调查资料所属的时间,
20、客观时间。调查时间是指调查资料所属的时间,客观时间。 时点现象,要明确规定资料所属的统一时点,一般称为标准时时点现象,要明确规定资料所属的统一时点,一般称为标准时点。点。 时期现象在调查方案中,要明确规定现象的起止时间。时期现象在调查方案中,要明确规定现象的起止时间。n调查期限是进行调查工作的时限,包括搜集资料和报送资料的调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。工作所需的时间。n1.2007年经济活动成果年报呈报时间规定在年经济活动成果年报呈报时间规定在2008年年1月底。月底。n2.牲畜调查,按牲畜调查,按1月月1日状况登记,持续日状况登记,持续5天。天。n6.
21、确定调查的组织实施计划确定调查的组织实施计划 选择何种调查组织形式?如何进行?选择何种调查组织形式?如何进行?第十八页,编辑于星期五:十八点 十九分。1-191.根据所在班级设计一份反映同学基本情况的调查根据所在班级设计一份反映同学基本情况的调查表。表。2.根据社会热点问题设计一份统计调查方案。根据社会热点问题设计一份统计调查方案。第十九页,编辑于星期五:十八点 十九分。1-20第二节第二节 数据整理数据整理一、数据整理的概念一、数据整理的概念n数据整理,是指根据统计研究的目的,将调数据整理,是指根据统计研究的目的,将调查所得的原始资料进行加工(分组和汇总),查所得的原始资料进行加工(分组和汇
22、总),分统计分析准备系统化的、条理化的综合资分统计分析准备系统化的、条理化的综合资料的工作过程。两种整理:料的工作过程。两种整理:n汇总性整理:汇总性整理:对统计调查所搜集到的各种数对统计调查所搜集到的各种数据进行分类和汇总。据进行分类和汇总。n综合性整理:对现成资料的整理综合性整理:对现成资料的整理。第二十页,编辑于星期五:十八点 十九分。1-21二、内容和程序二、内容和程序n1.资料的审核资料的审核n2.分组和汇总分组和汇总(计算各种统计指标计算各种统计指标)n3.编制统计图表编制统计图表n4.资料的积累、保管和公布资料的积累、保管和公布第二十一页,编辑于星期五:十八点 十九分。1-22
23、三、统计分组三、统计分组(一)统计分组的概念和种类(一)统计分组的概念和种类n1、定义:统计分组根据统计研究的目的、定义:统计分组根据统计研究的目的和客观现象的内在特点,按照某个标志或和客观现象的内在特点,按照某个标志或几个标志把研究的总体划分为若干性质不几个标志把研究的总体划分为若干性质不同的部分同的部分(或组或组)的一种统计方法。的一种统计方法。n2.兼有兼有“分分”和和“合合”的双重含义:的双重含义:n对于现象总体,是对于现象总体,是 “分分”;对于单位,是;对于单位,是“合合”。n对于分组标志,是对于分组标志,是“分分”,对于其他标志,是,对于其他标志,是“合合”。第二十二页,编辑于星
24、期五:十八点 十九分。1-23n3.分组原则分组原则n穷尽(不漏):每一个单位必须能归属于某一穷尽(不漏):每一个单位必须能归属于某一组。组。n例如,对学生按民族分为:回族和汉族两组,则可例如,对学生按民族分为:回族和汉族两组,则可能会漏了一些其他民族的学生。正确应该分为:回能会漏了一些其他民族的学生。正确应该分为:回族、汉族、族、汉族、其他其他三组。三组。n互斥(不重):每一个单位只能归入一个互斥(不重):每一个单位只能归入一个组,不能同时归属于几个组。组,不能同时归属于几个组。n例如,某商场把服装分为男装、女装和童装三类,例如,某商场把服装分为男装、女装和童装三类,就不符合互斥原则。若先把
25、服装分为成年与儿童两就不符合互斥原则。若先把服装分为成年与儿童两类,然后再分为男女两组,就符合互斥原则。类,然后再分为男女两组,就符合互斥原则。第二十三页,编辑于星期五:十八点 十九分。1-24 4.统计分组的作用统计分组的作用n(1)可以将零星分散的统计资料,经过统计分)可以将零星分散的统计资料,经过统计分组整理后,发现其特点与规律。组整理后,发现其特点与规律。n例如,以下是某班例如,以下是某班50位同学统计学考试的成绩资料:位同学统计学考试的成绩资料:6082467377916584697456687673886675809077796152567275856768747578868936
26、787783656882787072859267755566第二十四页,编辑于星期五:十八点 十九分。1-25某班同学统计学考试成绩表某班同学统计学考试成绩表成绩(分)成绩(分)人数(人)人数(人)比重(比重(%)60以下以下6126070122470801938809010209010036合合 计计50100及格率为及格率为88%,优秀率为,优秀率为6%。第二十五页,编辑于星期五:十八点 十九分。1-26(2)可以将复杂的社会现象,划分为性)可以将复杂的社会现象,划分为性质不同的各种类型。质不同的各种类型。n通过分组,就可以对不同类型的现象的特征进通过分组,就可以对不同类型的现象的特征进行
27、比较和研究,从而揭示它的发展变化规律。行比较和研究,从而揭示它的发展变化规律。n例如,人口按经济收入、受教育程度划分为不同的阶例如,人口按经济收入、受教育程度划分为不同的阶层层n按所有制性质划分,我国现有按所有制性质划分,我国现有8种经济类型:种经济类型:n国有经济;集体经济;私营经济;个体经济;联营经国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港济;股份制经济;外商投资经济;港n澳台投资经济澳台投资经济第二十六页,编辑于星期五:十八点 十九分。1-27(3)可以分析总体的内部结构可以分析总体的内部结构例:江苏省按例:江苏省按GDP计算的三次产业结构计算的三次产
28、业结构 单位:单位:% 1978年年1990年年 2000年年2008年年 GDP100 100 100 100 第一产业第一产业27.6 25.112.2 6.9 第二产业第二产业52.6 48.951.9 55.0 第三产业第三产业19.8 26.035.9 38.1第二十七页,编辑于星期五:十八点 十九分。1-28受教育程度受教育程度比重(比重(%)文盲和半文盲文盲和半文盲小学小学初中初中高中(含中专)高中(含中专)大专大专大学大学大学以上大学以上91021321891合计合计100某地人口受教育程度分布某地人口受教育程度分布第二十八页,编辑于星期五:十八点 十九分。1-29(4)可以揭
29、示现象之间的依存关系。)可以揭示现象之间的依存关系。日吸烟量(支)日吸烟量(支)平均寿命(年)平均寿命(年)015615152525以上以上78.276.472.466.764.2例如,研究吸烟与健康的关系。例如,研究吸烟与健康的关系。下表是美国保险公司的统计资料。下表是美国保险公司的统计资料。xybxay第二十九页,编辑于星期五:十八点 十九分。1-30n5.统计分组的种类统计分组的种类(1)按分组标志的性质不同,分为品质分组和数量分组。)按分组标志的性质不同,分为品质分组和数量分组。(2)按分组的作用不同,分为类型分组、结构分组和分析分)按分组的作用不同,分为类型分组、结构分组和分析分组。
30、组。(3)按分组标志的多少,分为简单分组、平行分组和复合分组。)按分组标志的多少,分为简单分组、平行分组和复合分组。n简单分组就是对总体按一个标志进行分组,它只能从某一方面说明和反映简单分组就是对总体按一个标志进行分组,它只能从某一方面说明和反映事物的分布状况和内部结构。事物的分布状况和内部结构。n将同一总体选择两个或两个以上的标志进行简单分组,排列起来,即成为将同一总体选择两个或两个以上的标志进行简单分组,排列起来,即成为平行分组体系。平行分组体系。n对同一个总体选择两个或两个以上的标志层叠进行分组,就形成复合分组对同一个总体选择两个或两个以上的标志层叠进行分组,就形成复合分组体系。体系。第
31、三十页,编辑于星期五:十八点 十九分。按分组标志性质分按分组标志性质分品质标志分组品质标志分组数量标志分组数量标志分组按分组标志个数分按分组标志个数分简单分组简单分组复合分组复合分组 (平行)分组体系(平行)分组体系(二)统计分组的种类(二)统计分组的种类第三十一页,编辑于星期五:十八点 十九分。n简单分组简单分组:被研究的对象:被研究的对象只按一个标志只按一个标志进行分组进行分组 n平行分组体系平行分组体系:同一总体进行:同一总体进行多个简单分组多个简单分组,然,然后将这些分组平行排列在一起,形成平行分组体系。后将这些分组平行排列在一起,形成平行分组体系。例如:将大学生分别按性别、民族、年龄
32、例如:将大学生分别按性别、民族、年龄3 3个标志进个标志进行分组行分组n按性别分组按性别分组 按民族分组按民族分组 按年龄分组按年龄分组 男男 生生 汉汉 族族 18 18以下以下 女女 生生 满满 族族 18-20 18-20 回回 族族 20-22 20-22 22-24 22-24 24 24以上以上第三十二页,编辑于星期五:十八点 十九分。n汉族汉族 n满族满族n回族回族l复合分组复合分组:l对同一总体选择两个对同一总体选择两个或两个以上的标志层或两个以上的标志层叠起来进行分组叠起来进行分组 第三十三页,编辑于星期五:十八点 十九分。1-34(三)统计分组的方法(三)统计分组的方法统计
33、分组的关键问题是统计分组的关键问题是“正确地选择分组标志正确地选择分组标志”与与“划划分各组界限分各组界限”。1.分组标志的选择原则分组标志的选择原则(1)应根据研究的目的与任务选择分组标志。)应根据研究的目的与任务选择分组标志。例如,同一个工人总体,有多种不同分组方法。例如,同一个工人总体,有多种不同分组方法。如果研究学历对收入的影响时,应选择如果研究学历对收入的影响时,应选择“文化程度文化程度”作为作为分组标志。分组标志。如果研究资历对收入的影响时,则应选择如果研究资历对收入的影响时,则应选择“工龄工龄”作为分组作为分组标志。标志。(2)要选择能够反映事物本质或主要特征的标志。)要选择能够
34、反映事物本质或主要特征的标志。例如,研究职工生活水平的高低情况时,可以用例如,研究职工生活水平的高低情况时,可以用“职工职工的工资水平的工资水平”作为分组标志,也可以用作为分组标志,也可以用“职工家庭成员平均职工家庭成员平均收入水平收入水平”作为分组标志。应该选择后者作为分组标志作为分组标志。应该选择后者作为分组标志。第三十四页,编辑于星期五:十八点 十九分。1-352.统计分组的方法统计分组的方法(1)按品质标志分组)按品质标志分组n按品质标志分组就是用反映事物的属性、性质的按品质标志分组就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干性质不标志分组,它可以将总体单位划分为若
35、干性质不同的类型。同的类型。n例如,职工可以按性别、民族、文化程度、技术等级、籍贯例如,职工可以按性别、民族、文化程度、技术等级、籍贯等标志分组。等标志分组。 又如企业可以按所有制形式、隶属关系、地区,大中小型等又如企业可以按所有制形式、隶属关系、地区,大中小型等标志分组。标志分组。品质标志分组一般比较容易,但有些情况比较复杂,为此,国家统品质标志分组一般比较容易,但有些情况比较复杂,为此,国家统计局及有关部门,统一制定各种分类目录与规定标准。例如:计局及有关部门,统一制定各种分类目录与规定标准。例如:工业部门分类目录工业部门分类目录、工业产品目录工业产品目录大中小型工业大中小型工业划分标准划
36、分标准等。等。第三十五页,编辑于星期五:十八点 十九分。1-36(2)按数量标志分组:)按数量标志分组:n选用数量标志分组的关键是如何通过数量分组选用数量标志分组的关键是如何通过数量分组的差异,能够反映出各组的不同性质。的差异,能够反映出各组的不同性质。n两个要点:(两个要点:(1)各组数量界限的确定必须能反映)各组数量界限的确定必须能反映事物质的差别。(事物质的差别。(2)采取适当形式。)采取适当形式。第三十六页,编辑于星期五:十八点 十九分。1-37 3.各种分组形式各种分组形式 (1)单项式分组与组距式分组)单项式分组与组距式分组若离散型变量变动幅度小,则可依次将每一若离散型变量变动幅度
37、小,则可依次将每一个变量值作为一组,即单项式分组。个变量值作为一组,即单项式分组。当离散型变量数值很多,且变动幅度很大时当离散型变量数值很多,且变动幅度很大时,应用组距式分组,应用组距式分组,即将全部的变量值划分为即将全部的变量值划分为若干区间,各个变量值则按其大小确定所归若干区间,各个变量值则按其大小确定所归属的区间。属的区间。连续型变量由于不能一一列举它的变量值,不能连续型变量由于不能一一列举它的变量值,不能作单项式组,只能是组距分组。作单项式组,只能是组距分组。例:例:1.农村家庭按拥有小孩数分组(表农村家庭按拥有小孩数分组(表1):2.企业按工人人数分组(表企业按工人人数分组(表2 )
38、3.工人按工资分组(表工人按工资分组(表3)拥有小孩数拥有小孩数 0 1 2 3 3 个以上个以上 按工人人数(人)按工人人数(人) 200499 500999 10001999 2000 以上以上 按按工工资资(元元) 5001000 10001500 15002000 2000 以以上上 表表1表表2表表3第三十七页,编辑于星期五:十八点 十九分。1-38 (2)间断组距式分组和连续组距式)间断组距式分组和连续组距式分组分组n组限:组距式分组中,每一组的两端值组限:组距式分组中,每一组的两端值。起始值为下限,结束值为上限。起始值为下限,结束值为上限。n若相连的两组的组限不重叠的,称为间若相
39、连的两组的组限不重叠的,称为间断组距式分组。若相连的两组的组限重断组距式分组。若相连的两组的组限重叠的,称为连续组距式分组。叠的,称为连续组距式分组。n连续型变量只能采用连续组距式分组;连续型变量只能采用连续组距式分组;离散型变量既能采用间断组距式分组,离散型变量既能采用间断组距式分组,也能采用连续组距式分组。也能采用连续组距式分组。按工人人数(人)按工人人数(人) 200499 500999 10001999 2000 以上以上 按按工工资资(元元) 5001000 10001500 15002000 2000 以以上上 按工资(元)按工资(元) 500 1000 1500 2000 按工人
40、人数(人)按工人人数(人) 200500 5001000 10002000 2000 以上以上 “上限不在内上限不在内”原则。原则。第三十八页,编辑于星期五:十八点 十九分。1-39(3)等距分组与异距分组)等距分组与异距分组按按工工资资(元元) 5001000 10001500 15002000 2000 以以上上 n等距分组的优点:便于各组单位数等距分组的优点:便于各组单位数和标志值的直接比较;便于计算各和标志值的直接比较;便于计算各项综合指标;便于绘制统计图。项综合指标;便于绘制统计图。n异距分组的应用场合:异距分组的应用场合:n标志值分布很不均匀的场合。标志值分布很不均匀的场合。n标志
41、值相等的量具有不同意义的场标志值相等的量具有不同意义的场合。合。n标志值按一定比例发展变化的场标志值按一定比例发展变化的场合。合。第三十九页,编辑于星期五:十八点 十九分。1-40(4)几个概念:组限、组数、组距和组中值)几个概念:组限、组数、组距和组中值按按工工资资(元元) 5001000 10001500 15002000 2000 以以上上 n组限组限n第一组的下限略小于实际变量值的最小值,第一组的下限略小于实际变量值的最小值,最后一组的上限略大于实际变量值的最大值最后一组的上限略大于实际变量值的最大值。n组距:区间的长度。组距:区间的长度。n连续组距式分组:连续组距式分组:n组距=上限
42、 下限按人数(人)按人数(人) 15 610 1115 1620 n间断组距式分组:间断组距式分组:n 组距 =本组上限 前组上限n(或)=本组下限 前组下限n(或)=本组上限 本组下限 + 1 n“开口组开口组”(只有上限或只有下限(只有上限或只有下限的组)的组距:参照相邻组确定的组)的组距:参照相邻组确定。第四十页,编辑于星期五:十八点 十九分。1-41n组数:组距大,组数就少;组距小,组数就多组数:组距大,组数就少;组距小,组数就多n有一有一经验公式经验公式:n=1+3.322lgN (n:组数;N:总体单位数)n组中值:组中值:在计算平均指标或进行其他统计分析时,常以组中值来代表各组在
43、计算平均指标或进行其他统计分析时,常以组中值来代表各组的平均水平。的平均水平。n组中值组中值=(上限+下限)/2n开口组组中值的计算参照相邻的组。开口组组中值的计算参照相邻的组。按按工工资资(元元) 组组中中值值 5001000 10001500 15002000 2000 以以上上 750125017502250按工资(元)按工资(元) 组中值组中值 500 以下以下 5001000 10001500 15002500 2500 以上以上 250750125020003000按销售额(万元)按销售额(万元) 组中值组中值 550 50500 5005000 第四十一页,编辑于星期五:十八点
44、十九分。1-42第三节第三节 频数分布频数分布n一、频数分布的基本概念一、频数分布的基本概念n1.频数分布:在统计分组的基础上,将总体的所有的单频数分布:在统计分组的基础上,将总体的所有的单位按组归类整理,并计算各组的单位数,形成一系列反位按组归类整理,并计算各组的单位数,形成一系列反映总体各组之间单位数分布状况的数字,称为频数分布,映总体各组之间单位数分布状况的数字,称为频数分布,也叫分布数列。也叫分布数列。n品质数列品质数列n变量数列变量数列n2.分布数列的两个要素分布数列的两个要素n标志值数列标志值数列n频数数列频数数列分分 数数 人数人数( ) 5060 6070 7080 8090
45、90100 2 7 11 12 8 合合 计计 40 f二、变量数列的编制方法二、变量数列的编制方法 第四十二页,编辑于星期五:十八点 十九分。1-43n 三、频数和频率三、频数和频率n(1)频数:又称次数。)频数:又称次数。 分布在各组的单位个数。分布在各组的单位个数。n(2)频率:各组的频数与频数之和的比值。)频率:各组的频数与频数之和的比值。)(频率ff(%55 .175 .273020 四、频数密度和频率密度四、频数密度和频率密度(异距分组时使用)(异距分组时使用)(1)频数密度)频数密度=频数频数/组距,即单位组距的频数。组距,即单位组距的频数。(2)频率密度)频率密度=频率频率/组
46、距,即单位组距的频率。组距,即单位组距的频率。100f第四十三页,编辑于星期五:十八点 十九分。1-44直方图、折线图、曲线图直方图、折线图、曲线图02468101214506 0708 0901 0002468101214506 0708 0901 00024681012145060708090100(组中值,频数)(组中值,频数)组距为底边,频组距为底边,频数为高度数为高度 第四十四页,编辑于星期五:十八点 十九分。1-45五、累计频数(率)五、累计频数(率)n1.向上累计向上累计:从变量值小的一方向变量值大的一方累加从变量值小的一方向变量值大的一方累加频数(率)。频数(率)。n各组向上累
47、计频数表明该组上限以下的单位数之和。各组向上累计频数表明该组上限以下的单位数之和。n各组向上累计频率表明该组上限以下的单位总数占总体单位数的各组向上累计频率表明该组上限以下的单位总数占总体单位数的比重。比重。向上累计向上累计 按成绩按成绩 分组分组 频数频数(人)(人) 频率频率(%) 频数(人)频数(人) 频率(频率(%) 5060 6070 7080 8090 90100 2 7 11 12 8 5 17.5 27.5 30 20 合合 计计 40 100 2920324055 .225080100第四十五页,编辑于星期五:十八点 十九分。1-46n2. 向下累计:从变量值大的一方向变量值
48、小的一方累加向下累计:从变量值大的一方向变量值小的一方累加频数(率)。频数(率)。n各组向下累计频数表明该组下限以上的单位数之和。各组向下累计频数表明该组下限以上的单位数之和。n各组向下累计频率表明该组下限以上的单位总数占总体单位数的各组向下累计频率表明该组下限以上的单位总数占总体单位数的比重。比重。向下累计向下累计 按成绩按成绩 分组分组 频数频数(人)(人) 频率频率(%) 频数(人)频数(人) 频率(频率(%) 5060 6070 7080 8090 90100 2 7 11 12 8 5 17.5 27.5 30 20 合合 计计 40 100 82031384020505 .7795
49、100第四十六页,编辑于星期五:十八点 十九分。1-47 向上累计 频数(人)05101520253035404550-5060-6070-7080-8090-90100-100 向下累计 频数(人)05101520253035404550-5060-6070-7080-8090-90100-100向上累计向上累计 向下累计向下累计 按成绩按成绩分组分组 频数频数(人)(人) 频率频率(%) 频数(人)频数(人) 频率(频率(%) 频数(人)频数(人) 频率(频率(%) 5060 6070 7080 8090 90100 2 7 11 12 8 5 17.5 27.5 30 20 2 9 20
50、 32 40 5 22.5 50 80 100 40 38 31 20 8 100 95 77.5 50 20 合合 计计 40 100 第四十七页,编辑于星期五:十八点 十九分。1-48洛伦茨曲线洛伦茨曲线:一种累计频率分布曲线。用来研:一种累计频率分布曲线。用来研究财富、土地和工资收入的分配是否公平。究财富、土地和工资收入的分配是否公平。按收入所按收入所得水平分得水平分组组人人 口口收收 入入(%)累计收入的累计收入的(%)人口数人口数( (万人万人)结构结构(%)(%)累计的累计的(%)月收入额月收入额( (亿美元亿美元)结构结构(%)(%)实实 际际情情 况况绝绝 对对平平 等等绝绝