《统计数据的搜集、整理与显(2).ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集、整理与显(2).ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 统计数据的搜集、整理与统计数据的搜集、整理与显示显示第一节第一节 统计数据的搜集统计数据的搜集第二节第二节 统计数据的整理统计数据的整理第三节第三节 统计数据的显示统计数据的显示第四节第四节 Excel在统计整理与统计在统计整理与统计 图表中的应用图表中的应用第一节第一节 统计数据的搜集统计数据的搜集一一 统计数据的搜集方法统计数据的搜集方法二二 统计调查方式统计调查方式三三 统计调查体系统计调查体系 四四 统计调查方案的设计统计调查方案的设计 五五 二手资料的主要来源渠道二手资料的主要来源渠道一一、统计数据的搜集方法统计数据的搜集方法1.统计数据搜集的概念统计数据搜集的概念根据
2、统计研究预定的目的和任务,运用科学的方法与手根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程段,有计划、有组织地向客观实际采集数据的过程从统计工作过程的阶段性看,统计数据的搜集处于统计从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。工作过程的基础阶段。2.统计数据搜集的方式统计数据搜集的方式一种是直接向调查对象搜集反映调查单位的统计数据一种是直接向调查对象搜集反映调查单位的统计数据(或称原始资料);(或称原始资料);另一种是搜集已经加工、整理过的、说明总体现象的数另一种是搜集已经加工、整理过的、说明总体现象的数据(一般称为二手资料
3、)。据(一般称为二手资料)。3.统计数据的分类统计数据的分类按其性质不同分为调查数据和试验数据按其性质不同分为调查数据和试验数据 4.统计数据的搜集方法统计数据的搜集方法对于调查数据的搜集,通常称为统计调查。搜集的是调对于调查数据的搜集,通常称为统计调查。搜集的是调查对象的原始资料,常用的方法有直接观察法、报告法查对象的原始资料,常用的方法有直接观察法、报告法(通讯法)、采访法、实验调查设计等。(通讯法)、采访法、实验调查设计等。二、统计调查方式二、统计调查方式常用的统计调查方式常用的统计调查方式普查普查 抽样调查抽样调查 重点调查重点调查 统计报表制度统计报表制度 1.普查普查普查:是专门组
4、织的一种全面调查,它主要是用以搜集普查:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。力的调查一般采用普查。普查的特点:普查的特点:是一种非经常性的全面调查;是一种非经常性的全面调查;比任何一种调查形式更能掌握大量、详细、全面的统计资料。比任何一种调查形式更能掌握大量、详细、全面的统计资料。2抽样调查抽样调查抽样调查:是一种非全面调查,抽样调查可以分为概率抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。概率抽样是按随机原则从调查对象抽样和非概率抽样。概率抽样是按随
5、机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。据去推算调查对象的总体特征。概率抽样的特点:概率抽样的特点:样本单位按随机原则抽取,排除了主观因素对选样的影响。样本单位按随机原则抽取,排除了主观因素对选样的影响。根据部分调查的实际资料对调查对象总体的数量特征作出估计。根据部分调查的实际资料对调查对象总体的数量特征作出估计。抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。抽样调查的适用场合:抽样调查的适用场合:不可能或不必要进行全面调查的社会现象,采用抽样调查;不可能或不必要进行全面调查的
6、社会现象,采用抽样调查;对普查资料进行必要的修正。对普查资料进行必要的修正。3重点调查重点调查重点调查:在调查对象中,只选择一部分重点单位进行重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。的非全面调查。重点单位:它们在所研究现象的标志总量中却占有绝大重点单位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。对这些单位进的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。的基本情况。特点:特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确可
7、以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。的推算,也无法测算调查误差。适用场合适用场合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。映研究的项目,宜采用重点调查。4统计报表制度统计报表制度统计报表制度:依照国家有关法规,自上而下地统一布统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地的指标项目,统一的报送时间和报送程
8、序,自下而上地逐级地定期提供统计资料的一种调查方式。逐级地定期提供统计资料的一种调查方式。统计报表的主要特点:统计报表的主要特点:报表资料的来源是建立在各个基层单位的原始记录的基础上;报表资料的来源是建立在各个基层单位的原始记录的基础上;由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;围内的报表资料;是一种经常性的(连续性)调查,调查项目相对稳定,有利于积是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。累资料,并进行动态对比分析。三、统计调查体系三、统计调查体系 统计调查体系:一
9、个国家开展统计调查方法和制度统计调查体系:一个国家开展统计调查方法和制度的总称。的总称。我国的统计调查体系:建立以必要的周期性的普查我国的统计调查体系:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计点调查、科学推算和部分全面报表综合运用的统计调查方法体系。调查方法体系。四、统计调查方案的设计四、统计调查方案的设计 1.明确调查目的。明确调查目的。2.确定调查对象和调查单位。确定调查对象和调查单位。调查对象,是指需要调查的现象总体。调查对象,是指需要调查的现象总体。调查单位,是指所要调查
10、的具体单位。调查单位,是指所要调查的具体单位。报告单位亦称填报单位,它是负责向上报告调查内容、报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。上具有一定独立性的单位。3.设计调查项目。设计调查项目。4.设计调查表格和问卷设计调查表格和问卷5.确定调查时间。确定调查时间。调查时间是指调查资料所属的时间,在统计调查中,如调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映果所调查的是时期现象,就要明确规定调查资料所反映的起止日期。如果所
11、要调查的是时点现象,调查时间就的起止日期。如果所要调查的是时点现象,调查时间就是规定的统一标准时点。是规定的统一标准时点。调查期限是进行调查工作的时限,包括搜集资料和报送调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。资料的工作所需的时间。6.组织实施调查计划。组织实施调查计划。7.调查报告的撰写。调查报告的撰写。五、二手资料的主要来源渠道五、二手资料的主要来源渠道1统计年鉴统计年鉴2有关期刊有关期刊3有关网站有关网站第二节第二节 统计数据的整理统计数据的整理一一 数据整理概述数据整理概述 二二 统计分组基本理论统计分组基本理论 三三 统计分组的原则和方法统计分组的原则和
12、方法 四四 频数分布频数分布五五 累计频数与累计频率累计频数与累计频率 一、数据整理概述一、数据整理概述 1.数据整理的含义:数据整理的含义:对统计调查所搜集到的各种数据进行分类和汇总,又称对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。为汇总性整理。2.统计数据整理的内容:统计数据整理的内容:如何对所要研究的总体进行统计分组;如何对所要研究的总体进行统计分组;确定描述总体数量特征的统计指标体系。确定描述总体数量特征的统计指标体系。二、统计分组基本理论二、统计分组基本理论 1.统计分组的概念统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标根据统计研究的目的和客观现象
13、的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。质的组,称为统计分组。统计分组标志:品质标志或数量标志统计分组标志:品质标志或数量标志2.分组的性质分组的性质兼有分和合双重含义兼有分和合双重含义,对于现象总体,是对于现象总体,是“分分”,对于单,对于单位,是位,是“合合”。3.统计分组的种类统计分组的种类按分组标志的多少,分为简单分组和复合分组按分组标志的多少,分为简单分组和复合分组按分组的标志的性质不同,分为品质分组(或称属按分组的标志的性质不同,分为品质分组(或称属 性性分组)和数量分组(或称变量分组
14、)。分组)和数量分组(或称变量分组)。三、统计分组的原则和方法三、统计分组的原则和方法 1统计分组的原则:统计分组的原则:穷尽原则穷尽原则:使总体中的每一个单位都应有组可归,或者说使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。各分组的空间足以容纳总体所有的单位。互斥原则互斥原则:就是在特定的分组标志下,总体中的任何一个就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几单位的只能归属于某一组,而不能同时或可能归属于几个组。个组。2统计分组的方法统计分组的方法品质分组:按品质标志分组品质分组:按品质标志分组数量分组:按数量标志分组
15、数量分组:按数量标志分组单项式分组与组距式分组;单项式分组与组距式分组;间断组距式分组和连续组距式分组;间断组距式分组和连续组距式分组;“上限在不内上限在不内”原则:凡是原则:凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。作为下限值的那一组内。等距分组与异距分组。等距分组与异距分组。3组距式分组的相关概念组距式分组的相关概念(1)组距)组距连续组距分组的组距连续组距分组的组距=本组上限本组上限本组下限本组下限 间断式组距且等距分组的条件下:间断式组距且等距分组的条件下:组距组距=本组上限本组上限前组上限
16、前组上限 或或=本组下限本组下限前组下限前组下限 或或=本组上限本组上限本组下限本组下限+1(2)组数)组数(3)组中值)组中值=(上限上限+下限下限)/2(4)开口组的组距与组中值)开口组的组距与组中值四、频数分布四、频数分布1频数分布的基本理论频数分布的基本理论(1)频数分布的定义)频数分布的定义(2)分布数列的两个要素)分布数列的两个要素总体按某标志所分的组,若总体按数量标志分组,分组标志在各总体按某标志所分的组,若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用组有不同的数量表现,形成标志值数列,亦称变量,一般用 x 表表示;示;各组所出现的单位数,
17、即频数,亦称次数,用各组所出现的单位数,即频数,亦称次数,用 f 表示。表示。2变量数列的编制方法变量数列的编制方法3相关的概念:相关的概念:(1)频率)频率 (2)频率的性质)频率的性质(3)频数密度与频率密度:频数密度与频率密度:频数密度频数密度=频数频数/组距组距 频率密度频率密度=频率频率/组距组距fi:第:第 i 组频数组频数五、累计频数与累计频率五、累计频数与累计频率1向上累计频数(或频率)分布向上累计频数(或频率)分布2向下累计频数(或频率)分布向下累计频数(或频率)分布第三节第三节 统计数据的显示统计数据的显示一一 统计表统计表二二 统计图统计图 三三 频(次)数分布图的类型频
18、(次)数分布图的类型一、统计表一、统计表1统计表的定义和结构统计表的定义和结构(1)统计表的定义)统计表的定义(2)统计表的结构)统计表的结构从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。四个部分。从内容上看,统计表由主词栏和宾词栏两个部分组成。从内容上看,统计表由主词栏和宾词栏两个部分组成。(例例)(返回返回)2统计表的分类统计表的分类(1)按主词的结构分类,根据主词是否分组和分组的程度,)按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。分为简单表、分组表和复合表。(2)按宾词设计分类,可
19、分为宾词简单排列、分组平行排)按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等三种。列和分组层叠排列等三种。3 3统计表的设计统计表的设计(1)开口式)开口式(2)标题)标题(3)合计拦)合计拦(4)数据)数据(5)计量单位)计量单位(6)注释或资料来源。)注释或资料来源。二、统计图二、统计图 1直方图直方图2折线图折线图3曲线图曲线图向下累计图:90分以上有20%向上累计图:70分以下有22.5%4累计曲线图累计曲线图洛伦茨曲线图洛伦茨曲线图基尼系数,用以衡量收入分配的平等与否。基尼系数,用以衡量收入分配的平等与否。AB基尼系数基尼系数=A/(A+B)三、频(次)数分布图的类
20、型三、频(次)数分布图的类型1钟型分布钟型分布 ()()()钟型分布示意图钟型分布示意图 2U型分布型分布 10 20 30 40 50 60 70 805040302010 0死亡率()年龄图图2-7 U型分布示意图型分布示意图3J型分布型分布正J型图反J型图J型分布示意图型分布示意图第四节第四节 Excel在统计整理与统计图表在统计整理与统计图表 中的应用中的应用一一 编制分布数列编制分布数列 二二 绘制统计图绘制统计图 一、编制分布数列一、编制分布数列 在在Excel中有两类方法可以实现分布数列的编制:第中有两类方法可以实现分布数列的编制:第一,使用相关的函数,如一,使用相关的函数,如C
21、ountif函数、函数、Dcount数据数据库函数或库函数或Frequency函数;第二,应用函数;第二,应用直方图直方图分析分析工具。工具。直方图直方图分析工具还可以进行向上累计,并分析工具还可以进行向上累计,并能直接绘出直方图。能直接绘出直方图。需要注意的是,需要注意的是,直方图直方图分析工具与分析工具与Frequency函数函数在编制分布数列时,并不符合统计分组的在编制分布数列时,并不符合统计分组的“上限不上限不在内在内”原则,在实际应用时必须进行调整。原则,在实际应用时必须进行调整。例例2-5用用Excel实现本章例实现本章例2-1和例和例2-2的计算过程。的计算过程。解:使用解:使用
22、Frequency函数编制,步骤如下:函数编制,步骤如下:(1)输入数据。如)输入数据。如图图2-9所示,所示,A、B、C列为原始输列为原始输入数据(除最后一组上限用函数求得外),其他列入数据(除最后一组上限用函数求得外),其他列为计算所得数据。年财政总收入放在为计算所得数据。年财政总收入放在A2:A51单元格单元格区域,图中未完全显示出来。区域,图中未完全显示出来。B列的各个数据(各组的上限值)是使用列的各个数据(各组的上限值)是使用Frequency函数或函数或直方图直方图分析工具编制分布数列所必需的数分析工具编制分布数列所必需的数据。据。Excel文件文件(2)选定)选定D2:D9,输入
23、公式,输入公式“=FREQUENCY(A2:A51,B2:B9)”,然后按按,然后按按CRTL+SHIFT+ENTER组合键,即可计算出各组的组合键,即可计算出各组的频数。该函数的第一个参数指定用于编制分布数列频数。该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限。在的原始数据,第二个参数指定每一组的上限。在D10中输入公式中输入公式“=SUM(D2:D9)”计算出频数的合计。计算出频数的合计。“1500以上以上”这一组的上限可以使用原始数据(财政这一组的上限可以使用原始数据(财政收入)的最大值,它可通过函数求得,在收入)的最大值,它可通过函数求得,在B9中输入中输
24、入公式公式“=MAX(A2:A51)”即可。即可。(3)计算频率。在)计算频率。在E2中输入公式中输入公式“=D2/D$10*100”,然后将该公式复制到,然后将该公式复制到E3:E9即可。即可。D10存放的是频存放的是频数的合计数,乘以数的合计数,乘以100是因为其单位是是因为其单位是“%”。(4)计算向上累计频数。在)计算向上累计频数。在F2单元格中输入单元格中输入“=D2”,在,在E3单元格中输入公式单元格中输入公式“=D3+F2”,再将公式复,再将公式复制到制到F4:F9。(5)计算向下累计频数。在)计算向下累计频数。在G9中输入公式中输入公式“=D9”,在在G8单元格输入公式单元格输
25、入公式“=G9+D8”,再将公式复制到,再将公式复制到G2:G7单元格区域即可。可以采用向上填充的方法单元格区域即可。可以采用向上填充的方法复制公式,即选定复制公式,即选定G2:G8单元格区域,然后点击菜单元格区域,然后点击菜单单编辑编辑填充填充向上填充向上填充。二、绘制统计图二、绘制统计图 Excel有着强大的绘图功能,可以绘制出各种各样的有着强大的绘图功能,可以绘制出各种各样的统计图形,如直方图、折线图、曲线图、饼图、散统计图形,如直方图、折线图、曲线图、饼图、散点图、雷达图等等。需要注意的是,点图、雷达图等等。需要注意的是,Excel中的图表中的图表类型与统计中的图表类型并不完全一样,如
26、类型与统计中的图表类型并不完全一样,如Excel中中的的“散点图散点图”既包括了统计上的散点图,又包括了既包括了统计上的散点图,又包括了统计上的曲线图。统计上的曲线图。生成图表有两种方法,一种是在某些分析工具中有生成图表有两种方法,一种是在某些分析工具中有输出某些图表的选项,如输出某些图表的选项,如直方图直方图分析工具可以输分析工具可以输出直方图;另一种是使用图表向导,这也是最常用出直方图;另一种是使用图表向导,这也是最常用的方法。的方法。使用例使用例2-5编制的分布数列,分别绘制年财政总收入编制的分布数列,分别绘制年财政总收入的直方图、折线图、曲线图。的直方图、折线图、曲线图。解:解:(一)
27、绘制直方图。主要操作步骤如下:(一)绘制直方图。主要操作步骤如下:(1)直方图所需数据在)直方图所需数据在C1:E9区域(区域(参见图参见图2-9),选定该区域。选定该区域。(2)进入图表向导,在图表向导第)进入图表向导,在图表向导第1步直接点击步直接点击“完完成成”按钮即可生成如按钮即可生成如图图2-10所示的图表所示的图表。(3)对生成的图形进行修改,使其更符合统计上的表)对生成的图形进行修改,使其更符合统计上的表示形式示形式,最终结果见,最终结果见图图2-12。例例2-6 Excel文件文件(二)绘制折线图与曲线图。(二)绘制折线图与曲线图。折线图和曲线图可以在上述直方图的基础上完成,折
28、线图和曲线图可以在上述直方图的基础上完成,这里向读者介绍直接绘制折线图和曲线图的方法。这里向读者介绍直接绘制折线图和曲线图的方法。主要的操作步骤如下:主要的操作步骤如下:(1)重新安排数据。为了获得更好的效果,使用描点)重新安排数据。为了获得更好的效果,使用描点法绘图,因此需要组中值数据,用于绘图的数据存法绘图,因此需要组中值数据,用于绘图的数据存放在放在图图2-13中的中的B、C、D列。为了使折线图或曲线列。为了使折线图或曲线图与图与X轴相交,我们使用了两个虚拟的组中值,分轴相交,我们使用了两个虚拟的组中值,分别安排中原有分组的两侧,对应的频数及频率均为别安排中原有分组的两侧,对应的频数及频
29、率均为0。(2)选定)选定B2:D11单元格区域,进入图表向导。单元格区域,进入图表向导。(3)选择图表类型。对于折线图,先在)选择图表类型。对于折线图,先在“图表类型图表类型”中选择中选择“散点图散点图”,然后在,然后在“子图表类型子图表类型”中选中选“无数据点折线散点图无数据点折线散点图”,而对于曲线图,则选,而对于曲线图,则选“无无数据点平滑线散点图数据点平滑线散点图”。(4)在选择好图表类型后,直接单击)在选择好图表类型后,直接单击“完成完成”按钮即按钮即得到相应的图形(仅以曲线图为例),见得到相应的图形(仅以曲线图为例),见图图2-14,其中上面那条线是频率曲线图。其中上面那条线是频率曲线图。(5)按照前面介绍的方法生成次坐标轴,并进行适当)按照前面介绍的方法生成次坐标轴,并进行适当的修改。最终结果见的修改。最终结果见图图2-15。