《统计学第二章-统计数据的搜集整理和显示-PPT课件.ppt》由会员分享,可在线阅读,更多相关《统计学第二章-统计数据的搜集整理和显示-PPT课件.ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 统计数据的搜集、整理和图表展示 教学目的和要求:教学目的和要求:教学目的和要求:教学目的和要求:1.1.掌握掌握统计调查统计调查各各组织组织方式的分方式的分类类特点和特点和应应用;用;2.2.掌握掌握统计调查统计调查方案方案设计设计的内容;的内容;3.3.熟悉各种熟悉各种统计统计数据的搜集方法;数据的搜集方法;4.4.掌握数据分掌握数据分组组方法和方法和频频数分布数列的数分布数列的编编制方法;制方法;5.5.掌握各种掌握各种统计统计表的表的结结构和表构和表现现形式;形式;6.6.熟悉各种熟悉各种统计图统计图的表的表现现形式;形式;7.7.熟悉各种熟悉各种统计统计表的制表表的制表规则规则
2、。1 1第一节 数据来源和调查第二节 统计数据第三节 数据整理第四节 数据的图表展示2 2第一节 数据来源和调查 一、一、调查调查的基本理的基本理论论(一)(一)统计调查统计调查的概念的概念1、统计统计数据搜集的概念数据搜集的概念统计统计数据搜集数据搜集就是根据统计任务的要求,运用科学的调查方法,有目的、有计划、有组织地及时搜集各项反映社会经济活动和科学试验成果的统计资料的过程。3 32 2、搜集数据的方法:、搜集数据的方法:实验实验与与调查调查(1 1).调查调查:人:人们为获们为获得社会得社会经济现经济现象的相关数象的相关数 据,运用相据,运用相应应的的调查调查方法,向客方法,向客观实际观
3、实际搜集搜集 数字数字资资料的料的过过程,所程,所获获数据数据为调查为调查数据。数据。(2 2).实验实验:在:在实验实验中控制一个或多个中控制一个或多个变变量,在一量,在一 定的控制条件下定的控制条件下观观察察实验对实验对象,从象,从实实 验验中中获获得的数据得的数据为实验为实验数据数据3、搜集的统计数据有两种:(1).原始资料(初始资料):是直接向调查对象搜集反映调查单位情况的统计资料,对原始资料的搜集即为统计调查(2).次级资料(二手资料):根据研究目的,搜集已经加工,整理过的说明总体现象的资料4 4(二)(二)(二)(二)统计调查统计调查统计调查统计调查的要求的要求的要求的要求 根据统
4、计制度方法的统一规定,统计调查必须达到准确、及时两个基本要求,做到数字准、情况明、反映及时。1、准确性。统计调查的准确性是指提供的统计资料必须符合客观实际情况,保证各项统计资料真实可靠。2、及时性。各项调查资料不但要求准确,而且需要及时,这是很明显的,因为过时的资料落在了形势发展的后面,失去时效,犹如“雨后送伞”起不到统计的真实作用。5 5 统计调查形式示意图普 查全面报表抽样调查重点调查典型调查周期性调查一次性调查普 查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调 查范 围调 查时 间组 织形 式统计调查形式6 6(三)统计调查的种类1、全面调查与
5、非全面调查统计调查按调查的范围划分,可分为全面调查和非全面调查两大类。(1)全面调查是对调查对象的所有单位一一进行调查。普查、全面统计报表都属于全面调查。7 71 1)普)普查查概念:普查是专门组织的一次性的全面调查,它主要是用以调查某些不能或不宜用定期的全面报表搜集的统计资料。世界各国一般都定期进行各种普查,以便掌握国情,国力的基本统计数据。普查有主要特点:是一次性或周期性的调查。间隔时间较长。普查要规定统一的标准时点和普查期限。以避免调查数据的重复或遗漏。规定普查的项目和指标,不能随意改变或增减普查的数据较准确,全面,但普查的范围较窄普查的组织形式:组织普查机构或利用调查单位的原始记录和核
6、算资料。8 82)2)全面全面统计报统计报表制度表制度概念:全面统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。全面统计报表的实施范围,是调查对象的全部单位均要填报。统计报表的主要特点:第一,资料的来源是各个基层单位的原始记录。第二,逐级上报和汇总的。第三,属于经常性(连续性)调查,调查项目相对稳定。9 9(2)非全面调查:对调查对象其中的一部分单位进行调查。1)抽样调查。抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,
7、对调查对象总体特征作出具有一定可靠程度的推算。A)特点:第一,按随机原则抽取样本。第二,根据部分调查的实际资料对调查对象总体的数量特征作出估计。第三,抽样误差可以事先计算并加以控制。B)适用范围:第一,不可能或不必要进行全面调查的社会现象。第二,对普查资料进行必要的修正。1010C)抽样调查的理论基础概率论和数理统计的有关定理。D)抽样调查对数据的要求:所研究的变量是随机变量。E)抽样调查应遵循的原则:第一,随机原则。第二,最大抽样效果原则。11112 2)重点)重点调查调查重点调查:是指在调查对象中,只选择一部分重点单位进行的非全面调查。选择的单位在全部总体中虽然数目不多,所占比重不多,但可
8、以说明整个总体在该标志总量方面的基本情况。优缺点:优点是调查单位少,可调查较多的项目和指标;缺点是不能由重点调查的结果推算总体。重点单位的选择:第一,选多少由调查任务确定;第二,选择时要注意重点可变动;第三,选中单位应是管理健全,统计基础工作较好的单位组织形式:是专门调查的组织形式搜集资料的方法:以企事业单位的原始资料为依据的报告法12123 3)典型)典型调查调查概念:典型调查是一种专门组织的非全面调查。根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。有人也认为它是“目的抽样”,以若干具有代表性的单位为样本。特
9、点:第一,调查单位少,能深入实际,深入群众;第二,有意识的选择,对其调查,能取得代表性较高的资料;第三,调查机动灵活。选择:第一,为近似估算总体,可将总体分为若干类型,从每一类型中选择典型单位;第二,总体一般数量表现,可选择中等的典型单位;第三,如为研究成功经验教训,可选择先进或后进的单位。1313(二)经常性调查与一次性调查统计调查按时间标志可分为连续性(经常性)和不连续性(一次性)调查两大类。1、连续性(经常性)调查:是指随着研究现象的变化,连续不断地进行调查登记。如统计报表制度。2、不连续性(一次性)调查:是指间隔一段较长的时间对事物的变化进行一次性调查,如普查、典型调查。1414(三)
10、定期报表形式与专门调查统计调查按组织形式可分为定期报表形式和专门调查。1、定期报表制度是按国家统一规定的表式和内容,定期地向各级领导机构报送统计资料的一种形式。2、专门调查是为某一专题研究而组织的专项调查,如抽样调查、典型调查、普查。1515二、二、二、二、调查调查调查调查方案的方案的方案的方案的设计设计设计设计(一)(一)调查调查方案的含方案的含义义 调查调查方案方案是指在统计调查工作正式开始之前,应当事先设计一个切实可行、周密细致的数据搜集方案,以指导整个调查工作,使调查得以顺利地实施和完成。调查方案又称数据搜集方案,它是指导整个调查过程的纲领性文件。1616(二)统计调查的方案设计(5W
11、1H)1、确定调查目的(why)。(为什么要进行调查,调查要 解决什么问题,是统计调查中的根本性问题)2、确定调查对象和调查单位(根据目的确定who)调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。调查单位:是指所要调查的具体单位,它是进行调查登记的标志的承担者。报告单位:报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。调查单位与报告单位,有时是一致的,有时不一致。3、确定调查项目和调查表(what)(1)确定调查项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志(或称质量标志、属性标志)和数量标志所构
12、成。1717 在在拟拟定定调查项调查项目目时时要注意以下四个要注意以下四个问题问题:调查项目要少而精本着需要和可能的原则,只列入能够得到确定答案的项目调查项目之间尽可能保持联系,以便相互核对起到校验作用有的项目可拟定为“选择式”(2)、调查表格和问卷的设计。1)调查表:列出调查项目的表格形式就是调查表。有一览表和单一表两种形式。(包括表头、表体和表外附加)一览表:把许多单位和相应的项目按次序登记在一张表格里的一种统计表,在调查项目不多时用。这种表格优点是每个调查单位的共同事项只需登记一次,缺点是不能多登记调查单位的标志。单一表:一张表格内只登记一个调查单位,项目多时,一张表格可由几张表组成。优
13、点是可容纳较多的标志,缺点是每份表上都要注明时间 地点和其他共同事项。1818 2 2).问问卷卷调查调查:根据:根据调查调查目的,在目的,在调查对调查对象中随象中随 机机选择选择或有意或有意识识地确定地确定调查单调查单位,以位,以书书面文面文 字或表格形式了解被字或表格形式了解被调查调查者的意者的意见见,调查调查者者 自愿、自由回答自愿、自由回答问问卷中所提出的卷中所提出的问题问题。这这是是 一种特殊形式的一种特殊形式的调查调查表,主要用于非政府表,主要用于非政府统统 计计机构或个人的市机构或个人的市场调查场调查或社会或社会调查调查。问问卷有卷有 面面访访与自填两种,其基本与自填两种,其基本
14、结结构、构、问题类问题类型、型、设设 计计要求大致相同。要求大致相同。基本基本结结构:构:说说明明词词、问题问题、作、作业记录业记录 主主题问题问句句类类型:开放式型:开放式问题问题和封和封闭闭式式问题问题 基本要求:主基本要求:主题题明确、提明确、提问问科学、科学、逻辑逻辑性性强强、容量适当容量适当19194 4、确定、确定调查时间调查时间(when)when)。统计调查时间统计调查时间包括二种包括二种 涵涵义义,即,即调查时间调查时间和和调查调查期限。期限。调查时间调查时间:是指:是指调查资调查资料所属的料所属的时时点或点或时时期。期。调查调查期限:是期限:是进进行行调查调查工作的工作的时
15、时限,包括搜集限,包括搜集 资资料和料和报报送送资资料的工作所需的料的工作所需的时间时间。5 5、确定、确定调查调查地域范地域范围围(where)(where)6 6、调查调查的的计计划划实实施施(how)(how)包括包括调查调查人人员员的的选择选择、组织组织和培和培训训:调查调查表格表格 问问卷和卷和调查员调查员手册的印刷;手册的印刷;调查调查工具的准工具的准备备等。等。2020三、三、三、三、调查调查调查调查体系及体系及体系及体系及应应应应用用用用(一)(一)统计调查统计调查方法体系的含方法体系的含义义统计调查统计调查方法体系方法体系是指以必要的周期性的普查为基础,经常性的抽样调查为主体
16、,同时辅之以重点调查、科学推算和少量的全面报表综合运用的调查方法体系。(二)(二)统计调查统计调查方法体系的方法体系的应应用用2121普查和全面报表都是全面调查,但两者不能互相替代。抽样调查虽然是一种非全面调查,但它能够解决全面调查无法或难以解决的问题,抽样调查调查单位少,调查项目就可以多一些,以便对某一社会经济现象进行更深入的研究,也可以节省调查费用,又可以满足统计时效性的要求。所以,我国统计调查体系是以经常性的抽样调查为主体。如果调查任务只要求掌握基本情况,而现象总体中又有部分单位能比较集中地反映研究项目的数量特征,则可采用重点调查。在统计调查体系中,适度地采用了科学的推算方法。2222四
17、、现有统计资料的主要来源1.统计年鉴2.有关期刊3.有关网站2323第二节 统计数据一、数据一、数据类类型型(一)数据的(一)数据的计计量尺度量尺度 根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。(二)数据(二)数据类类型型1、横截面数据。是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。2、时间序列数据。是指在不同时间对同一总体的数量表现进行观察而获得的数据。2424(三三三三)数据的表数据的表数据的表数据的表现现现现形式形式形式形式1、绝对数 现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般
18、为实物单位或价值单位,有时也采用复合单位。2、相对数相对数由两个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。3、平均数平均数反映现象总体一般水平或分布的集中趋势2525二、数据二、数据二、数据二、数据误误误误差差差差(一)数据(一)数据误误差的差的产产生生调查数据误差根据其产生的原因可以分为登记性误差和代表性误差。登记性误差是统计过程中的种种工作失误引起的,代表性误差一般指抽样调查误差,是由调查方式本身引起的,不可避免,但可以计算和控制。(二)数据(二)数据误误差的防范差的防范为了取得准确的数据资料,必须采取各种措
19、施,具体有:制定科学的统计调查方案。加强对调查人员的培训。建立健全经济核算体系,加强统计基础工作建设。加强对统计资料质量的监督检查。2626三、数据的搜集方法(一)(一)访问调查访问调查(二)(二)电话调查电话调查(三)(三)邮邮寄寄调查调查(四)座(四)座谈谈会会(五)个(五)个别别深度深度访问访问(六)网上(六)网上调查调查2727第三节 数据整理一、数据的一、数据的预处预处理理(一)数据的(一)数据的审审核核对调查资料进行审核是统计整理的第一步,包括以下内容:1、审核资料的完整性和及时性2、审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:逻辑检查
20、和计算检查3、历史资料的审核2828(二)(二)(二)(二)资资资资料料料料审审审审核后的核后的核后的核后的订订订订正正正正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:1、对于可以肯定的一般错误,应及时代为更正,并通知原报单位。2、对于可疑之数或无法代为更正的错误,应要求原单位复查更正。3、如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。4、对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。2929二、数据二、数据二、数据二、数据统计统计统计统计整理的内容和
21、程序整理的内容和程序整理的内容和程序整理的内容和程序(一)(一)统计统计整理及其作用整理及其作用1、统计整理的含义统计统计整理整理就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。2、统计整理的作用(1)通过对第一手资料的加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。(2)统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。(3)统计整理还是积累历史资料的必要手段。3030(二)(二)(二)(二)统计统计统计统计整理的内容和程序整理的
22、内容和程序整理的内容和程序整理的内容和程序统计整理的全过程包括对统计资料的审核、分组、汇总和编制统计图表四个环节,需要按照一定的程序进行:第一步,设计和制定统计整理方案。第二步,对原始资料进行审核。第三步,对经过审核的资料进行分组、并结合汇 总,计算相应的统计指标。第四步,将汇总计算的结果,以统计表或统计图的 形式表现出来。第五步,对统计资料妥善保存,系统积累。3131 三、统计分组和频数分布(一)统计分组1、统计分组1)根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。分组标志可为品质标志也可为数量标志。2)分组的性质来说:
23、兼有分和合双重含义。2、统计分组的原则(不重不漏原则)穷尽原则,使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则,在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。32323、统计分组的类型1)按分组标志的多少,可分为简单分组和复合分组。简单分组:就是对研究现象按一个标志进行分组。复合分组:用两个或两个以上标志分组,即先按一个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组,这称为复合分组。2)按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。品质分组:按品质(
24、或属性)标志进行分组。品质分组所形成的数列称为品质数列。数量分组:按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。变量分组所形成的数列称为变量数列。33333)按分组的作用和任务不同,分为类型分组、结构分组和分析分组。类型分组:把复杂的现象总体,划分为若干个不同性质的部分,就是类型分组。结构分组:在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构,即结构分组。分析分组:为研究现象之间依存关系而进行的统计分组即分析分组。34344、统计分组的方法(1)、品质分组的方法。按品质标志分组,有些分组比较简单,分组标志一经确定,组的名称和组数也随之确定。
25、(2)、数量分组的方法。按数量标志分组,应注意如下两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。35351)单项式分组与组距式分组A)单项式分组:用一个变量值作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。B)组距式分组:将变量依次划分为几段区间,一段区间表现为“从到”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。36362)间断组距式分组和连续组距式分组下限,上限
26、:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。组距:上下限之间的距离。组限:相邻两组的界限。间断组距式分组:组限不相连的组距式分组。连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组。离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。“上限不在内上限不在内”原原则则:在:在连续组连续组距式分距式分组组中,以同中,以同一个数一个数值值作作为为相相邻邻两两组组共同的界限,共同的界限,统计统计上上规规定,定,凡是凡是总总体某一个体某一个单单位的位的变变量量值值是相是相邻邻两两组组的界限的界限值值,这这一个一个单单
27、位位归归入作入作为为下限下限值值的那一的那一组组内。内。37373)等距分组与异距分组等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。异距分组:各组的组距不相等。38384)、相关指标的计算(1).组距连续式分组的组距计算公式:组距=本组上限本组下限间断式分组的组距计算公式:组距=本组上限本组下限+1开口组的组距:以相邻组的组距为本组的组距可根据全部数据的最大值和最小值及所分的组数来确定组数即组距=(最大值-最小值)/组数,另为便于计算,组距宜取5或10的倍数。(2).组中值:上下限之间的中点数值称为组中值,组中值的计算公式:闭口组3
28、939开口组:计算组中值时,开口组的组距是以相邻组的组距为本组组距即组中值=下限+相邻组组距/2 组中值=上限-相邻组组距/2计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。(3).组数组数=全距/组距斯特杰斯经验公式:组数=1+3.3 Lg N 由此推出组距=(最大变量值-最小变量值)/(1+3.3Lg N)4040斯特杰斯经验公式只是一经验公式,在实际应用时刻根据数据的多少和特点及分析要求,参考这一标准灵活确定组数,另按经验看法,组数过多或过少都不妥,一般情况下可分为57组,组数尽可能取奇数,避免偶数。4141(4)、组限的确定原则:(按这样的组限分后,标志值在各组
29、的变动能反映事物质的变化)应根据标志值分布的情况找出变量的最大值和最小值。根据分布比较集中的标志值确定组距的中心位置根据预定的组距大小定出上下限第一组下限必须略小于实际变量值的最小值,最后一组的上限必须略大于实际变量值的最大值连续变量的相邻组上下限通常以同一数值来表示,按“上限不在内”原则;离散变量相邻组组限可用同一数值表示也可用两个相邻的不同整数表示。4242(二)频数分布1、频数分布的基本概念(1)、频数分布频数:也叫次数,是落在各类别中的数据个数即各组内的数据个数频率:各组总体单位个数和总体单位总数之比即各组次数与全部次数之和的比值称为频率或比重在统计分组的基础上,将总体所有的单位按某一
30、标志进行归类排列,称为频数分布,或次数分布。即将各个类别及其相应的频数全部列出来。可反映总体各组之间单位分布的状况。根据分组标志特征的不同,分布数列可分为品质分布数列和变量分布数列。品质分布数列:有各组名称和次数组成,可用绝 对数(频数)表示也可用相对数(频率)表示 数列分布数列:单项式和组距式分布数列4343(2)、分布数列的两个要素1)总体按某标志所分的组。2)各组所出现的单位数,即频数,亦称次数。对于变量数列,标志值形成的数列,称为变量,一般用x表示;频数(次数)用f表示。44442、变量数列的编制1、编制方法。1)将原始资料按顺序排列,确定变量值变动范围 2)确定组距、组数、组限和组限
31、的表示方法 3)确定频数和频率(如为异距分组则确定频数密度和频率密度)2、频率的性质1)任何频率都是界于0和1之间的一个分数,即:2)各组频率之和等于1,即:3、频数密度:采用异距分组,各组次数的多少受到组距不同的影响,为消除异距分组所造成的影响须计算频数密度(或称次数密度)。频数密度的计算公式:频数密度=频数/组距 频率密度=频率/组距各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和等于1。45453、累计频数与累计频率1、向上累计频数(或频率)分布:先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计频数表明某组上限以下的各组单位数之和是多少,向
32、上累计频率表明某组上限以下的各组单位数之和占总体单位数比重的大小。2、向下累计频数(或频率)分布:先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计频数表明某组下限以上的各组单位数之和是多少,向下累计频率表明某组下限以上的各组单位数之和占总体单位数比重的大小。46464、累计频数分布特点1)第一组的累计频数等于第一组本身的频数;2)最后一组累计频数等于总体单位数。累计频率同样也具有两个特点:1)第一组的累计频率等于第一组本身的频率;2)最后一组的累计频率等于1。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。以分组变量为横轴,以累计频数(频率
33、)为纵轴。在直角坐标点系上将各组组距的上限与其相应的累计频数(频率)所构成坐标点,依次用直线(或光滑曲线)相连,即是向上累计曲线。在直角坐标系上将各组组距下限与其相应累计频数(频率)所构成坐标点,依次用直线(或光滑曲线)相连,即是向下累计分布曲线图。4747累累计频计频数分布曲数分布曲线线 显显然,累然,累计频计频数分布数分布曲曲线线只有两种形状:或持只有两种形状:或持续续增增长长的或持的或持续续减少的。减少的。这这分分别别取决于向上累取决于向上累计计或或向下累向下累计计。累。累计频计频数分布数分布曲曲线线一般都呈一般都呈逻辑逻辑斯斯谛谛曲曲线线形,其斜率最大的地方形,其斜率最大的地方对应对应
34、于于频频数最大的数最大的组组,其,其水平的地方水平的地方对应对应于空于空组组。484849495、频数分布的类型(1).钟形图:“两头小,中间大”1)对称分布 2)偏态分布 婚婚龄龄、学生身高、学生身高近似正近似正态态分布分布 收入分配、收入分配、资资源配置源配置偏偏态态分布分布 (2).u型分布:“两头小,中间大”(3).J型分布:“一边小,一边大”1)正J型 2)反J型这三种频数分布的图形是常见的曲线图形50505151 U形曲形曲线线:中:中间间小,两小,两头头大大 J形曲形曲线线:正:正J分布,反分布,反J分布分布5252思考思考题题:1.1.按百分制按百分制计计分,某班学生分,某班学
35、生统计统计学考学考试试成成绩绩如下:如下:89 88 76 99 74 60 82 60 89 86 93 99 94 89 88 76 99 74 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 87 84 79 65 98 6782 77 79 97 78 95 92 87 84 79 65 98 6759 72 84 85 56 81 77 73 65 66 83 63 79 59 72 84 85 56 81 77 73 65 66 83 63 79 7070试试分分组组,并,并计计算算组组中中值值。2.2.如某如某组组数据最大数据最大值为值为
36、139139,最小,最小值为值为107107,组组数数为为 7 7,则组则组距距应为应为多少?多少?3.3.按完成按完成净产值净产值分分组组(万元),(万元),计计算各算各组组组组中中值值 10 10以下以下 1020 2030 3040 4070 70 1020 2030 3040 4070 70以上以上53534某行业管理局所属40个企业1999年的销售收入如下:(单位:万元)152 124 129 116 110 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136
37、 117 108 97 88 123 115 119 138 112 146 113 126按125以上为先进企业,115125为良好企业,105115为一般企业,105一下为落后企业分组编制频数分布表,并计算累计频数和累计频率5454第四节 数据的图表展示 统计调查统计调查搜集来的搜集来的资资料往往是没有次序的原始料往往是没有次序的原始资资料,使原始料,使原始资资料有序化,列表和作料有序化,列表和作图图是两种基本是两种基本方法,得到的分方法,得到的分别别就是就是统计统计表和表和统计图统计图。一、统计表(一)统计表的定义和作用1、统计表的定义统计表:把统计数据按一定的顺序排列在表格上,就形成了
38、统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。55552、统计表的作用:1、它利用表格形式,合理地安排统计资料,清晰、简明地反映出现象总体的特征。2、统计表通过科学、合理地表现统计资料,便于对统计资料进行对照比较和分析,有利于计算统计分析指标。3、在统计分析报告中使用统计表,能节省文字叙述篇幅,达到简明易懂、紧凑有力的分析效果。4、统计表还是汇总和积累统计资料,进行统计分析的重要工具。56562002年我国城年我国城乡人口情况人口情况 按城按城乡分分 比重(比重(%)人口数(万人)人口数(万人)12845339.0960.917824150212(二
39、)(二).统计表的表的结构构1)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。总标题 乡村村 城城镇100.00合合计 纵栏标题 统计数数值 横行横行标题 5757表34 离婚案件构成离婚案件构成 2)从内容上看,从内容上看,统计表由主表由主词栏和和宾词栏两个两个部分部分组成。成。主主词统计表所要表所要说明的明的总体及其体及其组成部分成部分。宾词用来用来说明明总体数量特征的各个统计指 标。如需要,主如需要,主宾词可互可互换。5858(三)统计表的分类1、按主词的结构分类1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。2)分组表:主词只按一个
40、标志进行分组形成的统计表,也称简单分组表,。3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。5959简单简单表表 我国城市居民家庭基本情况(我国城市居民家庭基本情况(2002年)年)6060 中国人口年中国人口年龄结构状况构状况 单位:位:%资料来源|:2003中国统计年鉴第99页。简单分分组表表6161 复合分复合分组表表 我国社会福利主要我国社会福利主要费用情况用情况 单位:位:亿元元 资料来源|:2003中国统计年鉴第838页。62622、按宾词设计分类1)宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上,就是宾词简单排列表。2)宾词分组平行排列是指宾词栏
41、中各分组标志彼此分开,平行排列,就是宾词分组平行排列表。3)宾词分组层叠排列:指同时按两个或两个以上标志分组6363(四)统计表的设计统计表的设计应注意如下事项:1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。2.合计栏的设置。3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。64644.指标数值的填写。当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“”表示。5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果
42、表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。6.注解或资料来源。在统计表下,应注明资料来源。6565二、二、统计图统计图(一)分类和顺序数据的图形显示1、条形图(bar graph):在平面直角坐标系中,我们指定横坐标为各组变量,纵坐标表示各组的频数、相对频数或百分比频数,然后使各组条形的宽度相同,条形的高度等于该组的频数、相对频数或百分比频数。横置条形图、纵置条形图 例:某商店顾客购买计算机频数分布表、条形图购买计算机数据的频数分布表6666公司 频数 比重(%)苹果机 13 26康柏机 12 24贝尔 5 10盖特威2000 9 18IBM 11 22合计 50 1006
43、76768682、饼形图(pie chart):首先绘制一个圆形(饼形),然后利用相对频数或百分比频数,按各组在圆形360度中的比重,将圆形划分成对应的几个部分。例:某商店顾客购买计算机饼形图69693、环环形形图图环形图与圆形图又有区别,环形图中间有一个空洞,总体中的每一部分数据用环中的一段表示;圆形图只能显示每一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。因此环形图可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。例如:在一项有关住房问题的研究中,调查人员在甲乙两个城市各抽样调查300户家庭,其中一个问题是:“您对您家庭目前的
44、住房状况是否满意?”备选答案有:(1)非常不满意;(2)不满意;(3)一般;(4)满意;(5)非常满意。调查结果如下表:70707171 频频数分布不但可以用数分布不但可以用统计统计表的形式表表的形式表现现,也可以用,也可以用统计图统计图的形式表的形式表现现。用。用统计图统计图表示表示频频数分布,数分布,较较之用之用统统计计表,要直表,要直观观便捷得多。但缺点是不及便捷得多。但缺点是不及统计统计表精确。表精确。统统计图计图的种的种类类很多,本很多,本节仅节仅就与就与频频数分布数列相数分布数列相衔衔接的接的统统计图计图加以介加以介绍绍。根据根据编编制好的制好的频频数分布数列,可以数分布数列,可以
45、绘绘制出相制出相应应的的统统计图计图,最常用的有,最常用的有频频数分布直方数分布直方图图、折、折线图线图、曲、曲线图线图以以及累及累计频计频数分布曲数分布曲线线。具体方法是:先画直角坐具体方法是:先画直角坐标标系,系,横横轴轴代表分代表分组组或各或各组组组组限,限,纵轴纵轴代表各代表各组频组频数或数或频频率,率,然后再根据相然后再根据相应应的分配数列作的分配数列作图图。(二)数值型数据的显示7272条件下,很条件下,很条件下,很条件下,很显显显显然各矩形的面然各矩形的面然各矩形的面然各矩形的面积积积积与其高度成正比。因此,各矩与其高度成正比。因此,各矩与其高度成正比。因此,各矩与其高度成正比。
46、因此,各矩形的面形的面形的面形的面积积积积同同同同样样样样可以用来表示各可以用来表示各可以用来表示各可以用来表示各组组组组的的的的频频频频数或数或数或数或频频频频率,而且看起来率,而且看起来率,而且看起来率,而且看起来更形象直更形象直更形象直更形象直观观观观。如果取各矩形的。如果取各矩形的。如果取各矩形的。如果取各矩形的总总总总面面面面积为积为积为积为1 1,各矩形的面,各矩形的面,各矩形的面,各矩形的面积积积积必必必必定等于各定等于各定等于各定等于各组组组组的相的相的相的相对频对频对频对频数。数。数。数。1.直方直方图图(Histograms)直方直方图图是用矩形是用矩形(或或长长条条)的高
47、度来表示数列各的高度来表示数列各组组的的频频数或数或频频率。率。对对于定于定类变类变量和定序量和定序变变量的分量的分组组,矩形,矩形(或或长长条条)的的宽宽度是没有意度是没有意义义的,各矩形之的,各矩形之间间要留出一定的空要留出一定的空隙;隙;对对于定距于定距变变量量(和定比和定比变变量量)的分的分组组,矩形的,矩形的宽宽度表度表示各示各组组组组距,各矩形之距,各矩形之间间一般不留空隙。在等距分一般不留空隙。在等距分组组的的7373 其其实实,在,在频频数分布数分布图图中,用面中,用面积积来理解来理解频频数分布状况更合适。数分布状况更合适。比如直方比如直方图图,当,当处处理异距分理异距分组时应
48、该组时应该用矩形面用矩形面积积而不是用矩形高度而不是用矩形高度来来显显示示频频数分布。数分布。下面是根据表下面是根据表315绘绘制出的两个直方制出的两个直方图图。左。左图图用矩形高度来用矩形高度来表示各表示各组频组频数就会数就会产产生生错觉错觉。右。右图图是按照是按照标标准准组组距距频频数作出来的,数作出来的,用矩形面用矩形面积积来表示各来表示各组频组频数就避免了不必要的数就避免了不必要的错觉错觉。以后当我。以后当我们们接接触正触正态态曲曲线线等曲等曲线线后,将后,将进进一步体会到用面一步体会到用面积积来表示来表示频频数分布的好数分布的好处处。7474 2.折折线图线图(Polygon)表示表
49、示频频数分布的另一种数分布的另一种图图形是形是频频数多数多边边形形图图,简简称折称折线图线图。直接把直方。直接把直方图图各矩形各矩形顶顶部的中点用直部的中点用直线连线连接接起来,并把原来的矩形抹掉,就得到起来,并把原来的矩形抹掉,就得到频频数多数多边边形形图图。7575 当当变变量数列中的量数列中的组组数愈加增多,数愈加增多,变变量量值值也非常多也非常多时时,折,折线图线图会逐步会逐步过过渡到平滑曲渡到平滑曲线线。频频数分布曲数分布曲线图线图实实质质上是上是对应对应于于连续变连续变量的量的频频数分布的数分布的函数关系函数关系图图。3.曲曲线图76764、描述、描述时间时间序列的序列的线图线图线
50、图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。7777从上图可以清楚地看出,城乡居民的家庭人均收入逐年提高,而且城镇居民的家庭人均收入高于农村,1993年以后这种差距有扩大的趋势。绘制线图时应注意以下几点:1、时间一般绘在横轴,指标数据绘在纵轴;2、图形的长宽比例要适当,一般为横轴略大于纵轴的长方形,其长宽比例大致为10:7,图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便于对数据变化的理解;3、一般情况下,纵轴数据下端应从0开始,以便于比较。数据与0之间的间距过大,可以采取折断的“”符号将纵轴折断。7878