统计数据的整编与显示.ppt

上传人:小** 文档编号:3826424 上传时间:2020-10-31 格式:PPT 页数:95 大小:1MB
返回 下载 相关 举报
统计数据的整编与显示.ppt_第1页
第1页 / 共95页
统计数据的整编与显示.ppt_第2页
第2页 / 共95页
点击查看更多>>
资源描述

《统计数据的整编与显示.ppt》由会员分享,可在线阅读,更多相关《统计数据的整编与显示.ppt(95页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第3章 统计数据的整理与显示,PowerPoint,主要内容,一、统计数据的整理 二、统计数据的显示 三、EXCEL在数据整理与显示中的应用,学习目标,1了解统计数据整理的概念及步骤; 2 掌握统计分组的方法; 3. 熟悉频数分布的概念、构成与类型; 4. 运用EXCEL整理与显示数据。,通过统计调查可以搜集到大量的统计资料,但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。,统计整理,将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体特征的过程。,是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。,地位,

2、一、统计数据的整理,数据的预处理,数据的分组,数据的汇总,分布数列(频数分布),统计数据整理的一般程序,(一)数据的预处理,数据的审核 检查数据中的错误 数据的排序 升序和降序 寻找数据的基本特征 数据的筛选 找出符合条件的数据,完整性与及时性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 检查填报单位是否按时报送了有关数据 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等,数据的审核,审核数据准确性的常用方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对分类

3、和顺序数据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误 主要用于对数值型数据的审核,按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成,数据的排序,分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 数值型数据的排序 递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(n),数据的筛选,将某些不符合要求的

4、数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来 Excel的筛选功能有两种,即自动筛选和高级筛选。,用Excel进行数据筛选,8名学生的考试成绩数据,(二)统计分组,指根据事物的内在特点和统计研究的目的,按一定的标志将统计总体区分为若干性质不同的组成部分的统计研究方法,对总体而言,是“分”,即将总体区分为性质相异的若干部分。,对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。,1.概念,分组前,分组后,25,33,42,(1)划分现象的类型,例:如:国民经济按产业分组农业分成农、林、牧、渔业各组;企业按所有制分组等。,2.作用,(2)揭示现象

5、的内部结构,(3)分析现象之间的依存关系,我国五次人口普查的人口年龄构成表 单位:%,中国农民家庭按收入分组的恩格尔系数,3.原则,互斥性,穷尽性,指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。,指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。,4.种类,按分组标志不同,按每组变量值的取值范围,按分组标志多少及排列方式,品质分组,数量分组,单项分组,组距分组,平行分组,复合分组,简单分组,选择反映事物属性差异的标志进行的分组。亦即对非数值型数据进行分组,包括对分类数据的分组与对顺序数据的分组。,选择反映事物数量的差异的标志进行的分组。亦即对

6、数值型数据进行分组。,品质分组,数量分组,产品按等级可分为一等品、二等品、三等品等组,如饮料按品牌可分为百事可乐、可口可乐、芬达、雪碧、七喜等组,如人口按年龄分组:0-14岁,15-64岁,65岁以上。,单项分组,用一个变量值(数据)作为一组,适用于分类数据、顺序数据以及对变动范围不大、不同变量值个数不多的离散型数据进行分组。,如家庭按子女人数分组:0,1,2,3, 4,。,组距分组,将变量值的一个区间作为一组,只适用于数值型数据。一般用来对连续型数据或变动范围较大、不同变量值个数较多的离散型数据进行分组。,如某班学生某学科成绩分组:60分以下,6070分,7080分,8090分,90分以上。

7、,组限,上限,下限,每个组的最大值,每个组的最小值,组距,每一组的区间长度,组距=上限-下限,组中值,每一组中点位置的数值,组中值=(上限+下限)2,开口组,缺少上限数值或下限数值的组,注意,开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。,组距分组中的一些概念,等距分组,异距分组,各组组距相等的分组称为等距分组。,各组组距不全相等的分组称为异距分组。,如某班学生某学科成绩分组:60分以下,6070分,7080分,8090分,90分以上。,如人口按年龄分组:0-15岁,15-60岁,60岁以上。,进行组距分组需要注意的问题,要处理好组数与组距问题,组数的确定主要凭经验;也可

8、按不同的组数进行试验,比较其次数分布,看哪一个能够更好地显示出分组数据的特征;还可以根据美国学者斯特杰斯(Sturges)创立的经验公式k=1+3.3lgN(N为总体单位数)来确定。,组数一旦确定,组距就可以根据全距来确定。组距=全距/组数,宜采用5或10的倍数,对某组数值型数据是进行等距分组还是异距分组,这取决于变量值的分布状况。,对于离散变量,相邻组组限可以间断,也可重叠; 对于连续变量,相邻组组限必须重叠; 遵循“上限不在内”原则; 首末两组可使用“以下”及“以上”的开口组。,第二、组限的表示,要处理好组限的问题,第一,最小组的下限应低于最小变量值,而最大组的上限应高于最大变量值;,某班

9、学生数学成绩的分布情况,上组限U,下组限L,组距d=U-L =90-80=10(分),组中值x=(U+L)/2 =(80+90)/2 =85(分),组中值 x=L+d/2 =60-(70-60)/2 =55(分),上限不在内原则,简单分组,复合分组,只按一个分组标志对所研究的总体进行分组。,按两个或两个以上的标志层叠排列对同一总体进行分组。,平行分组,按两个或两个以上的标志平行排列对同一总体进行分组。,对教师的分组,按性别分组,男性,女性,按职称分组,高级,中级,初级,共计5组 2+3,平行分组,按性别分类,按职称分类,男,女,高级,中级,初级,共计6组23,对教师的分类,复合分组,(三)数据

10、的汇总,数据汇总的组织形式,逐级汇总,集中汇总,综合汇总,按照一定的统计管理体制,自下而上逐级汇总统计数据的一种组织形式。,将全部调查数据集中到组织统计调查的最高一级机关进行统一汇总的形式。,将上述两种组织形式结合使用的汇总形式。,数据汇总的方法,手工汇总,电子计算机汇总,“条件计算函数”,“Frequency函数”, “分类汇总”,“直方图工具”,“数据透视表”,数据汇总的方式,计数汇总,求和汇总,平均值汇总,(四)频数分布,在统计分组基础上,将总体所有单位按组归并排列,形成总体中各个单位在各组间的分布,亦称频数分布数列。,各组变量值(可以是一组一个变量值、也可以是一定范围的变量值),2.构

11、成要素,频率,各组单位数占总体单位总数的比重,次数,总体单位在各组中出现的次数,亦称频数,各组的次数或频率,1.概念,累计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,某班学生数学成绩的分布情况,=13/50,数量数列-数值型数据的频数分布,品质数列-分类数据、顺序数据的频数分布,3.种类,某超市某日出售的50瓶饮料品牌的频数分布,分类数据的频数分布,品质数列、单项数列,某省2009年部分城镇居民收入高低的频数分布,

12、顺序数据的频数分布,品质数列、单项数列,某车间50名职工的家庭人口分布,数值型数据的频数分布,数量数列、单项数列,某班学生数学成绩的分布情况,数值型数据的频数分布,数量数列、组距数列,钟型分布,型分布,型分布,4.分布类型,二、统计数据的显示,作用,1、使统计数据系统化、条理化、生动化,便于资料的积累和比较分析。,2、清晰地显示现象的活动过程和现象之间的复杂关系,给人一种一目了然的印象。,总标题,数字资料,横行标题,纵栏标题,是统计表表的名称,放在表格的正上方,是横行的名称,通常用来表示各组的名称,一般放在表格的左边,是纵栏的名称,通常为统计指标的名称 ,一般放在表格的右上方,即指标数值,排列

13、在各横行标题与纵栏标题的交叉处,从形式看,(一)统计表,1.统计表的概念与结构,统计表可分为广义统计表和狭义统计表两种。人们通常所说的统计表是反映频数分布的表格。,主词,宾词,统计表所要说明的总体及其组成部分,说明总体及总体各组数量特征而采用的统计指标,从内容看,2.统计表的种类,常见的统计表主要有以下几种:,显示未分组数据的统计表,显示分组数据的统计表,简单表,简单分组表,平行分组表,复合分组表,简单表,显示未分组数据的统计表,某地区2002年铁矿计划完成情况,简单分组表,对总体进行简单分组的统计表,某地区2002年各类型企业总产值表,平行分组表,对总体选择二个或二个以上标志进行平行分组的统

14、计表。,2009年末某地区人口统计表,复合分组表,对总体进行复合分组的统计表,2009年末某地区人口统计表,城乡,性别,2009年末某地区人口统计表 单位:万人,(1)总标题内容应满足3W 要求 (2)合理安排统计表的结构 (3)表中的上下两条横线一般用粗线,其他线用细线,通常情况下,统计表的左右两边不封口 (4)统计表各纵列若须合计时,一般应将合计列在最后一行,各横行若须要合计时,可将合计列在最前一栏或最后一栏 (5)数据计量单位相同时,可放在表的右上角,不同时应放在每个指标后或单列出计量单位栏 (6)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一 (7)对于没有数

15、字的表格单元,一般用“”表示 (8)必要时可在表的下方加上注释,3.统计表的设计,(二)统计图,1.统计图的概念和结构,统计图是以图形形象地表现统计数据的一种形式。 统计图一般包括以下几部分: 标题,一般包括图表标题、数值轴(X、Y)标题; 坐标轴和网格线; 图表区和绘图区; 图例,图例用来标明图表中的数据系列。,2.统计图的种类,显示分组数据的统计图,显示未分组数据的统计图,箱线图,茎叶图,环形图,饼 图,直方图,条形图,折线图,用宽度相同的条形的高度或长短来表示数据多少的图形 有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条形图,也可以放在

16、横轴,称为柱形图,条形图,用长方形的宽度和高度来表示频数分布的图形,实际上是用长方形的面积来表示各组的频率分布 在直角坐标中,用横轴表示数据分组,即各组组限,纵轴表示频数或频率,各组组距与相应的频数就形成了一个个竖立长方形 直方图下的总面积等于1 只能用于显示数值型数据的频数分布 如果是异距数列,则通常按频数密度(频数密度=频数组距)绘制直方图,直方图,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用长方形的高度表示每一组的频数或频率,宽度则表示各组的组距,其高度与宽度均有意义 直方图中的长方形通常是连续排列,条形图则是分开排列 条形图主要用于展示分类数据,直

17、方图则主要用于展示数值型数据,直方图与条形图的区别:,折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 也可以根据各组组中值与频数求出各组的坐标点,并用折线连接各点而成 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,折线图,折线图可以用来表示累计频数或累计频率分布,但累计频数分布图的画法和频数分布折线图画法有所不同。,在社会经济统计中,折线图主要用于显示时序数据,反映现象的动态变化。,中国历年GDP的折线图,也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形 主要用于表示总体或样本中各组成部分所占的比例,

18、对于研究结构性问题十分有用 绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的 饼图适用于任何分组数据,但更多地应用于分类数据和顺序数据。,饼图,环形图中间有一个“空洞”,总体中的每一部分数据是用环中的一段来表示 环形图与圆形图类似,但又有区别 圆形图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环 环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据,环形图,用于显示未分组的原始数据的分布 箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成

19、 其绘制方法是: 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接,箱线图,4,6,8,10,12,简单箱线图,中位数,X最小值,X最大值,不同分布的箱线图,分布的形状与箱线图,某市10个学校中考成绩的箱线图,茎叶图,用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留一位数字 适用于小批量数据 6. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶

20、图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,某电脑公司120天日销售量分布情况,某班学生数学考试成绩分布情况,明确制图目的,根据统计数据的性质和特点,突出重点,选择合适的统计图形 统计图的设计和绘制要保持严格的科学性与艺术性,简明扼要,通俗易懂,图形布局合理 统计图的坐标与尺度应科学合理,3. 绘制统计图应注意的事项,三、Excel在数据整理与显示中的应用,某公司在职员工档案,要求:试利用Excel整理并显示表中的数据。,(一)数据整理前的预处理,1.把待整理数据输入Excel数据表中,2.对数据进行排序,升序,降序,3.对数据进行筛选,第1步,点击数据清单的任一单

21、元格,选择“数据”菜单下的“筛选”命令。如果要筛选出给定条件的数据,可使用“自动筛选”命令,第2步,在下拉菜单方框内选择要筛选出的数据,比如要筛选出学历是硕士的员工,点击“硕士”,得到如下结果,要想得到符合多个条件的员工数据,则需要使用“高级筛选”命令。,(二)数据的整理与显示,1.品质数据的整理与显示“分类汇总”,第1步,必须对要进行分类汇总的变量列(部门)数据进行排序。,第2步,选择“数据”菜单中“分类汇总”,打开“分类汇总”的对话框,选择“部门”变量为分类字段,选择“计数”为汇总方式,在选定汇总项选择“姓名”。,第3步:单击“确定”按钮,可得如下结果,第4步: 单击分级显示符号,,,和,

22、可创建汇总报表。这样可以隐藏明细数据而只显示汇总结果。,将前面的汇总结果稍加修饰就可以得到该公司按部门分组的频数分布,如下表。,按同样的方法可以得到反映该公司员工婚姻状况以及学历的频数分布。,为了能直观的显示数据,可以将统计表中的数据用统计图展示出来,2.数值型数据的整理与显示“直方图”,“直方图”工具用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个数和累积频率。,第1步,用鼠标点击Excel数据清单中待整理数据(工资)所在列的任意单元格,再单击工具栏中的“升序排序”,第2步,观察“工资”数据的分布特征,将工资数据分为若干组,并将每组的上限数值输入某列单元格,本例为J2:J7,

23、第3步,在工具菜单中单击“数据分析”选项,从其对话框的分析工具列表中选择“直方图”,打开直方图对话框,并填好相关内容,第4步,按“确定”按扭,即可得到如下结果,直接利用Excel得出的统计图表,与传统意义的统计图表不太一致,需要对图表进行修饰,修饰后的图表如下,3. 数据透视表,不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作多变量数据的交叉频数分析、总和分析和其它统计量的分析。,利用数据透视表时,数据源表中的首行必须有列标题。,注意,第1步,在数据清单中,选定任一单元格,然后选择“数据”菜单的“数据透视表和数据透视图”子菜单,进入创建数据透视表的对话框,然后根据需要选择“数据源类型

24、”和“报表类型”,并单击下一步,弹出对话框,第2步,在对话框中确定数据源区域,本例为A2:H22,并单击下一步,弹出对话框,第3步,在对话框中选择数据透视表显示位置,为方便起见,可选择“现有工作表”,本例为M2,然后点击“布局”,弹出对话框,第5步,单击“确定”,自动返回“数据透视表和数据透视图向导”对话框,然后单击“完成”,可得如下结果。,本表反映的是该公司发放的奖金在不同学历而且婚姻状况不同、所在部门不同的员工中的分配情况。,要想得到频数分布表,需要双击上图中左上角的“求和项:奖金”,将其改为计数项,单击“确定”,即可得到根据“学历”、“婚否”、“部门”建立的交叉频数分布表。,本章小结,统计整理的概念与一般程序 数据预处理的内容 统计分组的概念、作用、原则与分类 数据汇总的组织形式、方法与方式 频数分布的概念、构成、分类与类型 统计表与统计图的构成、种类及绘制事项 如何用Excel制作频数分布表和图形,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁