《统计学数据的图表展示精选PPT.ppt》由会员分享,可在线阅读,更多相关《统计学数据的图表展示精选PPT.ppt(103页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于统计学数据的图表展示第1页,讲稿共103张,创作于星期三学习目标学习目标1.1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.2.掌握分类和顺序数据的整理与显示方法掌握分类和顺序数据的整理与显示方法3.3.掌握数值型数据的整理与显示方法掌握数值型数据的整理与显示方法4.4.用用ExcelExcel作频数分布表和图形作频数分布表和图形5.5.合理使用图表合理使用图表第2页,讲稿共103张,创作于星期三 重点重点 1.1.分类、顺序、数值型数据的整理分类、顺序、数值型数据的整理 2.2.分类、顺序、数值型数据的展示方法分类、顺序、数值型数据的展示方法 难点难点利用利用ExcelExc
2、el做频数分布表和形图和合理使用统计表做频数分布表和形图和合理使用统计表 本章教学重点与难点本章教学重点与难点第3页,讲稿共103张,创作于星期三3.13.1 数据的预处理数据的预处理3.1.1 3.1.1 数据审核数据审核3.1.2 3.1.2 数据筛选数据筛选3.1.3 3.1.3 数据排序数据排序3.1.4 3.1.4 数据透视表数据透视表第4页,讲稿共103张,创作于星期三数据的预处理数据的预处理1.数据审核数据审核检查数据中的错误检查数据中的错误2.数据筛选数据筛选找出符合条件的数据找出符合条件的数据3.数据排序数据排序升序和降序升序和降序寻找数据的基本特征寻找数据的基本特征4.数据
3、透视数据透视按需要汇总按需要汇总第5页,讲稿共103张,创作于星期三数据审核数据审核第6页,讲稿共103张,创作于星期三数据审核数据审核原始数据原始数据(raw data)(raw data)1.完整性审核完整性审核应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全所有的调查项目或变量是否填写齐全2.准确性审核准确性审核数数据据是是否否真真实实反反映映实实际际情情况况,内内容容是是否否符合实际符合实际数据是否有错误,计算是否正确等数据是否有错误,计算是否正确等第7页,讲稿共103张,创作于星期三数据的审核数据的审核二手数据二手数据(second hand
4、data)(second hand data)1.适用性审核适用性审核弄弄清清楚楚数数据据的的来来源源、数数据据的的口口径径以以及及有有关的背景材料关的背景材料确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要2.时效性审核时效性审核尽可能使用最新的数据尽可能使用最新的数据3.确认是否有必要做进一步的加工整理确认是否有必要做进一步的加工整理第8页,讲稿共103张,创作于星期三数据筛选与排序数据筛选与排序第9页,讲稿共103张,创作于星期三数据筛选数据筛选(data filter)(data filter)1.当当数数据据中中的的错错误误不不能能予予以以纠纠正正,或或者者有有些
5、些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需要对数据进行筛选需要对数据进行筛选2.数据筛选的内容数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的数据予以剔除的数据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔除符合特定条件的数据予以剔除第10页,讲稿共103张,创作于星期三用用ExcelExcel进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选数据筛选(data filter)(data filt
6、er)第11页,讲稿共103张,创作于星期三数据排序数据排序 (data rank)(data rank)1.按按一一定定顺顺序序将将数数据据排排列列,以以发发现现一一些些明明显的特征或趋势,找到解决问题的线索显的特征或趋势,找到解决问题的线索2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新归类或分组等提供依据新归类或分组等提供依据3.在在某某些些场场合合,排排序序本本身身就就是是分分析析的的目目的的之一之一4.排序可借助于计算机完成排序可借助于计算机完成第12页,讲稿共103张,创作于星期三数据排序数据排序 (方法方法)1.1.分类数据的排序分类数据的排序字字母母型型
7、数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯惯上用升序上用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的的升升序序降序之分降序之分2.2.数值型数据的排序数值型数据的排序递递增增排排序序:设设一一组组数数据据为为x x1 1,x x2 2,x xn n,递增排序后可表示为:递增排序后可表示为:x x(1)(1)x x(2)2)x x(2)(2)x x(n n)第13页,讲稿共103张,创作于星期三数据透视表数据透视表第14页,讲稿共103张,创作于星期三数据透视表数据透视表(pivo
8、t table)1.1.可以从复杂的数据中提取有用的信息可以从复杂的数据中提取有用的信息2.2.可可以以对对数数据据表表的的重重要要信信息息按按使使用用者者的的习习惯惯或分析要求进行汇总和作图或分析要求进行汇总和作图3.3.形成一个符合需要的交叉表形成一个符合需要的交叉表(列联表列联表)4.4.在在利利用用数数据据透透视视表表时时,数数据据源源表表中中的的首首行行必须有列标题必须有列标题第15页,讲稿共103张,创作于星期三数据透视表数据透视表(用用ExcelExcel创建数据透视表创建数据透视表)第第1 1步步:在:在ExcelExcel工作表中建立数据清单工作表中建立数据清单第第2 2步步
9、:选选中中数数据据清清单单中中的的任任意意单单元元格格,并并选选择择【数数据据】菜单中的菜单中的【数据透视表和数据透视图数据透视表和数据透视图】第第3 3步步:确定数据源区域:确定数据源区域第第4 4步步:在在【向向导导33步步骤骤之之3 3】中中选选择择数数据据透透视视表表的的输输出位置。然后选择出位置。然后选择【布局布局】第第5 5步步:在在【向向导导布布局局】对对话话框框中中,依依次次将将”分分类类变变量量“拖拖至至左左边边的的“行行”区区域域,上上边边的的“列列”区区域域,将将需需要要汇汇总总的的“变量变量”拖至拖至“数据区域数据区域”第第6 6步步:然然后后单单击击【确确定定】,自自
10、动动返返回回【向向导导33步步骤骤之之3 3】对话框。然后单击对话框。然后单击【完成完成】,即可输出数据透视表,即可输出数据透视表 第16页,讲稿共103张,创作于星期三3.2 3.2 品质数据的整理与展示品质数据的整理与展示3.2.1 3.2.1 分类数据的整理与图示分类数据的整理与图示3.2.2 3.2.2 顺序数据的整理与图示顺序数据的整理与图示第17页,讲稿共103张,创作于星期三数据的整理与显示数据的整理与显示(基本问题基本问题)1.要弄清所面对的数据类型要弄清所面对的数据类型不不同同类类型型的的数数据据,采采取取不不同同的的处处理理方方式式和方法和方法2.对对分分类类数数据据和和顺
11、顺序序数数据据主主要要是是作作分分类类整整理理3.对数值型数据则主要是作分组整理对数值型数据则主要是作分组整理4.适适合合于于低低层层次次数数据据的的整整理理和和显显示示方方法法也也适适合合于于高高层层次次的的数数据据;但但适适合合于于高高层层次次数数据据的的整整理理和和显显示示方方法法并并不不适适合合于于低低层层次的数据次的数据第18页,讲稿共103张,创作于星期三分类数据的整理与图示分类数据的整理与图示第19页,讲稿共103张,创作于星期三分类数据的整理分类数据的整理(基本过程基本过程)1.列出各类别列出各类别2.2.计算各类别的频数计算各类别的频数3.3.制作频数分布表制作频数分布表4.
12、4.用图形显示数据用图形显示数据分类频数比例百分比比率ABCDE第20页,讲稿共103张,创作于星期三分类数据的整理分类数据的整理(可计算的统计量可计算的统计量)1.1.频数频数(frequency)frequency):落在各类别中的数:落在各类别中的数据个数据个数2.2.比例比例(proportion)proportion):某一类别数据个数:某一类别数据个数占全部数据个数的比值占全部数据个数的比值3.3.百分比百分比(percentage)percentage):将对比的基数作:将对比的基数作为为100100而计算的比值而计算的比值4.4.比率比率(ratio)ratio):不同类别数值
13、个数的比:不同类别数值个数的比值值第21页,讲稿共103张,创作于星期三分类数据整理分类数据整理频数分布表频数分布表 (例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌
14、牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就是就是就是就是记录记录记录记录的原始数据的原始数据的原始数据的原始数据用用Excel制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品第22页,讲稿共103张,创作于星期三使用使用Excel数据透视表数计数数据透视表数计数(pivot table)第第1步步:选选择
15、择【数数据据】菜菜单单中中的的【数数据据透透视视表表和和数数据据透透视图视图】第第2步:确定数据源区域步:确定数据源区域第第3步步:在在【向向导导3步步骤骤之之3】中中选选择择数数据据透透视视表表的的输输出位置。然后选择出位置。然后选择【布局布局】第第4步步:在在【向向导导布布局局】对对话话框框中中,依依次次将将“分分类类变变量量“(这这里里是是饮饮料料类类型型)连连续续拖拖放放两两次次:一一次次拖拖至至左左边边的的“行行”区区域域 ,一一次次拖拖至至“数数据据”区区域域,将将“顾顾客客性性别别”拖至拖至“列列”区域区域第第5步步:然然后后单单击击【确确定定】,自自动动返返回回【向向导导3步步
16、骤骤之之3】对对话话框框。然然后后单单击击【完完成成】,即即可可输输出出数数据据透透视表视表第23页,讲稿共103张,创作于星期三生成频数分布表生成频数分布表(定性数据定性数据)不同类型饮料的频数分布不同类型饮料的频数分布不同类型饮料的频数分布不同类型饮料的频数分布 第24页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示条形图条形图(bar Chartbar Chart)1.1.用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来来表表示示各类别数据的图形各类别数据的图形2.2.有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式3.3.主要用于反映分类数据的频数分布
17、主要用于反映分类数据的频数分布4.4.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图,也也可可以以放放在在横横轴轴,称称为为柱柱形形图图(column chart)(column chart)第25页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示条形图条形图(例题分析例题分析)第26页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示对比条形图对比条形图(side-by-side bar chart)(side-by-side bar chart)1.分分类类变变量量在在不不同同时时间间或或不不同同空空间间上有多个取值上有多个取值2.对对比比分分类
18、类变变量量的的取取值值在在不不同同时时间间或或不不同同空空间间上上的的差异或变化趋势差异或变化趋势电脑品牌一季度二季度联想256468IBM285397康柏247328戴尔563688第27页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示对比条形图对比条形图 (例题分析例题分析)第28页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示帕累托图帕累托图(pareto chart)(pareto chart)1.1.按按各各类类别别数数据据出出现现的的频频数数多多少少排排序序后后绘绘制制的的柱柱形图形图 2.2.主主要要用用于于展展示示分分类类数数据据的的分分布布第29页,讲
19、稿共103张,创作于星期三分类数据的图示分类数据的图示饼图饼图(pie Chartpie Chart)1.1.也也称称圆圆形形图图,是是用用圆圆形形及及圆圆内内扇扇形形的的角角度度来表示数值大小的图形来表示数值大小的图形2.2.主主要要用用于于表表示示样样本本或或总总体体中中各各组组成成部部分分所所占的比例,用于研究结构性问题占的比例,用于研究结构性问题3.3.绘绘制制圆圆形形图图时时,样样本本或或总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形角角度度表表示示,这这些些扇扇形形的的中中心心角角度度,按按各各部部分分数数据据百百分分比比乘以乘以3603600 0
20、确定确定第30页,讲稿共103张,创作于星期三分类数据的图示分类数据的图示饼图饼图 (例题分析例题分析)第31页,讲稿共103张,创作于星期三环形图环形图(doughnut chart)1.环环形形图图中中间间有有一一个个“空空洞洞”,样样本本或或总总体体中中的每一部分数据用环中的一段表示的每一部分数据用环中的一段表示2.与饼图类似,但又有区别与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个样样本本或或总总体体的的数数据据系系列列,每每一一个个样样本本或或总总体体的的数数据据系系列列为为一一个环个环3
21、.用于结构比较研究用于结构比较研究 第32页,讲稿共103张,创作于星期三环形图环形图(doughnut chart)【例例例例】20062006年年北北京京、上上海海和和天天津津地地区区按按收收入入法法计计算算的的地地区区生生产产总总值值(按按当当年年价价格格计计算算)数数据据。绘绘制制环环形形图图比比较较三三个地区的生产总值构成个地区的生产总值构成 第33页,讲稿共103张,创作于星期三环形图环形图(doughnut chart)北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收
22、入法计算的地区生产总值第34页,讲稿共103张,创作于星期三顺序数据的整理与图示顺序数据的整理与图示第35页,讲稿共103张,创作于星期三顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量)1.累累积积频频数数(cumulative cumulative frequenciesfrequencies):各类别频数的逐级累加各类别频数的逐级累加2.2.累累积积频频率率(cumulative cumulative percentagespercentages):各类别频率各类别频率(百分比百分比)的逐级累加的逐级累加 第36页,讲稿共103张,创作于星期三顺序数据的频数分布表顺序数据的频数
23、分布表(例题分析例题分析)【例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否否否否满满满满意意意意?”1 1 1 1非非非非常常常常不不不不满满满满意意意意;2 2 2 2不不不不满满满满意意意意;3
24、 3 3 3一一一一般般般般;4 4 4 4满满满满意意意意;5 5 5 5非非非非常满意。常满意。常满意。常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%)非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计300100.0第37页,讲稿共103张,创作于星期三顺序数据的频数分布表顺序数据的频数分布表 (例题分析例题分析)乙城市
25、家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%)非常不满意 不满意 一般 满意 非常满意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计300100.0第38页,讲稿共103张,创作于星期三顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图 (例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一
26、般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布第39页,讲稿共103张,创作于星期三环形图环形图 (例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价第40页,讲稿共103张,创作于星
27、期三3.3 3.3 数值型数据的整理与展示数值型数据的整理与展示3.3.1 3.3.1 数据分组数据分组3.3.2 3.3.2 数值型数据的图示数值型数据的图示第41页,讲稿共103张,创作于星期三一、数据分组一、数据分组第42页,讲稿共103张,创作于星期三分组方法分组方法等距分组等距分组异距分组异距分组第43页,讲稿共103张,创作于星期三单变量值分组单变量值分组(要点要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量值较少的情况第44页,讲稿共103张,创作于星期三组距分组组距分组(要点要点)1.将变量值的一个区间作为一
28、组将变量值的一个区间作为一组2.适合于连续变量适合于连续变量3.适合于变量值较多的情况适合于变量值较多的情况4.需要遵循需要遵循“不重不漏不重不漏”的原则的原则5.可可采采用用等等距距分分组组,也也可可采采用用不不等距分组等距分组 第45页,讲稿共103张,创作于星期三组距分组的步骤组距分组的步骤1.将原始数据进行排序将原始数据进行排序2.确定组数确定组数3.确定各组的组距确定各组的组距4.确定各组的组限确定各组的组限5.统计出各组的频数统计出各组的频数下面举例说明。下面举例说明。第46页,讲稿共103张,创作于星期三确定组数确定组数1、分组的目的之一是为了观察数据的特征和规、分组的目的之一是
29、为了观察数据的特征和规律。律。2、组数的多少应适中。不宜过多也不宜过、组数的多少应适中。不宜过多也不宜过少,一般少,一般 515 组组3、组数的确定,应以能够显示数据的分布特征、组数的确定,应以能够显示数据的分布特征和规律为目的。和规律为目的。第47页,讲稿共103张,创作于星期三第48页,讲稿共103张,创作于星期三确定各组组距确定各组组距组限:一个组的最小值称为组限:一个组的最小值称为“下限下限”;一个组的最大值称为一个组的最大值称为“上限上限”。组距:是一个组的上限与下限之差。组距:是一个组的上限与下限之差。=(全部数据的最大值(全部数据的最大值-全部数据的最小全部数据的最小值)值)组数
30、组数通常,组距宜取通常,组距宜取5或或10的倍数,且第一组的倍数,且第一组的下限应小于最小变量值,最后一组的的下限应小于最小变量值,最后一组的上限要大于最大的变量值。上限要大于最大的变量值。第49页,讲稿共103张,创作于星期三组距分组应注意的问题组距分组应注意的问题一定要遵循一定要遵循“不重不漏不重不漏”的原则。解决的原则。解决“不不重重”的问题,连续型变量的各相邻组的组限的问题,连续型变量的各相邻组的组限必须重叠必须重叠,习惯上规定习惯上规定“上组限不在内上组限不在内”。当一组数据悬殊较大时,为避免出现空白组当一组数据悬殊较大时,为避免出现空白组或极个别极端值被遗漏,一般应采用或极个别极端
31、值被遗漏,一般应采用“以下以下”及及“以上以上”,称谓开口组。称谓开口组。第50页,讲稿共103张,创作于星期三组距分组组距分组(几个概念几个概念)1.1.下限下限(lower limit)lower limit):一个组的最小值:一个组的最小值2.2.上限上限(upper limit)upper limit):一个组的最大值:一个组的最大值3.3.组距组距(class width)class width):上限与下限之差:上限与下限之差4.4.组中值组中值(class midpoint)class midpoint):下限与上限之间的中:下限与上限之间的中点值点值下限值下限值+上限值上限值2
32、组中值组中值=第51页,讲稿共103张,创作于星期三频数分布表的编制频数分布表的编制(例题分析例题分析)【例例】某某某某电电电电脑脑脑脑公公公公 司司司司2005200520052005年年前前四四个个月月各各天天的的销销售售量量数数据据(单单位位:台台)。试试试试对对对对数数数数据进行分组据进行分组据进行分组据进行分组第52页,讲稿共103张,创作于星期三频数分布表的编制频数分布表的编制(步骤步骤)1.确确定定组组数数:根根据据 Sturges 提提出出的的经经验验公公式式得组数得组数K为为:2.确定各组的组距:确定各组的组距:组距组距(237-141)10=9.6 103.统计出各组的频数
33、。每个组的数据满足统计出各组的频数。每个组的数据满足a xb(上限值不在内上限值不在内)第53页,讲稿共103张,创作于星期三等距分组表等距分组表(上下组限重叠上下组限重叠)第54页,讲稿共103张,创作于星期三等距分组表等距分组表(上下组限间断上下组限间断)第55页,讲稿共103张,创作于星期三等距分组表等距分组表(使用开口组使用开口组)第56页,讲稿共103张,创作于星期三统计函数创建频数分布表统计函数创建频数分布表(FREQUENCY)使使用用统统计计函函数数【FREQUENCY】创创建建频频数数分分布布表表和直方图可解决这一问题。具体步骤是和直方图可解决这一问题。具体步骤是1、选选择择
34、与与接接受受区区域域相相临临近近的的单单元元格格区区域域,作作为为频频数数分布表输出的区域分布表输出的区域2、选择统计函数中的、选择统计函数中的【FREQUENCY】函数函数3、在在对对话话框框【Date-array】后后输输入入数数据据区区域域,在在【Bins-array】后输入接受区域后输入接受区域4、同同时时按按下下“ctrl-shift-Enter”组组合合键键,即即得得到到频频数数分布分布第57页,讲稿共103张,创作于星期三利用工具菜单中的利用工具菜单中的【直方图直方图】创建频数分布表创建频数分布表利用工具菜单中的利用工具菜单中的【直方图直方图】来创建频数分布表的步骤:来创建频数分
35、布表的步骤:第第 1步:选择步:选择【工具工具】下拉菜单下拉菜单,并选择并选择【数据分析数据分析】项项第第 2步:在步:在【数据分析数据分析】项对话框中选择项对话框中选择【直方图直方图】命令命令第第3步:当出现对话框时:步:当出现对话框时:在在【输入区域输入区域】方框内键入数据区域方框内键入数据区域 在在【接收区域接收区域】方框内键入创建分组的上限值区域方框内键入创建分组的上限值区域 在在【输出区域输出区域】方框内键入结果输出的区域方框内键入结果输出的区域第58页,讲稿共103张,创作于星期三二、数值型数据的图示二、数值型数据的图示Excel分组数据分组数据直方图和折线图直方图和折线图未未分组
36、数据分组数据茎叶图和箱线图茎叶图和箱线图时间序列时间序列数据数据线图线图多变量多变量数据的图示数据的图示第59页,讲稿共103张,创作于星期三分组数据分组数据直方图直方图(histogram)(histogram)1.用于展示分组数据分布的一种图形用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布用矩形的宽度和高度来表示频数分布本质上是用矩形的本质上是用矩形的面积面积来表示频数分布来表示频数分布3.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应的的频频数就形成了一个矩形,即直方图数就形成了一个矩形,即直
37、方图第60页,讲稿共103张,创作于星期三分组数据的图示分组数据的图示(直方图的绘制直方图的绘制)140140 150150210210某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在170170180180之之间的天数最多间的天数最多!190190 200200180180160160 170170频频频频频频数数数数数数(天天天天天天)25252020151510105 53030220220 230230 240240第61页,讲稿共103张,创作于星期三分组数据分组数据直方
38、图直方图(直方图与条形图的区别直方图与条形图的区别)1.1.条条形形图图是是用用条条形形的的长长度度(横横置置时时)表表示示各各类类别别频数的多少,其宽度频数的多少,其宽度(表示类别表示类别)则是固定的则是固定的2.2.直直方方图图是是用用面面积积表表示示各各组组频频数数的的多多少少,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,宽宽度度则则表示各组的组距,其高度与宽度均有意义表示各组的组距,其高度与宽度均有意义3.3.直直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,条条形形图图则则是分开排列是分开排列4.4.条条形形图图主主要要用用于于展展示示分分类类数数据
39、据,直直方方图图则则主主要用于展示数值型数据要用于展示数值型数据第62页,讲稿共103张,创作于星期三分组数据分组数据折线图折线图(frequency polygon)1.1.折线图也称频数多边形图折线图也称频数多边形图2.2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中中值值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到
40、到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖竖边边中中点点连接到横轴连接到横轴折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所所表表示示的的频频数分布是一致的数分布是一致的第63页,讲稿共103张,创作于星期三分组数据的图示分组数据的图示(折线图的绘制折线图的绘制)折线图与直方图折线图与直方图折线图与直方图折线图与直方图下的面积相等!下的面积相等!下的面积相等!下的面积相等!140140150150210210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图19019020
41、0200180180160160170170220220230230240240频频频频频频数数数数数数(天天天天天天)25252020151510105 53030第64页,讲稿共103张,创作于星期三数值型数据的图示数值型数据的图示STATISTICASTATISTICA未未分组数据分组数据茎叶图和箱线图茎叶图和箱线图第65页,讲稿共103张,创作于星期三未分组数据未分组数据茎叶图茎叶图(stem-and-leaf display)(stem-and-leaf display)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由“茎茎”和和“叶叶”两两部部分分构
42、构成成,其其图图形形是是由由数数字字组组成的成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4.树叶上只保留最后一位数字树叶上只保留最后一位数字5.5.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值直方图可观察一组数据的分布状况,但没有给出具体的数值茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数数值,保留了原始数据的信息值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据直方图适用于大批量数据,茎叶
43、图适用于小批量数据第66页,讲稿共103张,创作于星期三未分组数据未分组数据茎叶图茎叶图(例题分析例题分析)某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图第67页,讲稿共103张,创作于星期三未分组数据未分组数据箱线图箱线图(box plotbox plot)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由一一组组数数据据的的5 5个个特特征征值值绘绘制制而而成成,它它由由一一个箱子和两条线段组成个箱子和两条线段组成3.3.绘制方法绘制方法首首先先找找出出一一组组数数据据的的5 5个个特特征征值值
44、,即即最最大大值值、最最小小值值、中中位位数数M Me e和和两两个个四四分分位位数数(下下四四分分位位数数Q QL L和上四分位数和上四分位数Q QU U)连连接接两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个极极值值点点与箱子相连接与箱子相连接该箱线图也称为该箱线图也称为Median/QuartMedian/Quart./Range/Range箱线图箱线图 第68页,讲稿共103张,创作于星期三未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小
45、值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图第69页,讲稿共103张,创作于星期三未分组数据未分组数据单批数据箱线图单批数据箱线图(例题分析例题分析)最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230
46、 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的Median/Quart./RangMedian/Quart./Rang箱线图箱线图箱线图箱线图第70页,讲稿共103张,创作于星期三分布的形状与箱线图分布的形状与箱线图 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQ L L L中位数中位数中位数中位数中位数中位数 Q QQU UULeft-skewed distributionLeft-s
47、kewed distributionLeft-skewed distribution右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UURight-skewed distributionRight-skewed distributionRight-skewed distribution对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UUBell-shaped distributionBell-shaped distributionBell-shaped dist
48、ribution第71页,讲稿共103张,创作于星期三未分组数据未分组数据多批数据箱线图多批数据箱线图 (例题分析例题分析)【例例例例】从从从从某某某某大大大大学学学学经经经经济济济济管管管管理理理理专专专专业业业业二二二二年年年年级级级级学学学学生生生生中中中中随随随随机机机机抽抽抽抽 取取取取11111111人人人人,对对对对 8 8 8 8门门门门主主主主要要要要课课课课程程程程的的的的考考考考试试试试成成成成绩绩绩绩进进进进行行行行调调调调查查查查,所所所所得得得得结结结结果果果果如如如如表表表表。试试试试绘绘绘绘制制制制各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的批批批批
49、比比比比较较较较箱箱箱箱线线线线图图图图,并并并并分分分分析析析析各各各各科科科科考考考考试试试试成成成成绩绩绩绩的分布特征的分布特征的分布特征的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746
50、87962818155787075687177第72页,讲稿共103张,创作于星期三未分组数据未分组数据多批数据箱线图多批数据箱线图(例题分析例题分析Median/Quart./Range)8 8门课程考试成绩的门课程考试成绩的门课程考试成绩的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图第73页,讲稿共103张,创作于星期三1111名学生名学生名学生名学生8 8门课程考试成绩的门课程考试成绩的门课程考试成绩的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图