统计学数据的图表展示.pptx

上传人:莉*** 文档编号:80107592 上传时间:2023-03-22 格式:PPTX 页数:81 大小:1.10MB
返回 下载 相关 举报
统计学数据的图表展示.pptx_第1页
第1页 / 共81页
统计学数据的图表展示.pptx_第2页
第2页 / 共81页
点击查看更多>>
资源描述

《统计学数据的图表展示.pptx》由会员分享,可在线阅读,更多相关《统计学数据的图表展示.pptx(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法用Excel作频数分布表和图形合理使用图表学习目标本章学习目标第1页/共81页3.1 数据的预处理第2页/共81页数据审核l检查数据中的错误数据筛选l找出符合条件的数据数据排序l升序和降序l寻找数据的基本特征数据透视l按需要汇总数据的预处理第3页/共81页数据审核数据排序数据筛选数据透视表1234第4页/共81页数据审核原始数据(raw data)1.完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全2.准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等

2、第5页/共81页数据的审核二手数据(second hand data)1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要2.时效性审核尽可能使用最新的数据3.确认是否有必要做进一步的加工整理第6页/共81页数据审核数据排序数据筛选数据透视表1234第7页/共81页数据筛选(data filter)1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除第8页/共81页数据筛选(data

3、 filter)8 8名学生的考试成绩数据名学生的考试成绩数据 用Excel进行数据筛选第9页/共81页数据审核数据排序数据筛选数据透视表1234第10页/共81页数据排序1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成第11页/共81页1.分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序递增排序:设一组数据为x1,x2,xn,

4、递增排序后可表示为:x(1)x(2)x(2)x(n)数据排序第12页/共81页数据审核数据排序数据筛选数据透视表1234第13页/共81页数据透视表(pivot table)1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题第14页/共81页数据透视表(pivot table),使用EXCEL第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导3步

5、骤之3】中选择数据透视表的输出位置。然后选择【布局】第5步:在【向导布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”第6步:然后单击【确定】,自动返回【向导3步骤之3】对话框。然后单击【完成】,即可输出数据透视表 第15页/共81页3.2 品质数据的整理与显示第16页/共81页数据的整理与显示(基本问题)1.要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法2.对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法

6、并不适合于低层次的数据第17页/共81页分类数据的整理与图示顺序数据的整理与图示12第18页/共81页分类数据的整理(基本过程)分类分类分类分类频数频数频数频数比例比例比例比例百分比百分比百分比百分比比率比率比率比率A AB BC CD DE E1.列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据第19页/共81页分类数据的整理(可计算的统计量)1.频数(frequency):落在各类别中的数据个数2.比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值个数

7、的比值第20页/共81页分类数据整理频数分布表(例题分析)用Excel制作频数分布表【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。右边就是记录的原始数据第21页/共81页分类数据整理频数分布表(例题分析)第22页/共81页分类数据整理频数分布表(例题分析)第23页/共81页分类数据整理频数分布表(例题分析)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类

8、别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(column chart)第24页/共81页分类数据的图示对比条形图(side-by-side bar chart)1.分类变量在不同时间或不同空间上有多个取值2.对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑品牌一季度二季度联想256468IBM285397康柏247328戴尔563688第25页/共81页分类数据的图示对比条形图(例题分析)第26页/共81页分类数据的图示帕累托图(pareto chart)1.按各类别数据出现的频数多少排序后绘制的柱形图 2.主要用于展示分类数据的分布第27页/共81页分类数据的图示帕累

9、托图(pareto chart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定第28页/共81页分类数据的图示饼图(例题分析)第29页/共81页分类数据的整理与图示顺序数据的整理与图示12第30页/共81页 1.1.累积频数(cumulative frequencies):各类别频数的逐级累加2.2.累积频率(cumulative percentages):各类别频率(百分比)的逐级累加

10、顺序数据的整理(可计算的统计量)第31页/共81页顺序数据的频数分布表(例题分析)【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”1非常不满意;2不满意;3一般;4满意;5非常满意。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满

11、意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.0第32页/共81页顺序数据的频数分布表(例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%)非常不满意 不满意 一般 满意 非常满意2199786438 7.033.026.021.312.7 21120198262300 7

12、.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计300100.0第33页/共81页顺序数据的频数分布表(例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布第34页/共81页环形图(doughnut chart)1.环形图中间有一个“空洞”

13、,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究 4.用于展示分类和顺序数据第35页/共81页8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价环形图(例题分析)第36页/共81页3.3数值型数据的整理与显示第37页/共81页数据分组数值型数据的图示12第38页/共81页组距分组(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4

14、.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组第39页/共81页组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K 152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即3.组距(最大值-最小值)组数4.统计出各组的频数并整理成频数分布表 第40页/共81页组距分组(几个概念)下限(lower limit):一个组的最小值上限(upper limit):一个组的最大值组距(class width):上限与下限之差组中值(class midpoin

15、t):下限与上限之间的中点值第41页/共81页频数分布表的编制(例题分析)【例例】某某 电电脑脑 公公 司司 连连 续续个个 月月 各各 天天 的的销销售售量量数数据据(单单位位:台台)。试试 对对 数数 据据 进进行分组行分组第42页/共81页等距分组表(上下组限重叠)第43页/共81页等距分组表(上下组限间断)第44页/共81页等距分组表(使用开口组)第45页/共81页数据分组数值型数据的图示12第46页/共81页Excel分组数据直方图和折线图直方图和折线图第47页/共81页分组数据直方图(histogram)用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的

16、面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图第48页/共81页分组数据的图示(直方图的绘制)14140 015150 021210 0某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间间的的天天数数最最多多!19190 020200 018180 016160 017170 0频频频数数数(天天天)25252020151510105 5303022220 023230 024240 0第49页/共81页1.条形图是用条形的长度(横置时)

17、表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据分组数据直方图(直方图与条形图的区别)第50页/共81页STATISTICASTATISTICA未分组数据茎叶图和箱线图未分组数据茎叶图和箱线图第51页/共81页1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数

18、字5.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据茎叶图和箱线图第52页/共81页某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图未分组数据茎叶图(例题分析)第53页/共81页未分组数据单批数据箱线图(箱线图的构成)1.用于显示未分组的原始数据的分布2.由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU

19、)连接两个四分位数画出箱子,再将两个极值点与箱子相连接该箱线图也称为Median/Quart./Range箱线图 第54页/共81页中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图未分组数据箱线图(box plot)第55页/共81页最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数19

20、7197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的Median/Quart./RangMedian/Quart./Rang箱线图箱线图未分组数据单批数据箱线图(例题分析)第56页/共81页 不同分布的箱线图不同分布的箱线图左偏分布左偏分布左偏分布Q QQ L L L中位数中位数中位数 Q QQU UULeft-skewed dist

21、ributionLeft-skewed distributionLeft-skewed distribution右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数 Q QQU UURight-skewed distributionRight-skewed distributionRight-skewed distribution对称分布对称分布对称分布Q QQL LL中位数中位数中位数 Q QQU UUBell-shaped distributionBell-shaped distributionBell-shaped distribution分布的形状与箱线图第57页/共81页【例

22、】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786

23、69073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据多批数据箱线图(例题分析)第58页/共81页未分组数据多批数据箱线图(例题分析9Median/Quart./Range)8 8门课程考试成绩的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图第59页/共81页未分组数据多批数据箱线图(例题分析Median/Quart./Range)1111名学生名学生8 8门课程考试成

24、绩的门课程考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图min-max25%-75%median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11第60页/共81页时间序列数据线图Excel数值型数据的图示第61页/共81页时间序列数据线图(line plot)1.表示时间序列数据趋势的图形2.时间一般绘在横轴,数据绘在纵轴3.图形的长宽比例大致为10:74.一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断第62页/共8

25、1页时间序列数据线图(例题分析)【例例】我国我国1991199120032003年城乡居民家年城乡居民家庭的人均收入庭的人均收入数据如表。试数据如表。试绘制线图绘制线图¥1991199120032003年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民(元元)农村居民农村居民(元元)19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.8847

26、2.2 708.6 784.0 921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2第63页/共81页时间序列数据线图(例题分析)第64页/共81页多变量数据的图示Excel数值型数据的图示第65页/共81页两个变量间的关系二维散点图(2D Scatterplots)1.展示两个变量之间的关系2.用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图温度温度/0C降雨量降雨量/mm产量产量/kg/hm26252250840

27、3450105845001368575014110580016987500211208250第66页/共81页两个变量间的关系二维散点图(2D Scatterplots)第67页/共81页1.显示三个变量之间的关系2.图中数据点的大小依赖于第三个变量三个变量间的关系气泡图(bubble chart)第68页/共81页1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用4.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比5.可用于研究多个样本之间的相似程度多变量数据雷达图(radar chart)第69页/共81页设

28、有n组样本S1,S2,,Sn,每个样本测得P个变量X1,X2,,XP,要绘制这P个变量的雷达图,其具体做法是:先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图多变量数据雷达图(雷达图的制作)第70页/共81页多变量数据雷达图(例题分析)【例】2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图今天的今天的主食是主食是面包面包20032003年城乡居

29、民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成年城乡居民家庭平均每人生活消费支出构成(%)(%)项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务37.129.796.307.3111.0814.3510.743.30 45.595.674.205.968.3612.1315.872.21第71页/共81页多变量数据雷达图(例题分析)第72页/共81页数据类型及图示(小结)数据

30、类型数据类型品质数据品质数据汇总表汇总表条形图条形图饼图饼图环形图环形图数值型数据数值型数据原始数据原始数据茎叶图茎叶图箱线图箱线图分组数据分组数据直方图直方图折线图折线图时序数据时序数据线图线图多元数据多元数据散点图散点图气泡图气泡图雷达图雷达图第73页/共81页3.4合理使用图表第74页/共81页鉴别图形优劣的准则统计表的设计12第75页/共81页鉴别图表优劣的准则一张好的图表应包括以下基本特征l显示数据l让读者把注意力集中在图表的内容上,而不是制作图表的程序上l避免歪曲l强调数据之间的比较l服务于一个明确的目的l有对图表的统计描述和文字说明第76页/共81页5种鉴别图表优劣的准则:一张好

31、的图表应当l精心设计、有助于洞察问题的实质l使复杂的观点得到简明、确切、高效的阐述l能在最短的时间内以最少的笔墨给读者提供最大量的信息l是多维的l表述数据的真实情况鉴别图表优劣的准则第77页/共81页统计表的结构2002200220032003年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位2002年年 2003年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收

32、入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%人人元元元元元元453173.041.5851.971.928177.407702.806029.88480283.011.5852.491.919061.228472.206510.94资料来源:资料来源:中国统计年鉴中国统计年鉴20042004,中国统计出版社,中国统计出版社,20042004,第,第359359页。页。注:本表为城市和县城的城镇居民家庭抽样调查资料。注:本表为城市和县城的城镇居民家庭抽样调查资料。行行标标题题列列标标题题数数字字资资料料表头表头附附加加第78页/共81页l合理安排统计表的结构l总标题内容应满足3W 要求l数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明l表中的上下两条横线一般用粗线,其他线用细线l通常情况下,统计表的左右两边不封口l表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一l对于没有数字的表格单元,一般用“”表示l必要时可在表的下方加上注释统计表的设计第79页/共81页了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法用Excel作频数分布表和图形合理使用图表本章小结本章小结第80页/共81页感谢您的观看!第81页/共81页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁