数据的图表展示.pptx

上传人:莉*** 文档编号:73033301 上传时间:2023-02-15 格式:PPTX 页数:50 大小:544.65KB
返回 下载 相关 举报
数据的图表展示.pptx_第1页
第1页 / 共50页
数据的图表展示.pptx_第2页
第2页 / 共50页
点击查看更多>>
资源描述

《数据的图表展示.pptx》由会员分享,可在线阅读,更多相关《数据的图表展示.pptx(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、学习目标学习目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握分类和顺序数据的整理与显示方法掌握分类和顺序数据的整理与显示方法3.掌握数值型数据的整理与显示方法掌握数值型数据的整理与显示方法4.用用Excel,Spss作作频数分布表和频数分布表和图图形形5.合理使用统计图表合理使用统计图表第1页/共50页第一节第一节 数据的预处理数据的预处理1.数据审核2.数据筛选3.数据排序4.数据透视表第2页/共50页数据的审核数据的审核 原始数据原始数据二手数据二手数据完整性完整性准确性准确性逻辑检查逻辑检查计算检查计算检查适用适用 时效时效数据审核第3页/共50页数据筛选数据筛选(d

2、ata filter)数据筛选的内容数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的的数数据据予予以以剔剔除除将符合某种特定条件的数据筛选出来将符合某种特定条件的数据筛选出来表表3-1 83-1 8名学生的考试成绩数据名学生的考试成绩数据 用Excel进行数据筛选1.筛选出统计学成绩为75分的数据;2.统计成绩为前三名的学生;3.4门课程成绩都大于70分的学生第4页/共50页数据排序数据排序(data rank)u数据排序就是按一定顺序排列数据数据排序就是按一定顺序排列数据u作用作用:n发现趋势发现趋势n为分类或分组提供依据为分类或分组提供依据n直接利用排序

3、结果作分析直接利用排序结果作分析 u分类数据的排序n字母型数据n汉字型数据数值型数据的排序u数值型数据的排序n递 增 排 序:递 增 排 序 后 可 表 示 为:x(1)x(2)x(2)x(n)第5页/共50页数据透视表数据透视表(pivot table)u从复杂的数据中提取有用的信息从复杂的数据中提取有用的信息u对数据表中的重要信息按使用者的习惯或对数据表中的重要信息按使用者的习惯或分析要求进行汇总和作图分析要求进行汇总和作图u形成一个符合要求的交叉表形成一个符合要求的交叉表(列联表列联表)u在利用数据透视表时在利用数据透视表时,数据源表中的首行数据源表中的首行必须有列标题必须有列标题用Ex

4、cel创建数据透视表步骤见p50-51页第6页/共50页第二节第二节 数据的整理数据的整理统计数据的分类统计数据的分类分分分分类类类类的的的的数数数数据据据据顺顺顺顺序序序序的的的的数数数数据据据据数数数数值值值值型型型型数数数数据据据据分类整理分类整理分类整理分类整理分组整理分组整理分组整理分组整理第7页/共50页分类数据的整理分类数据的整理u基本过程基本过程n列出各类别列出各类别n计算各类别的频数计算各类别的频数n制作频数分布表制作频数分布表n用图形显示数据用图形显示数据 分类频数比例百分比比率ABCDEu可计算的统计量n频数(frequency)n比例(proportion)n百分比(p

5、ercentage)n比率(ratio)第8页/共50页分类数据频数分布表第9页/共50页顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量)1.累累积积频频数数(cumulative frequencies):各类别频数的逐级累加2.累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加 第10页/共50页顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1 非 常 不满意;2不满意;3一般;4满意;5非

6、常满意。表表3-3 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.0第11页/共50页顺序数据的频数分布表顺序数据的频数分布表(例题分

7、析例题分析)表表3-4 乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计合计300100.0第12页/共50页分组方法分

8、组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组数值型数据的整理数值型数据的整理第13页/共50页单变量值分组单变量值分组u要点要点:n 一个变量值一个变量值n 离散变量离散变量n 变量值较少变量值较少【例例】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。第14页/共50页单变量值分组表单变量值分组表 (实例)(实例)表表3-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131

9、14115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112第15页/共50页组距分组组距分组(要点要点)u要点要点:n一个区间一个区间n连续变量连续变量n变量值较多变量值较多n原则原则:“不重不漏不重不漏”n等距分组或不等距分组等距分组或不等距分组 u 概念n 下限(low limit)n 上限(upper limit)n 组距(class width)n 组中值(class midpoint)第16页/共50页组距分组的步骤1、确定组数:通常为5到15(20)组。St

10、urges 提出的经验公式:分组组数K应满足2 2、确定组距和各组界限,建议为、确定组距和各组界限,建议为5,105,10的倍数。的倍数。组距组距(最大值最大值 -最小值)最小值)组数组数 3 3、根据分组整理成频数分布表、根据分组整理成频数分布表 第17页/共50页等距分组表:上下组限间断某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105109110114115119120124125129130134135139358141064610162820128合计50100第18页/共50页等距分组表(上下组限重叠,上组限不在内)某车间50名工人日加工零件数分组表按零件数分

11、组频数(人)频率(%)105110110115115120120125125130130135135140358141064610162820128合计50100第19页/共50页等距分组表:(使用开口组)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110115115120120125125130130135135以上358141064610162820128合计50100第20页/共50页第三节数据展示第21页/共50页条条形形图图饼饼图图环环形形图图分类数据品质数据品质数据直直方方图图折折线线图图分组数据分组数据茎茎叶叶图图箱箱线线图图原始数据原始数据线线图

12、图时序数据时序数据雷雷达达图图多元数据多元数据数值型数据数值型数据数据的类型数据的类型气气泡泡图图顺序数据累累积积频频数数分分布布图图帕帕累累托托图图散散点点图图 一、常用统计图第22页/共50页条形图(Bar Chart)用宽度相同的条形高度或长短来表示数据变动的图形,条形的排列可以横排,也可以纵排。条形图有单式、复式等形式。2003年我国就业人员情况(万人)第23页/共50页圆形图(Pie Chart)也叫饼图,它是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于总体内部的结构,各组成部分所占比例等。2003年我国国内生产总值中各产业比重第24页/共50页顺序数据的图示顺序数据的图示累

13、计频数分布累计频数分布图图(例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布第25页/共50页直方图(Histogram)用来反映数量变量的分布状况。在统计分组的基础上,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。注意对不等距分组:纵轴必须表示为频数密度频数密度=频数

14、/组距(面积之和=总频数)手工绘制直方图时需要先对数据进行分组;用统计软件作直方图时统计软件可以自动进行分组。第26页/共50页直方图(等距分组)某会计师事务所对20家公司进行年终审计所需时间(天)的频数分布表审计时间(天)频数10-15415-20820-25525-30230-351合计20第27页/共50页直方图(不等距分组)某会计师事务所对20家公司进行年终审计所需时间(天)的频数分布表审计时间(天)频数频数密度10-1540.815-2081.620-255125-3530.3合计20-第28页/共50页直方图与条形图的异同都是用来反映数据的分布状况,适用于不同类型的数据。条形图是用

15、条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的。直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。直方图的各矩形通常是连续排列,条形图则是分开排列。第29页/共50页折线图(Frequency polygon)折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。组数越多,组据就越小,折线图就越光滑,逐渐形成一条

16、平滑的曲线,这就是频数分布曲线。第30页/共50页审计时间的折线图第31页/共50页主要用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。通常以数据的高位数值作树茎,低位数字作树叶,树叶上只保留一位数字。树叶的竖列要对齐,以计算各组的次数。原始数据:24,26,24,21,27,27,30,41,32,38从小到大排序后的数据:21,24,24,26,27,27,30,32,38,41茎叶图:3 0 2 84 12 1 4 4 6 7 7茎叶图茎叶图(Stem-and-Leaf Display)30第32页/共50页40名教师的年龄的数据:40,41,48,51

17、,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64 Stem-and-Leaf Plot Frequency Stem&Leaf 9.00 2.677888999 4.00 3.3344 8.00 3.55566679 1 0.00 4.0011222233 3.00 4.588 4.00 5.0112 1.00 5.5 1.00 Extremes (=64)Stem width:10.00 Each leaf:1 case(s)

18、SPSS Statistics生成的一个茎叶图第33页/共50页线图(Line Chart)利用线形的升降起伏来表现描述的变量在一段时期内的变动情况,主要用于显示时间数列的数据。1996年-2003年城乡居民人民币储蓄存款年底余额 第34页/共50页箱线图箱线图8 8门课程考试成绩的箱线图门课程考试成绩的箱线图未分组的原始数据的分布未分组的原始数据的分布构成构成:5:5个特征值、一个箱子、两条线段个特征值、一个箱子、两条线段第35页/共50页1.显示多个变量的图示方法显示多个变量的图示方法2.在显示或对比各变量的数值总和时十分有用在显示或对比各变量的数值总和时十分有用3.假假定定各各变变量量的

19、的取取值值具具有有相相同同的的正正负负号号,总总的的绝绝对值与图形所围成的区域成正比对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度可用于研究多个样本之间的相似程度雷达图雷达图(radar chart)0.11101001000指标1指标2指标3指标4指标5上游中游下游图3-16 河流污染指标雷达图 第36页/共50页二、绘制统计图时的注意事项1、通过选择恰当的图形类型、刻度、长宽比例等,使图形能够准确反映数据中包含的信息。时间一般绘在横轴,指标数据绘在纵轴。长宽比例要适当 ,其长宽比例大致为10:7。一般情况下,纵轴数据下端应从“0”开始。数据与“0”之间的间距过大时,可以采

20、取折断的符号将纵轴折断。第37页/共50页绘制统计图时的注意事项2、图形要尽量简明。图形应该突出所要传达的信息,不必要的标签、背景、网格线、等会分散读者的注意力。3、图形应该有清楚的标题和必要的说明,明确图形的含义、计量单位、坐标轴代表的变量、资料来源等等。4、反复加工和修改是获得优秀统计图形的重要步骤。第38页/共50页下图增长速度惊人。上图增长速度缓慢。不恰当的统计图形举例:纵横比例第39页/共50页 不必要的三维效果:三维图形可能比二维图形更能吸引读者的注意,但只能用来反映变化的趋势,不能用来进行精确的比较。不恰当的统计图形举例:三维效果第40页/共50页不恰当的统计图形举例:图形类型1

21、960:$1.001970:$1.601980:$3.101990:$3.80Minimum Wage不好的图形好的图形Minimum Wage0241960197019801990$第41页/共50页不恰当的统计图形举例:压缩纵轴Quarterly Sales不好的图形0100200Q1Q2Q3Q4$好的图形Quarterly Sales02550Q1Q2Q3Q4$第42页/共50页不恰当的统计图形举例:纵轴无零点好的图形Monthly Sales不好的图形36394245JFMA M J$Monthly Sales 0394245JFMAMJ$36第43页/共50页三、合理使用统计表一.鉴

22、别图形优劣的准则二.统计表的设计第44页/共50页统计表的结构统计表的结构19992000年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1999年年 2000年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元元元元元 40044 3.14 1.77 56.43 1.77 5888.77 5854.02 4615.91 4222.0 3.13

23、 1.68 53.67 1.86 6316.81 6279.98 4998.00资料来源:资料来源:中国统计年鉴中国统计年鉴2001,中国统计出版社,中国统计出版社,2001,第,第305页。页。注:本表为城市和县城的城镇居民家庭抽样调查材料。注:本表为城市和县城的城镇居民家庭抽样调查材料。行行标标题题列列标标题题数数字字资资料料表头表头附附加加第45页/共50页统计表的设计统计表的设计(比较与选用比较与选用)第46页/共50页统计表的设计统计表的设计(比较与选用比较与选用)第47页/共50页统计表的设计统计表的设计(比较与选用比较与选用)第48页/共50页小结:统计数据的分组和频数分布;条形图、圆形图、直方图、线图,茎叶图的绘制和应用统计表的构成绘制统计图表的注意事项第49页/共50页感谢您的观看!第50页/共50页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁