《用图表展示数据.pptx》由会员分享,可在线阅读,更多相关《用图表展示数据.pptx(55页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 2 章 用图表展示数据2.12.1 用图表展示定性数据用图表展示定性数据 2.2 2.2 用图表展示定量数据用图表展示定量数据 2.3 2.3 合理使用图表合理使用图表第1页/共55页2008年8月学习目标l定性数据的频数分布表l定性数据的图示方法l定量数据的频数分布表l定量数据的图示方法l用Excel和SPSS作频数分布表和图形l合理使用图表第2页/共55页2008年8月男学生更容易逃课吗?读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样
2、与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下 第3页/共55页2008年8月男学生更容易逃课吗?逃课情况逃课情况男男女女合计合计几乎一次不逃几乎一次不逃2849771到到3次次2431553到到5次次64105次以上次以上336其他其他123合计合计6289151你你认认为为男男学学生生更更容容易易逃逃课课吗吗?用用哪哪些些简简单单的的统统计计描描述述支支持持你你的的看看法法?如如果果要要用用
3、图图形形表表现现上上面面的的数数据据,反反映映男男女女学学生生逃逃课课方方面面的的差差异异、逃逃课课次次数数的的构构成成以以及及男男女女学学生生在在逃逃课课方方面面是是否否具具有有相相似似性性等等等等,有有哪哪些些图图形形可可供供你你选选择择使用呢?使用呢?第4页/共55页2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示第 2 章 用图表展示数据第5页/共55页2.1.1 生成频数分布表2.1 用图表展示定性数据第6页/共55页2008年8月生成频数分布表(定性数据)1.列出各类别 2.2.计算各类别的频数3.生成频数分布表分类分类频数频数比例比例百分比百分比
4、比率比率ABCDE第7页/共55页2008年8月生成频数分布表(定性数据)【例例】一一家家市市场场调调查查公公司司为为研研究究不不同同类类型型饮饮料料的的市市场场占占有有率率,对对随随机机抽抽取取的的一一家家超超市市进进行行调调查查。下下面面的的表表是是调调查查员员随随机机观观察察的的5050名名顾顾客客购购买买的的饮饮料料类类型型记记录录。生生成成一一张张频频数数分分布布表表,观观察察不不同同类类型型饮饮料料的的销销售售分布状况分布状况 用Excel制作频数分布表第8页/共55页2008年8月使用Excel数据透视表数计数(pivot table)第1步:选择【数据】菜单中的【数据透视表和数
5、据透视图】第2步:确定数据源区域第4步:在【向导3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】第5步:在【向导布局】对话框中,依次将“分类变量“(这里 是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至“数据”区域第6步:然后单击【确定】,自动返回【向导3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表用数据透视表产生定性数据的频数分布用数据透视表产生定性数据的频数分布第9页/共55页2008年8月生成频数分布表(定性数据)不同类型饮料的频数分布不同类型饮料的频数分布 第10页/共55页2008年8月定性数据的描述统计量1.频数(frequency):落在各类别
6、中的数据个数2.比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值个数的比值第11页/共55页2.1.2 定性数据的图示2.1 用图表展示定性数据第12页/共55页2008年8月条形图(bar Chart)1.用 宽 度 相同 的 条 形的 高 度 或长 短 来 表示 各 类 别数据2.各 类 别 可放在纵轴,称 为 条 形图,可 以放在横轴,称 为 柱 形图(column chart)第13页/共55页2008年8月帕累托图(pareto chart)1.按各类别数据出现
7、的频数多少排序后绘制的柱形图 2.用于展示分类数据的分布第14页/共55页2008年8月饼图 (pie Chart)1.用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数 据 的 比 例用于研究结构问题第15页/共55页2008年8月环形图(doughnut chart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究 第16页/共55页2008年8月环形图(d
8、oughnut chart)【例例】20062006年年北北京京、上上海海和和天天津津地地区区按按收收入入法法计计算算的的地地区区生生产产总总值值(按按当当年年价价格格计计算算)数数据据。绘绘制制环环形形图比较三个地区的生产总值构成图比较三个地区的生产总值构成 第17页/共55页2008年8月环形图(doughnut chart)北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值第18页/共55页2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示第 2 章 用图表展示数据第19页/共55页2.2.1 生成频数分布表2.1
9、 用图表展示定性数据第20页/共55页2008年8月生成频数分布表(例题分析)【例例】某某电电脑脑公公司司20082008年年前前4 4个个 月月 各各 天天 的的销销售售量量数数据据(单单位位:台台)。生生成成一一张张频频数数分分布布表表观观察察销销售售额额分布的特征分布的特征 第21页/共55页2008年8月生成频数分布表(例题分析)1.确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距
10、(最大值-最小值)组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 3.统计出各组的频数。每个组的数据满足axb(上限值不在内 第22页/共55页2008年8月分组中的几个概念1.下限(lower limit):一个组的最小值2.上限(upper limit):一个组的最大值3.组距(class width):上限与下限之差4.组中值(class midpoint):下限与上限之间的中点值下限值下限值+上限值上限值2 2组中值组中值 =用Exc
11、el制作频数分布第23页/共55页2008年8月生成频数分布表(例题分析)某电脑公司销售额的频数分布 第24页/共55页2008年8月生成频数分布表(例题分析使用开口组)第25页/共55页2008年8月使用Excel频数函数(FREQUENCY)Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改变任何一个数据时,频数分布表和直方图不会跟着改变使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是选择与接受区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域,在【
12、Bins-array】后输入接受区域同时按下“ctrl-shift-Enter”组合键,即得到频数分布统计函数统计函数FREQUENCYFREQUENCY第26页/共55页2.2.2 定量数据的图示2.1 用图表展示定性数据Excel第27页/共55页2008年8月分组数据看分布直方图(histogram)1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图4.直方图下的总面积等于1用用ExcelExcel制作直方图制作直方图 第28页/共55
13、页2008年8月用SPSS绘制直方图 第1步:选择【Graphs】下拉菜单,并选择 【histogram】选项进入主对话框第2步:在主对话框中将变量选入【Variables】,点击【OK】用用SPSSSPSS绘制直方图绘制直方图 第29页/共55页2008年8月分组数据看分布直方图(SPSS绘制的直方图)第30页/共55页2008年8月分组数据看分布直方图(直方图与条形图的区别)1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列3.条形图主要用于展示定性数据,而直方图则主要用于展示定量
14、数据第31页/共55页2008年8月未分组数据看分布茎叶图(stem-and-leaf plot)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字6.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据第32页/共55页2008年8月用SPSS绘制茎叶图和箱线图(包括直方图)第1步:选择【Analyze】下拉菜单,并选择 【Des
15、criptive statistics-Explore】选项进入主对话框第2步:在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可选【Histogram】以 给出直方图)。点击【Continue】回到主对话 框。点击【OK】用用SPSSSPSS绘制茎叶图绘制茎叶图第33页/共55页2008年8月未分组数据看分布茎叶图(例题分析)第一列给出每个茎上叶子的频数第二列是“茎”,第三列是“叶”下 面 标 出 了 1个极端值237、茎的宽度10、每个叶代表一个数据(案例)SPSS自 动 将 每个茎重复了一次,使分布的细节看的更清楚一
16、些。当然,在数据较少时茎的数值也可以不重复 第34页/共55页2008年8月未分组数据看分布箱线图(box plot)1.用于显示未分组的原始数据的分布2.箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 3.绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接第35页/
17、共55页2008年8月未分组数据看分布箱线图(箱线图的构成)中位数中位数4681012Q75%75%Q25%25%XMaxMaxXMinMinMedian/Quart./RangeMedian/Quart./Range箱线图箱线图第36页/共55页2008年8月未分组数据看分布箱线图(例题分析)最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数18218218225%25%25%四分位数四分位数四分位数170.25170.25170.2575%75%75%四分位数四分位数四分位数197197197140 150 160 170 180 190 200 2
18、10 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的某电脑公司销售额数据的Median/Quart./RangMedian/Quart./Rang箱线图箱线图第37页/共55页2008年8月分布的形状与箱线图不同分布的箱线图不同分布的箱线图对称分布对称分布对称分布Bell-shaped distributionBell-shaped distributionBell-shaped distributionLeft-skewed
19、 distributionLeft-skewed distributionLeft-skewed distribution左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布Right-skewed distributionRight-skewed distributionRight-skewed distribution第38页/共55页2008年8月未分组数据看分布多批数据箱线图(例题分析)【例例】从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取1111人人,对对 8 8门门 主主要要课课程程的的考考试试成成绩绩进进行行调调查查,所所得得结结果果如如表表。试试绘
20、绘制制各各科科考考试试成成绩绩的的批批比比较较箱箱线线图图,并并分分析析各各科科考考试试成成绩绩的的分分布布特特征征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608
21、7816786918377769070828382928481706972787578918866948085718674687962818155787075687177第39页/共55页2008年8月用SPSS绘制多批数据箱线图 第1步:选择【Graphs】下拉菜单,并选择【Boxplot】第2步:在出现的对话框中选择【Simple】,在 【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】返回主对话框第3步:在主对话框将所有变量(这里是11个学生)选入 【Boxes Represent】,将“课程名称”选入 【L
22、abel Cases by】。点击【OK】用用SPSSSPSS绘制箱线图绘制箱线图第40页/共55页2008年8月未分组数据多批数据箱线图(例题分析Median/Quart./Range)8 8门课程考试成绩的箱线图门课程考试成绩的箱线图第41页/共55页2008年8月1111名学生考试成绩的名学生考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图未分组数据多批数据箱线图(SPSS绘制的箱线图)第42页/共55页2008年8月两个变量间的关系二维散点图(2D Scatterplots)1.展 示 两 个 变量 之 间 的 关系2.用 横 轴 代
23、表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系 中 用 一 个点表示,n组数 据 在 坐 标系中形成的n个 点 称 为 散点,由 坐 标及 其 散 点 形成 的 二 维 数据图第43页/共55页2008年8月两个变量间的关系二维散点图(2D Scatterplots)第44页/共55页2008年8月1.如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(Overlay Scatter)(注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较)2.比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同
24、的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴3.也可以绘制散点图矩阵(Matrix Scatter)两个变量间的关系重叠散点图(用SPSS绘制重叠散点图)第45页/共55页2008年8月用SPSS绘制重叠散点图(Overlay Scatter)第1步:选择【Graphs】下拉菜单,并选择 【Scatter/Dot】点击【Define】第2步:将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”),点击【OK】用用SPSSSPSS绘制重叠散点图绘制重叠散点图第46页/共55页2008年8月两个变量间的关系重叠散点图(
25、Overlay Scatter)第47页/共55页2008年8月1.也称为蜘蛛图(spider chart)2.从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图3.可用于研究多个样本之间的相似程度比较多个样本的相似性 雷达图(radar chart)第48页/共55页2008年8月多变量数据雷达图(例题分析)【例例】20062006年年我我国国东东部部、中中部部、西西部部及及东东北北地地区区城城镇镇居居民民的的生生活活消消费费支支出出数数据据如如表表2828所所示示。绘绘制制雷雷达达图图,比比较较不不同同地地区区的的消消费费支支
26、出出构成构成 第49页/共55页2008年8月多变量数据雷达图(例题分析)第50页/共55页2.3 合理使用图表第 2 章 用图表展示数据第51页/共55页2008年8月1.一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明2.5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况鉴别图表优劣的准则第52页/共55页2008年8月本章小结l定性数据的频数分布表l定性数据的图示方法l定量数据的频数分布表l定量数据的图示方法l用Excel和SPSS作频数分布表和图形l合理使用图表第53页/共55页结 束第54页/共55页2008年8月感谢您的观看!第55页/共55页