数据的整理与显.ppt

上传人:wuy****n92 文档编号:64355842 上传时间:2022-11-29 格式:PPT 页数:97 大小:1.13MB
返回 下载 相关 举报
数据的整理与显.ppt_第1页
第1页 / 共97页
数据的整理与显.ppt_第2页
第2页 / 共97页
点击查看更多>>
资源描述

《数据的整理与显.ppt》由会员分享,可在线阅读,更多相关《数据的整理与显.ppt(97页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、3-1统计学统计学(statistics)第第 3 章章 数据的整理与显示数据的整理与显示统计学3-2统计学统计学(statistics)第第 3 章章 数据的整理与显示数据的整理与显示3.1 3.1 数据的预处理数据的预处理 3.2 3.2 统计分组与频数分布统计分组与频数分布3.3 3.3 统计图统计图3.4 3.4 统计表统计表3-3统计学统计学(statistics)学习目标学习目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握统计分组的方法掌握统计分组的方法3.掌握品质数据的整理与图示方法掌握品质数据的整理与图示方法4.掌握数值型数据的整理与图示方法掌握数值型数据的

2、整理与图示方法5.用用Excel作作频数分布表和统计图频数分布表和统计图6.合理使用统计表合理使用统计表3-4统计学统计学(statistics)3.1 数据的预处理数据的预处理一一.数据审核数据审核二二.数据筛选数据筛选三三.数据排序数据排序3-5统计学统计学(statistics)数据的预处理数据的预处理1.数据的审核数据的审核数据的审核数据的审核检查数据中的错误检查数据中的错误检查数据中的错误检查数据中的错误2.数据的筛选数据的筛选数据的筛选数据的筛选找出符合条件的数据找出符合条件的数据找出符合条件的数据找出符合条件的数据3.数据排序数据排序数据排序数据排序升序和降序升序和降序升序和降序

3、升序和降序寻找数据的基本特征寻找数据的基本特征寻找数据的基本特征寻找数据的基本特征3-6统计学统计学(statistics)一、数据审核3-7统计学统计学(statistics)数据审核数据审核原始数据原始数据(raw data)审核的内容审核的内容1.完整性审核完整性审核n n应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏应调查的单位或个体是否有遗漏n n调查项目或指标是否填写齐全调查项目或指标是否填写齐全调查项目或指标是否填写齐全调查项目或指标是否填写齐全2.准确性审核准确性审核n n内容是否真实反映客观实际情况内容是否真实反映客观实际情况内容是否真实

4、反映客观实际情况内容是否真实反映客观实际情况n n是否有错误:逻辑检查、计算检查是否有错误:逻辑检查、计算检查是否有错误:逻辑检查、计算检查是否有错误:逻辑检查、计算检查3-8统计学统计学(statistics)数据的审核数据的审核二手数据二手数据(second hand data)1.适用性审核适用性审核n n数据的来源、口径以及有关的背景材料数据的来源、口径以及有关的背景材料数据的来源、口径以及有关的背景材料数据的来源、口径以及有关的背景材料n n数据是否符合自己分析研究的需要数据是否符合自己分析研究的需要数据是否符合自己分析研究的需要数据是否符合自己分析研究的需要2.时效性审核时效性审核

5、n n最新的数据最新的数据最新的数据最新的数据3.确认是否要做进一步的加工整理确认是否要做进一步的加工整理3-9统计学统计学(statistics)二、数据筛选二、数据筛选3-10统计学统计学(statistics)数据筛选数据筛选(data filter)数据筛选的内容包括数据筛选的内容包括将将将将某某某某些些些些不不不不符符符符合合合合要要要要求求求求的的的的数数数数据据据据或或或或有明显错误的数据予以剔除有明显错误的数据予以剔除有明显错误的数据予以剔除有明显错误的数据予以剔除将将将将符符符符合合合合某某某某种种种种特特特特定定定定条条条条件件件件的的的的数数数数据据据据筛选出来筛选出来筛

6、选出来筛选出来3-11统计学统计学(statistics)用用用用ExcelExcel进行数据筛选进行数据筛选进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选数据筛选(data filter)【例】【例】【例】【例】8 8名学生名学生名学生名学生4 4门课程的考试成绩数据。找出统计学门课程的考试成绩数据。找出统计学门课程的考试成绩数据。找出统计学门课程的考试成绩数据。找出统计学成绩等于成绩等于成绩等于成绩等于7575分的学生,英语成绩最高的前分的学生,英语成绩最高的前分的学生,英语成绩最高的前分的学生,英语成绩最高的前3

7、 3名学生,名学生,名学生,名学生,4 4门课程成绩都大于门课程成绩都大于门课程成绩都大于门课程成绩都大于7070分的学生。分的学生。分的学生。分的学生。3-12统计学统计学(statistics)三、数据排序3-13统计学统计学(statistics)数据排序数据排序(data rank)1.将将数数据据按按一一定定顺顺序序排排列列,以以发发现现一一些些明明显的特征或趋势。显的特征或趋势。2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新归类或分组等提供依据新归类或分组等提供依据3.在在某某些些场场合合,排排序序本本身身就就是是分分析析的的目目的的之一之一3-14统计学

8、统计学(statistics)数据排序数据排序(方法方法)1.分类数据的排序分类数据的排序字母型数据:升序、降序。字母型数据:升序、降序。汉汉字字型型数数据据:按按首首位位拼拼音音字字母母排排列列,或或按笔画多少排序。按笔画多少排序。2.数值型数据的排序数值型数据的排序n n递增排序:递增排序:x(1)x(2)x(2)x(n)3-15统计学统计学(statistics)用用Excel进行数据排进行数据排序序 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据排序数据排序(方法方法)3-16统计学统计学(statistics)3.2 统计分组与频数分布统

9、计分组与频数分布一一.统计分组统计分组二二.频数分布频数分布3-17统计学统计学(statistics)一、统计分组的概念及方法一、统计分组的概念及方法(一)统计分组的概念(一)统计分组的概念(一)统计分组的概念(一)统计分组的概念 根据统计研究的目的和客观现象的内在特点,根据统计研究的目的和客观现象的内在特点,根据统计研究的目的和客观现象的内在特点,根据统计研究的目的和客观现象的内在特点,按照一定的按照一定的按照一定的按照一定的标志标志标志标志把被研究总体划分为若干个性质不把被研究总体划分为若干个性质不把被研究总体划分为若干个性质不把被研究总体划分为若干个性质不同但又有联系的组,称为统计分组

10、。同但又有联系的组,称为统计分组。同但又有联系的组,称为统计分组。同但又有联系的组,称为统计分组。3-18统计学统计学(statistics)(二)统计分组的方法统计分组的方法1 1、按品质标志分组按品质标志分组按品质标志分组按品质标志分组 :按研究对象的某种按研究对象的某种按研究对象的某种按研究对象的某种属性特征属性特征属性特征属性特征分组分组分组分组(1 1)简简简简单单单单分分分分组组组组:人人人人口口口口按按按按性性性性别别别别分分分分组组组组,企企企企业业业业按按按按行行行行业业业业分分分分组组组组,学生按专业分组等等学生按专业分组等等学生按专业分组等等学生按专业分组等等 3-19统

11、计学统计学(statistics)(二)统计分组的方法(2 2)复合分组:对总体按两个或两个以上的标志)复合分组:对总体按两个或两个以上的标志)复合分组:对总体按两个或两个以上的标志)复合分组:对总体按两个或两个以上的标志进行的重叠式分组。进行的重叠式分组。进行的重叠式分组。进行的重叠式分组。例如,我国把社会经济部门分为第一产业、第二产例如,我国把社会经济部门分为第一产业、第二产例如,我国把社会经济部门分为第一产业、第二产例如,我国把社会经济部门分为第一产业、第二产业、第三产业,第一产业又可分为农、林、牧、业、第三产业,第一产业又可分为农、林、牧、业、第三产业,第一产业又可分为农、林、牧、业、

12、第三产业,第一产业又可分为农、林、牧、渔业。渔业。渔业。渔业。3-20统计学统计学(statistics)复合分组表 3-21统计学统计学(statistics)(二)统计分组的方法2、按按数数量量标标志志分分组组:按按表表现现总总体体数数量量特特征征的标志进行分组的标志进行分组。例如,人口按年龄分组、企业按销售额分组等例如,人口按年龄分组、企业按销售额分组等(1 1)单项式分组:每组变量值是一个值单项式分组:每组变量值是一个值(2 2)组组距距式式分分组组:每每组组变变量量值值是是一一个个区区间。间。3-22统计学统计学(statistics)某车间工人产量分组表某车间工人产量分组表单项式分

13、组单项式分组3-23统计学统计学(statistics)某地区某地区某地区某地区120120家企业按利润分组表家企业按利润分组表家企业按利润分组表家企业按利润分组表组距式分组组距式分组3-24统计学统计学(statistics)二、频数分布二、频数分布3-25统计学统计学(statistics)频数分布的概念频数分布的概念1.频数频数(frequency):落在某一组中的数据个落在某一组中的数据个数数2.频数分布频数分布(frequency distribution):把各:把各个组及其相应的频数全部列出,并用表格形个组及其相应的频数全部列出,并用表格形式表现出来,称为频数分布。式表现出来,称

14、为频数分布。3.比率比率(ratio):各组次数与总次数之比。:各组次数与总次数之比。4.百分比百分比(percentage):将比率乘以将比率乘以100得得到的值到的值3-26统计学统计学(statistics)(一)品质数据的频数分布(一)品质数据的频数分布分类分类分类分类频数频数频数频数比例比例比例比例百分比百分比百分比百分比比率比率比率比率A AB BC CD DE E3-27统计学统计学(statistics)1、分类数据的频数分布表、分类数据的频数分布表(1)列出各类别)列出各类别 (2 2)计算各类别的频数计算各类别的频数(3)生成频数分布表)生成频数分布表分类分类分类分类频数频

15、数频数频数比例比例比例比例百分比百分比百分比百分比比率比率比率比率A AB BC CD DE E3-28统计学统计学(statistics)1、分类数据整理、分类数据整理频数分布表频数分布表(例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名

16、名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就就就就是是是是记记记记录录录录的的的的原原原原始始始始数数数数据据据据 制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品3-29统计学统计学(statistics)分类数据整理分类数据整理频数

17、分布表频数分布表3-30统计学统计学(statistics)2、顺序数据的整理、顺序数据的整理(可计算的指标可计算的指标)(1 1)累累累累积积积积频频频频数数数数(cumulative cumulative frequenciesfrequencies):各各各各类类类类别别别别频频频频数的逐级累加数的逐级累加数的逐级累加数的逐级累加(2 2)累累累累积积积积频频频频率率率率(cumulative cumulative percentagespercentages):各各各各类类类类别别别别频率频率频率频率(百分比百分比百分比百分比)的逐级累加的逐级累加的逐级累加的逐级累加向上累积向上累积向

18、上累积向上累积:由第一项向最后一项累加(变量值:由第一项向最后一项累加(变量值:由第一项向最后一项累加(变量值:由第一项向最后一项累加(变量值由小到大由小到大由小到大由小到大累加)累加)累加)累加)向下累积向下累积向下累积向下累积:由最后一项向第一项累加(变量值:由最后一项向第一项累加(变量值:由最后一项向第一项累加(变量值:由最后一项向第一项累加(变量值由大到小由大到小由大到小由大到小累加)累加)累加)累加)3-31统计学统计学(statistics)顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题

19、题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各 抽抽抽抽 样样样样 调调调调 查查查查 300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否否否否满满满满意意意意?”1 1.非常不满意非常不满意非常不满意非常不满意2 2.不满意不满意不满意不满意3 3.一般;一般;一般;一般;4 4.满意满意满意满意5 5.非常满意非常满意非常满意非常满意 甲城市家庭对住房状况评价的

20、频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户户户户数数数数(户户户户)百分百分百分百分比比比比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分百分百分百分比比比比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意2424108108939345453

21、0308 8363631311515101024241321322252252702703003008.08.044.044.075.075.090.090.0100.0100.030030027627616816875753030100.0100.09292565625251010合计合计合计合计300300100.0100.03-32统计学统计学(statistics)顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答

22、类别乙城市乙城市乙城市乙城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意212199997878646438387.07.033.033.026.026.021.321.312.712.721211201201981982622623003007.

23、07.040.040.066.066.087.387.3100.0100.03003002792791801801021023838100.0100.093.093.060.060.034.034.012.712.7合计合计合计合计300300100.0100.03-33统计学统计学(statistics)3、分类汇总、分类汇总如果我们已经建立了一张某单位部分人事统计如果我们已经建立了一张某单位部分人事统计表,如下所示。试按职称进行分类汇总。表,如下所示。试按职称进行分类汇总。3-34统计学统计学(statistics)4、数据透视表、数据透视表(pivot table)1.可以从复杂的数据中

24、提取有用的信息可以从复杂的数据中提取有用的信息可以从复杂的数据中提取有用的信息可以从复杂的数据中提取有用的信息2.可可可可以以以以对对对对数数数数据据据据表表表表的的的的重重重重要要要要信信信信息息息息按按按按使使使使用用用用者者者者的的的的习习习习惯惯惯惯或或或或分分分分析要求进行汇总和作图析要求进行汇总和作图析要求进行汇总和作图析要求进行汇总和作图3.形成一个符合需要的交叉表形成一个符合需要的交叉表形成一个符合需要的交叉表形成一个符合需要的交叉表(列联表列联表列联表列联表)4.注意:注意:注意:注意:数据源表中的首行必须有列标题数据源表中的首行必须有列标题数据源表中的首行必须有列标题数据源

25、表中的首行必须有列标题3-35统计学统计学(statistics)数据透视表数据透视表(用用Excel创建数据透视表创建数据透视表)第第第第1 1步:步:步:步:在在在在ExcelExcel工作表中建立数据清单工作表中建立数据清单工作表中建立数据清单工作表中建立数据清单第第第第2 2步:步:步:步:选中数据清单中的任意单元格,并选择选中数据清单中的任意单元格,并选择选中数据清单中的任意单元格,并选择选中数据清单中的任意单元格,并选择【数据】【数据】【数据】【数据】菜单菜单菜单菜单 中的中的中的中的【数据透视表和数据透视图】【数据透视表和数据透视图】【数据透视表和数据透视图】【数据透视表和数据透

26、视图】第第第第3 3步:步:步:步:确定数据源区域确定数据源区域确定数据源区域确定数据源区域第第第第4 4步:步:步:步:在在在在【向导【向导【向导【向导33步骤之步骤之步骤之步骤之3 3】中选择数据透视表的输出位置中选择数据透视表的输出位置中选择数据透视表的输出位置中选择数据透视表的输出位置 。然后选择。然后选择。然后选择。然后选择【布局】【布局】【布局】【布局】第第第第5 5步步步步:在在在在【向向向向导导导导布布布布局局局局】对对对对话话话话框框框框中中中中,依依依依次次次次将将将将”分分分分类类类类变变变变量量量量“拖拖拖拖至至至至 左左左左边边边边的的的的“行行行行”区区区区域域域域

27、,上上上上边边边边的的的的“列列列列”区区区区域域域域,将将将将需需需需要要要要汇汇汇汇总总总总的的的的 “变量变量变量变量”拖至拖至拖至拖至“数据区域数据区域数据区域数据区域”第第第第6 6步:步:步:步:然后单击然后单击然后单击然后单击【确定】【确定】【确定】【确定】,自动返回,自动返回,自动返回,自动返回【向导【向导【向导【向导33步骤之步骤之步骤之步骤之3 3】对对对对 话框。然后单击话框。然后单击话框。然后单击话框。然后单击【完成】【完成】【完成】【完成】,即可输出数据透视表,即可输出数据透视表,即可输出数据透视表,即可输出数据透视表 数据透视表数据透视表3-36统计学统计学(sta

28、tistics)(二)(二)数值型数据的频数分布数值型数据的频数分布 分类分类分类分类频数频数频数频数比例比例比例比例百分比百分比百分比百分比比率比率比率比率A AB BC CD DE E3-37统计学统计学(statistics)分组方法分组方法等距分组等距分组异距分组异距分组3-38统计学统计学(statistics)1、单变量值分组、单变量值分组(要点要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量值较少的情况3-39统计学统计学(statistics)单变量值分组单变量值分组(实例)(实例)117 122 124 1

29、29 124 129 117 130 122 125117 122 124 129 124 129 117 130 122 125123 131 125 127 122 133 126 122 119 124123 131 125 127 122 133 126 122 119 124121 125 123 126 126 130 127 123 119 122121 125 123 126 126 130 127 123 119 122122 124 127 123 125 125 124 123 127 130122 124 127 123 125 125 124 123 127 1301

30、26 126 128 128 124 125 123 128 124 125126 126 128 128 124 125 123 128 124 125【例例例例】某某某某生生生生产产产产车车车车间间间间5050名名名名工工工工人人人人日日日日加加加加工工工工零零零零件件件件数数数数如如如如下下下下(单单单单位位位位:个个个个)。试试试试采采采采用用用用单单单单变变变变量量量量值值值值对对对对数数数数据进行分组据进行分组据进行分组据进行分组。3-40统计学统计学(statistics)单变量值分组表单变量值分组表=countif(range,criteria)用用用用ExcelExcel制作

31、频数分布表制作频数分布表制作频数分布表制作频数分布表3-41统计学统计学(statistics)2、组距分组、组距分组(要点要点)1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.适合于连续变量或变量值较多适合于连续变量或变量值较多3.遵循遵循“不重不漏不重不漏”的原则的原则4.可可采采用用等等距距分分组组,或或不不等等距距分分组组 3-42统计学统计学(statistics)组距分组组距分组步骤步骤1.确定组数:可以按确定组数:可以按确定组数:可以按确定组数:可以按 SturgesSturges 提出的经验公式来确定提出的经验公式来确定提出的经验公式来确定提出的经验公式来确定2.确

32、确确确定定定定组组组组距距距距:组组组组距距距距(Class(Class Width)Width)是是是是一一一一个个个个组组组组的的的的上上上上限限限限与与与与下限之差下限之差下限之差下限之差.组距组距组距组距(最大值最大值最大值最大值 -最小值最小值最小值最小值)组数组数组数组数 3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 3-43统计学统计学(statistics)组距分组组距分组(几个概念几个概念)1.下限下限(low limit):一个组的最小值:一个组的最小值2.上限上限(upper

33、limit):一个组的最大值:一个组的最大值3.组距组距(class width):上限与下限之差:上限与下限之差4.组中值组中值(class midpoint):下限与上限之:下限与上限之间的中点值间的中点值下限值下限值+上限值上限值2组中值组中值=频数分布表的编制频数分布表的编制(例题分析例题分析)【例例例例】某某某某电电电电脑脑脑脑 公公公公 司司司司 20112011年年年年前前前前四四四四个个个个月月月月各各各各天天天天的的的的销销销销售售售售量量量量数数数数据据据据(单单单单位位位位:台台台台)。试试试试对对对对数数数数据据据据进进进进行分组。行分组。行分组。行分组。3-45统计学

34、统计学(statistics)频数分布表的编制频数分布表的编制步骤步骤1.确定组数:确定组数:确定组数:确定组数:2.确定组距:确定组距:组距组距(237-141)10=9.6 103.统统统统计计计计出出出出各各各各组组组组的的的的频频频频数数数数。每每每每个个个个组组组组的的的的数数数数据据据据满满满满足足足足a a x xb(b(上上上上限值不在内原则)限值不在内原则)限值不在内原则)限值不在内原则)(Excel(Excel的计数规则是的计数规则是的计数规则是的计数规则是aax x b b)4.用用Excel制作频数分布表制作频数分布表 3-46统计学统计学(statistics)等距分

35、组表等距分组表(上下组限重叠上下组限重叠)3-47统计学统计学(statistics)等距分组表等距分组表(上下组限间断上下组限间断)3-48统计学统计学(statistics)等距分组表等距分组表(使用开口组使用开口组)3-49统计学统计学(statistics)等距分组表等距分组表(使用开口组使用开口组)3-50统计学统计学(statistics)不等距分组不等距分组2010年中国人口按年龄分组年中国人口按年龄分组3-51统计学统计学(statistics)等等距分组与不等距分组距分组与不等距分组(在表现频数分布上的差异)(在表现频数分布上的差异)1.等距分组等距分组n n各组频数的分布不

36、受组距大小的影响各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响n n可可可可直直直直接接接接根根根根据据据据绝绝绝绝对对对对频频频频数数数数来来来来观观观观察察察察频频频频数数数数分分分分布布布布的的的的特特特特征征征征和和和和规律规律规律规律2.不等距分组不等距分组n n各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响n n各各各各组组组组绝绝绝绝对对对对频频频频数数数数的的的的多多多多少少少少不不不不能能能能反反反反映映映映频频频频数数数数分分分分布布布

37、布的的的的实实实实际际际际状况状况状况状况n n用用用用频频频频数数数数密密密密度度度度(频频频频数数数数密密密密度度度度频频频频数数数数/组组组组距距距距)反反反反映映映映频频频频数数数数分布的实际状况分布的实际状况分布的实际状况分布的实际状况3-52统计学统计学(statistics)3.3 统计图统计图 一、品质数据统计图一、品质数据统计图 二、数值型数据统计图二、数值型数据统计图 三、统计绘图的综合运用三、统计绘图的综合运用洛伦茨曲线洛伦茨曲线 3-53统计学统计学(statistics)一、品质数据统计图一、品质数据统计图3-54统计学统计学(statistics)(一)条形图和柱形

38、图(一)条形图和柱形图1.用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来来表表示示各类别数据的图形各类别数据的图形2.有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式3.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图(bar bar ChartChart),也也可可以以放放在在横横轴轴,称称为为柱形图柱形图(column chart)条形图3-55统计学统计学(statistics)柱形图柱形图(例题分析例题分析)3-56统计学统计学(statistics)条形图条形图(例题分析例题分析)3-57统计学统计学(statistics)对比条形图对

39、比条形图(side-by-side bar chart)1.分分类类变变量量在在不不同同时时间间或或不不同同空空间间上有多个取值上有多个取值2.对对比比分分类类变变量量的的取取值值在在不不同同时时间间或或不不同同空空间间上上的的差异或变化趋势差异或变化趋势电脑品牌电脑品牌电脑品牌电脑品牌一季度一季度一季度一季度二季度二季度二季度二季度联想联想联想联想256256468468IBMIBM285285397397康柏康柏康柏康柏247247328328戴尔戴尔戴尔戴尔563563688688对比条形图对比条形图3-58统计学统计学(statistics)对比条形图对比条形图(例题分析例题分析)3-

40、59统计学统计学(statistics)(二)饼图(二)饼图(pie Chart)1.也也也也称称称称圆圆圆圆形形形形图图图图,是是是是用用用用圆圆圆圆形形形形及及及及圆圆圆圆内内内内扇扇扇扇形形形形的的的的面面面面积积积积来来来来表表表表示示示示数数数数值值值值大大大大小小小小的的的的图形图形图形图形2.主主主主要要要要用用用用于于于于表表表表示示示示总总总总体体体体或或或或样样样样本的结构本的结构本的结构本的结构分类数据图示分类数据图示3-60统计学统计学(statistics)(三)环形图(三)环形图(annular chart)1.环环形形图图中中间间有有一一个个“空空洞洞”,总总体体

41、中中的每一部分数据用环中的一段表示的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别环形图与圆形图类似,但又有区别n n圆形图只能显示一个总体的构成情况圆形图只能显示一个总体的构成情况n n环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系列系列3.环形图可用于结构比较研究环形图可用于结构比较研究 环形图3-61统计学统计学(statistics)环形图环形图(例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价3-62统计学统计学(st

42、atistics)(一)(一)分组数据分组数据直方图直方图Excel二、数值型数据统计图二、数值型数据统计图3-63统计学统计学(statistics)直方图直方图(histogram)1.用矩形的宽度和高度来表示频数分布用矩形的宽度和高度来表示频数分布n n本质上是用矩形的本质上是用矩形的本质上是用矩形的本质上是用矩形的面积面积面积面积来表示频数分布来表示频数分布来表示频数分布来表示频数分布2.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应的的频频数数就就形成了一个矩形,即直方图形成了一个矩形,即直方图3.直方图下的

43、总面积等于直方图下的总面积等于13-64统计学统计学(statistics)直方图的绘制直方图的绘制140140 150150210210某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售 量量 在在 170170 180180之之 间间的的天天数数最最多多!190190 200200180180160160 170170频频频频频频数数数数数数(天天天天天天)25252020151510105 53030220220 230230 240240直方图下的面直方图下的面积之和等于积之和等于1

44、1直方图3-65统计学统计学(statistics)直方图与条形图的区别直方图与条形图的区别1.条条条条形形形形图图图图是是是是用用用用条条条条形形形形的的的的长长长长度度度度表表表表示示示示各各各各类类类类别别别别频频频频数数数数的的的的多多多多少少少少,其宽度其宽度其宽度其宽度(表示类别表示类别表示类别表示类别)则是固定的则是固定的则是固定的则是固定的2.直直直直方方方方图图图图是是是是用用用用面面面面积积积积表表表表示示示示各各各各组组组组频频频频数数数数的的的的多多多多少少少少,矩矩矩矩形形形形的的的的高高高高度度度度表表表表示示示示各各各各组组组组的的的的频频频频数数数数或或或或百百

45、百百分分分分比比比比,宽宽宽宽度度度度表表表表示示示示各各各各组组组组的的的的组组组组距,其高度与宽度均有意义距,其高度与宽度均有意义距,其高度与宽度均有意义距,其高度与宽度均有意义3.直方图的矩形是连续排列,条形图则是分开排列直方图的矩形是连续排列,条形图则是分开排列直方图的矩形是连续排列,条形图则是分开排列直方图的矩形是连续排列,条形图则是分开排列4.条条条条形形形形图图图图主主主主要要要要用用用用于于于于展展展展示示示示品品品品质质质质数数数数据据据据,直直直直方方方方图图图图则则则则主主主主要要要要用用用用于展示数值型数据于展示数值型数据于展示数值型数据于展示数值型数据3-66统计学统

46、计学(statistics)数值型数据的图示数值型数据的图示STATISTICASTATISTICA(二)(二)未未分组数据分组数据茎叶图和箱线图茎叶图和箱线图3-67统计学统计学(statistics)茎叶图茎叶图(stem-and-leaf display)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由由由“茎茎茎茎”和和和和“叶叶叶叶”两两两两部部部部分分分分构构构构成成成成,图图图图形形形形是是是是由由由由数数数数字字字字组组组组成的成的成的成的3.高位数值作树茎,个位数字作树叶高位数值作树茎,个位数

47、字作树叶高位数值作树茎,个位数字作树叶高位数值作树茎,个位数字作树叶4.茎叶图与直方图的区别茎叶图与直方图的区别茎叶图与直方图的区别茎叶图与直方图的区别直直直直方方方方图图图图可可可可观观观观察察察察数数数数据据据据的的的的分分分分布布布布状状状状况况况况,但但但但没没没没有有有有具具具具体体体体的数值的数值的数值的数值茎茎茎茎叶叶叶叶图图图图既既既既能能能能给给给给出出出出数数数数据据据据的的的的分分分分布布布布状状状状况况况况,又又又又保保保保留留留留了了了了原始数据的信息原始数据的信息原始数据的信息原始数据的信息直直直直方方方方图图图图适适适适用用用用于于于于大大大大批批批批量量量量数数

48、数数据据据据,茎茎茎茎叶叶叶叶图图图图适适适适用用用用于于于于小小小小批量数据批量数据批量数据批量数据3-68统计学统计学(statistics)茎叶图茎叶图(例题分析例题分析)茎叶图类似横茎叶图类似横置的直方图置的直方图3-69统计学统计学(statistics)箱线图箱线图(box plot)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.绘制方法是:绘制方法是:n n首首先先找找出出一一组组数数据据的的5个个特特征征值值,即即最最大大值值、最最小小值值、中中位位数数Me 和和两两个个四四分分位位数数(下四分位数下四分位数QL和上四分位数和上四分位数QU)n n连连接接

49、两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个极极值点与箱子相连接值点与箱子相连接 n n该该该该箱箱箱箱线线线线图图图图也也也也称称称称为为为为Median/QuartMedian/Quart./Range/Range箱箱箱箱线线线线图图图图3-70统计学统计学(statistics)单批数据箱线图单批数据箱线图(箱线图的构成箱线图的构成)中位数中位数4 46 68 810101212QQ75%75%75%QQ25%25%25%X XMaxMaxMaxX XMinMinMinMedian/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图3-7

50、1统计学统计学(statistics)单批数据箱线图单批数据箱线图(例题分析例题分析)最小值最小值最小值最小值最小值最小值141141141最大值最大值最大值最大值最大值最大值237237237中位数中位数中位数中位数中位数中位数18218218225%25%25%四分位数四分位数四分位数四分位数四分位数四分位数170.25170.25170.2575%75%75%四分位数四分位数四分位数四分位数四分位数四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁