第3章统计数据的整理与显示.ppt

上传人:s****8 文档编号:82775784 上传时间:2023-03-26 格式:PPT 页数:57 大小:706.50KB
返回 下载 相关 举报
第3章统计数据的整理与显示.ppt_第1页
第1页 / 共57页
第3章统计数据的整理与显示.ppt_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《第3章统计数据的整理与显示.ppt》由会员分享,可在线阅读,更多相关《第3章统计数据的整理与显示.ppt(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、描述统计描述统计统计数据统计数据的收集的收集数据分布特征数据分布特征的测度的测度统计数据统计数据的整理与显示的整理与显示第第3章章 统计数据的整理与显示统计数据的整理与显示 主要内容和学习目标主要内容和学习目标 统计数据的预处理统计数据的预处理(掌握)(掌握)统计数据的分组整理统计数据的分组整理(掌握)(掌握)统计数据的图表显示统计数据的图表显示(掌握)(掌握)一、统计数据的预处理一、统计数据的预处理 数据的审核数据的审核 数据的筛选数据的筛选 数据的排序数据的排序 1 1原始数据的审核原始数据的审核:完整性完整性 准确性准确性 2 2次级数据的审核次级数据的审核:完整性完整性 准确性准确性

2、适用性适用性 时效性时效性 逻辑检查逻辑检查 准确性审核的方法准确性审核的方法 计算检查计算检查 数据的审核数据的审核 1 1将某些不符合要求的数据将某些不符合要求的数据 或有明显错误的数据予以剔除;或有明显错误的数据予以剔除;2 2将符合某种特定条件的数据筛选出来,将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。不符合特定条件的数据予以剔除。数据的筛选数据的筛选 数据的排序数据的排序 1升序升序 2降序降序ExcelExcel在统计数据预处理中的应用在统计数据预处理中的应用 利用利用ExcelExcel的相关命令可以自动完成数据的预处理的相关命令可以自动完成数据的预处理 有效

3、性命令有效性命令 “数据数据”菜单菜单 筛选命令筛选命令(自动筛选和高级筛选自动筛选和高级筛选)排序命令排序命令返回返回二、统计数据的分组整理二、统计数据的分组整理 统计分组的原则统计分组的原则 品质型数据的分组整理品质型数据的分组整理 数值型数据的分组整理数值型数据的分组整理 分组整理的概念分组整理的概念 分组整理的步骤分组整理的步骤 分组整理:分组整理:就是按照统计研究的目的和要求,就是按照统计研究的目的和要求,选择选择一个或几个变量(标志)一个或几个变量(标志)将总体分为若干组,并将将总体分为若干组,并将数据分别列入对应的组内进行汇总。数据分别列入对应的组内进行汇总。l统计分组的核心:统

4、计分组的核心:选择分组标志选择分组标志l统计分组的标志:统计分组的标志:品质标志品质标志 数量标志数量标志l统计分组的结果:统计分组的结果:组内具有同质性组内具有同质性 组间具有差异性组间具有差异性 分组整理的概念分组整理的概念 统计分组的种类统计分组的种类简单分组简单分组复合分组复合分组品质分组品质分组数量分组数量分组类型分组类型分组结构分组结构分组分析分组分析分组按分组标志的多少按分组标志的多少按分组标志的性质不同按分组标志的性质不同按分组的作用和任务不同按分组的作用和任务不同l统计分组的种类统计分组的种类 简单分组和平行分组体系简单分组和平行分组体系按年龄分组:按年龄分组:按文化程度分组

5、:按文化程度分组:2020岁及岁及2020岁以下岁以下大专及大专以上大专及大专以上21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多或文小学、识字不多或文盲盲 复合分组和复合分组体系复合分组和复合分组体系按经济类型分组按经济类型分组按投资规模分组按投资规模分组国有经济投资:国有经济投资:大型大型中型中型小型小型集体经济投资:集体经济投资:大型大型中型中型小型小型外商经济投资:外商经济投资:大型大型中型中型小型小型其他经济投资:其他经济投资:大型大型中型中型小型小型穷尽原则:穷尽原则:使总体中的每一个单位都有组可归使

6、总体中的每一个单位都有组可归互斥原则:互斥原则:使总体中的每一个单位只有一组可归使总体中的每一个单位只有一组可归 统计分组的原则统计分组的原则 分组整理的步骤分组整理的步骤 第一步:对数据进行分组第一步:对数据进行分组第二步:计算各组的频数、第二步:计算各组的频数、频率、累积频数和累积频率频率、累积频数和累积频率第三步:编制频数分布表第三步:编制频数分布表频数频数(FrequencyFrequency,亦称为次数亦称为次数)是指落入各组中的数据的个数或次数是指落入各组中的数据的个数或次数频率频率(Relative frequencyRelative frequency,亦称比重或百分比),亦称

7、比重或百分比)是指各组中的数据个数或次数占全部数据总数的比例是指各组中的数据个数或次数占全部数据总数的比例累积频数累积频数(Cumulative frequenciesCumulative frequencies)是将各有序类别或组的频数逐级累加起来是将各有序类别或组的频数逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积 累积频率累积频率(Cumulative percentagesCumulative percentages)是将各有序类别或组的频率逐级累加起来是将各有序类别或组的频率逐级累加起来累积方法:向上累积、向下累积累积方法:向上累积、向下累积频数分布表频数分布表

8、(Frequency distributionFrequency distribution)是各组及其相应的频数(还可包括频率、累积频数是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列而成的表格和累积频率)依一定的次序排列而成的表格分组分组频数频数频率()频率()合合 计计100100 XXX频数分布表频数分布表 品质型数据的分组整理品质型数据的分组整理品质型数据的分组方法:品质型数据的分组方法:把每一个变量值作为一组把每一个变量值作为一组分类数据的频数分布表可以包括:分类数据的频数分布表可以包括:分组、频数和频率分组、频数和频率顺序数据的频数分布表可以包括:顺序数据的

9、频数分布表可以包括:分组、频数、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布广告类型广告类型人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告515125.525.5金融广告金融广告9 94.54.5房地产广告房地产广告16168.08.0招生招聘广告招生招聘广告10105.05.0其其 他他 广广 告告2 21.01.0合合 计计200200100.0100.0 某城市家庭对住房状况满意程度的频数分布某城市家庭对住房状况满意程度的频数分布 满意满意 程度程度户数户数

10、(户)(户)百分比百分比()()向上累积向上累积向下累积向下累积户数户数(户)(户)百分比百分比()()户数(户)户数(户)百分比百分比()()非常非常不满意不满意24248 824248.08.0300 300 100100不满意不满意108108363613213244.044.0276 276 9292一般一般9393313122522575.075.0168 168 5656满意满意4545151527027090.090.075 75 2525非常非常满意满意30301010300300100.0100.030 30 1010合计合计300300100100 数值型数据的分组整理数值

11、型数据的分组整理数值型数据的分组方法:数值型数据的分组方法:单项式分组和组距式分组单项式分组和组距式分组数值型的频数分布表可以包括:数值型的频数分布表可以包括:分组、频数、频率、累积频数和累积频率分组、频数、频率、累积频数和累积频率 l单项式分组:单项式分组:把每一个具体的变量值作为一组把每一个具体的变量值作为一组适用于变量值较少的离散变量的情况适用于变量值较少的离散变量的情况 l组距式分组:组距式分组:将全部变量值依次划分为若干个将全部变量值依次划分为若干个 数值区间,每一个数值区间作为一个组。数值区间,每一个数值区间作为一个组。适合于变量值较多的离散变量和连续变量的情况适合于变量值较多的离

12、散变量和连续变量的情况 某某200200名手机使用者目前已更换手机数量的名手机使用者目前已更换手机数量的 频数分布表频数分布表更换手机数量更换手机数量人数(人)人数(人)频率()频率()0 06 63 31 1828241412 2767638383 3及以上及以上36361818合合 计计200200100100 组距式(等距)分组的步骤组距式(等距)分组的步骤(1 1)计算全距)计算全距R R:或或 RR最大值组的上限最小值组的最大值组的上限最小值组的下限下限(2 2)确定组数)确定组数K K:组数的多少以能显示数据分布的特征组数的多少以能显示数据分布的特征 和规律为宜。和规律为宜。经验公

13、式:经验公式:(3 3)确定组距)确定组距d d:一个组的上限与下限之差一个组的上限与下限之差 (4 4)确定组限:)确定组限:应遵循应遵循“不重不漏不重不漏”原则原则 为便于计算,组距宜取为便于计算,组距宜取5 5或或1010的倍数的倍数 首先确定最小值组的下限,然后利用首先确定最小值组的下限,然后利用组限和组距的关系依次确定其他组限。组限和组距的关系依次确定其他组限。(5 5)编制频数分布表)编制频数分布表 1 1、正确使用间断式组限和连续式组限正确使用间断式组限和连续式组限 间断式组限:保证无数据限落在相邻两组上下限之间间断式组限:保证无数据限落在相邻两组上下限之间 连续式组限:遵循连续

14、式组限:遵循“上限不在内上限不在内”原则原则 2 2、正确选择第一组的下限和最后一组的上限、正确选择第一组的下限和最后一组的上限 第一组的下限:应略小于或等于最小变量值第一组的下限:应略小于或等于最小变量值 最后一组的上限:应略大于或等于最大变量值最后一组的上限:应略大于或等于最大变量值 3 3、正确使用开口组形式、正确使用开口组形式 第一组:采取第一组:采取“以下以下”最后一组:采取最后一组:采取“以上以上”确定组限的细节问题确定组限的细节问题 1 1、使用间断式组限时、使用间断式组限时 各组的组距本组的上限前组的上限各组的组距本组的上限前组的上限 2 2、使用连续式组限时、使用连续式组限时

15、 各组的组距本组的上限本组的下限各组的组距本组的上限本组的下限 3 3、开口组通常以相邻组的组距为其组距、开口组通常以相邻组的组距为其组距 确定组距的细节问题确定组距的细节问题 1 1、不等距分组时需要计算、不等距分组时需要计算频数密度频数密度和和频率密度频率密度 频数密度频数频数密度频数/组距组距 频率密度频率频率密度频率/组距组距 2 2、组距式分组时通常使用、组距式分组时通常使用组中值组中值作为各组数据的代表值作为各组数据的代表值 连续式组限连续式组限:组中值(本组下限值本组上限值)组中值(本组下限值本组上限值)/2/2 间断式组限间断式组限:组中值(本组下限值后组下限值)组中值(本组下

16、限值后组下限值)/2/2 3 3、开口组组中值的确定方法、开口组组中值的确定方法 “以上以上”组:组:组中值本组下限值相邻组组距组中值本组下限值相邻组组距/2/2 “以下以下”组:组:组中值本组上限值相邻组组距组中值本组上限值相邻组组距/2/2其他的细节问题其他的细节问题例题分析例题分析某生产车间某生产车间5050名工人日加工零件数原始资料(单位:个)名工人日加工零件数原始资料(单位:个)11711712212212412412912913913910710711711713013012212212512510810813113112512511711712212213313312612612

17、2122118118108108110110118118123123126126133133134134127127123123118118112112112112134134127127123123119119113113120120123123127127135135137137114114120120128128124124115115139139128128124124121121试采用组距式分组法编制频数分布表试采用组距式分组法编制频数分布表排序表排序表107107108108108108110110112112112112113113114114115115117117117117

18、117117118118118118118118119119120120120120121121122122122122122122122122123123123123123123123123124124124124124124125125125125126126126126127127127127127127128128128128129129130130131131133133133133134134134134135135137137139139139139解:解:最大值最大值139139,最小值,最小值107107(1)(1)计算全距。计算全距。R R139139107140-105=

19、35107140-105=35(2)(2)计算组数。计算组数。,取取k=7k=7为宜。为宜。(3)(3)计算组距。计算组距。d=357=5d=357=5(4)(4)确定组限。第一组的下限取确定组限。第一组的下限取105105,其他组限依次利用组限,其他组限依次利用组限和组距的关系确定。和组距的关系确定。(5)(5)编制频数分布表。经分组整理后,可形成一个采用连续式编制频数分布表。经分组整理后,可形成一个采用连续式组限编制的频数分布表,也可形成一个采用间断式组限编制组限编制的频数分布表,也可形成一个采用间断式组限编制的频数分布表。的频数分布表。组距式分组的解题过程组距式分组的解题过程零件数(个)

20、零件数(个)频数(人)频数(人)频率()频率()1051051101103 36 61101101151155 510101151151201208 8161612012012512514142828125125130130101020201301301351356 612121351351401404 48 8合合 计计5050100100 连续式组距分组频数分布表连续式组距分组频数分布表使用连续式组限时:各组的组距本组上限本组下限使用连续式组限时:各组的组距本组上限本组下限 零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051091093 36 61101101141

21、145 510101151151191198 8161612012012412414142828125125129129101020201301301341346 612121351351391394 48 8合合 计计5050100100 间断式组距分组频数分布表间断式组距分组频数分布表使用间断式组限时:各组的组距本组上限前组上限使用间断式组限时:各组的组距本组上限前组上限 ExcelExcel在统计数据分组整理中的应用在统计数据分组整理中的应用 利用利用ExcelExcel的相关函数、命令和工具可以自动完成的相关函数、命令和工具可以自动完成 数据的分组整理数据的分组整理 品质型数据:品质型

22、数据:COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 数值型数据:数值型数据:COUNTIFCOUNTIF、数据透视表和数据透视图、数据透视表和数据透视图 (单项式分组)(单项式分组)FREQUENCY FREQUENCY 直方图工具直方图工具 (组距式分组)(组距式分组)返回返回三、统计数据的图表显示三、统计数据的图表显示 统计表统计表 统计图统计图统计表的统计表的构成要素:构成要素:表头、表头、行标题、行标题、列标题、列标题、数字资料数字资料 表外附加表外附加 统计表统计表 统计表的结构统计表的结构20032004年城镇居民家庭基本情况表年城镇居民家庭基本情况

23、表项目项目单位单位2003年年 2004年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均每人全部年收入平均每人全部年收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元 480283.011.5852.49061.26510.94 50430 2.98 1.56 52.35 10128.51 7182.10资料来源:中国统计年鉴2005,中国统计出版社。注:本表为城镇居民家庭收支抽样调查材料。行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料表头表头表头表头附附附附加加加加统

24、计表的设计原则:统计表的设计原则:“科学、实用、简练、美观科学、实用、简练、美观”1 1、总标题的表述、总标题的表述2 2、行、列标题的排列、行、列标题的排列 3 3、计量单位的安排、计量单位的安排4 4、合计栏的安排、合计栏的安排5 5、表格线的绘制、表格线的绘制6 6、指标数值的填写、指标数值的填写7 7、表外附加的设置、表外附加的设置常用的统计图有:常用的统计图有:柱形图和条形图、饼图和圆环图、柱形图和条形图、饼图和圆环图、累积频数分布图和累积频率分布图、累积频数分布图和累积频率分布图、直方图、折线图和曲线图直方图、折线图和曲线图散点图、气泡图和雷达图散点图、气泡图和雷达图 统计图统计图

25、分类数据的显示:柱形图、条形图、分类数据的显示:柱形图、条形图、饼图、饼图、圆环图圆环图顺序数据的显示:柱形图、条形图、顺序数据的显示:柱形图、条形图、饼图、饼图、圆环图、圆环图、累积频数分布图、累积频数分布图、累积频率分布图累积频率分布图数值数据的显示:直方图、折线图、曲线图数值数据的显示:直方图、折线图、曲线图两个变量之间的关系:散点图两个变量之间的关系:散点图三个变量之间的关系:气泡图三个变量之间的关系:气泡图多个变量之间的关系:雷达图多个变量之间的关系:雷达图各种统计图的用途各种统计图的用途例例1 1 某城市居民关注广告类型的频数分布表某城市居民关注广告类型的频数分布表广告类型广告类型

26、人数(人)人数(人)频率()频率()商品广告商品广告11211256.056.0服务广告服务广告515125.525.5金融广告金融广告9 94.54.5房地产广告房地产广告16168.08.0招生招聘广告招生招聘广告10105.05.0其其 他他 广广 告告2 21.01.0合合 计计200200100.0100.0柱形图通常用于显示分类数据和顺序数据的分布特征柱形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 柱形图柱形图饼形图只能显示一个总体的结构比例饼形图只能显示一个总体的结构比例 饼形图饼形图例例2 2 甲乙两城市对住房

27、满意程度的频数分布表甲乙两城市对住房满意程度的频数分布表条形图通常用于显示分类数据和顺序数据的分布特征条形图通常用于显示分类数据和顺序数据的分布特征以及变量值较少的离散数据的分布特征以及变量值较少的离散数据的分布特征 条形图条形图圆环图可以显示多个总体的结构比例,每一环表示一个总体圆环图可以显示多个总体的结构比例,每一环表示一个总体 圆环图圆环图累积频数图用于显示顺序数据和数值型数据的分布特征累积频数图用于显示顺序数据和数值型数据的分布特征 累积频数图累积频数图累积频率图累积频率图累积频率图用于显示顺序数据和数值型数据的分布特征累积频率图用于显示顺序数据和数值型数据的分布特征 例例3 3 某生

28、产车间某生产车间5050名工人加工零件个数频数分布表名工人加工零件个数频数分布表零件数(个)零件数(个)频数(人)频数(人)频率()频率()1051051101103 36 61101101151155 510101151151201208 8161612012012512514142828125125130130101020201301301351356 612121351351401404 48 8合合 计计5050100100直方图和折线图主要用于显示数值型数据的分布特征直方图和折线图主要用于显示数值型数据的分布特征 直方图和折线图直方图和折线图曲线图主要用于显示组数较多的数值型数据的分

29、布特征曲线图主要用于显示组数较多的数值型数据的分布特征 曲线图曲线图温度温度/降雨量降雨量/mm/mm产量产量/kg/k/kg/k6 62525225022508 8404034503450101058584500450013136868575057501414110110580058001616989875007500212112012082508250例例4 小麦产量与降雨量和温度的数据小麦产量与降雨量和温度的数据散点图是用于展示两个变量之间关系的一种图形散点图是用于展示两个变量之间关系的一种图形 散点图散点图气泡大小表示产量气泡图是用于展示三个变量之间关系的一种图形气泡图是用于展示三个变

30、量之间关系的一种图形 气泡图气泡图项目项目城镇居民城镇居民农村居民农村居民食品食品 37.73 37.73 41.59 41.59 衣着衣着 9.56 9.56 11.75 11.75 家庭设备用品及服务家庭设备用品及服务 5.67 5.67 8.20 8.20 医疗保健医疗保健 7.35 7.35 5.06 5.06 交通通信交通通信 11.75 11.75 2.24 2.24 教育文化娱乐服务教育文化娱乐服务 14.38 14.38 8.36 8.36 居住居住 10.21 10.21 21.66 21.66 杂项商品与服务杂项商品与服务 3.34 3.34 1.13 1.13 合计合计1

31、00.00 100.00 100.00 100.00 例例5 5 2004 2004年城乡居民家庭平均每人全年消费性支出构成()年城乡居民家庭平均每人全年消费性支出构成()雷达图是显示多个变量的常用方法,也称为蜘蛛图雷达图是显示多个变量的常用方法,也称为蜘蛛图 雷达图雷达图对称分布对称分布对称分布对称分布对称分布对称分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布正正正正正正J J J型分布型分布型分布型分布型分布型分布反反反反反反J J J型分布型分布型分布型分布型分布型分布U UU型分布型分布型分布型分布型分布型分布 频数分布的类型频数分布的类型End of Chapter 3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁