《数据的收集、整理和描述_2.ppt》由会员分享,可在线阅读,更多相关《数据的收集、整理和描述_2.ppt(84页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章第二章第二章 数据的搜集、整数据的搜集、整数据的搜集、整数据的搜集、整理和显示理和显示理和显示理和显示 数据的搜集 数据的整理 数据的(描述)显示:图和表(一)(二)(三)1第二章第二章第二章第二章 数据的搜集、整数据的搜集、整数据的搜集、整数据的搜集、整理和显示理和显示理和显示理和显示数数据据的的搜搜集集数据的计量及类型数据的计量及类型统计数据的来源统计数据的来源统计调查的方式统计调查的方式2数据的计量及类型数据的计量及类型1.数据计量的尺度标志的性质不同,会有不同的表现形式,可以归为四类。也就是计量的四种尺度问题。Turn3定类尺度定类尺度(概念要点)(概念要点)1.对事物进行
2、平行的分类2.各类别可以指定数字代码表示3.使用时必须符合类别穷尽和互斥的要求4.数据表现为“类别”5.计量层次最低6.具有=或的数学特性Ret4定序尺度定序尺度(概念要点)(概念要点)1.对事物分类的同时给出各类别的顺序2.表现为“类别”,但有序3.未测量出类别之间的准确差值4.比定类尺度精确数据5.具有或的数学特性Ret5定距尺度定距尺度(概念要点)(概念要点)1.数据表现为“数值”2.比定序尺度精确3.对事物的准确测度4.没有绝对零点5.具有+或-的数学特性Ret6定比尺度定比尺度(概念要点)(概念要点)1.数据表现为“数值”2.有绝对零点3.对事物的准确测度4.与定距尺度处于同一层次5
3、.具有 或 的数学特性Next7计量尺度的比较计量尺度的比较四种计量尺度的比较四种计量尺度的比较定类定类尺尺度度定序定序尺尺度度定距定距尺尺度度定比尺定比尺度度 分分类类(,)排排序序()间间距距(+,-)比比值值(,)Ret“”表示该尺度所具有的特性表示该尺度所具有的特性8数据的计量及类型数据的计量及类型2.数据的类型 根据数据采用的计量尺度的不同,数据可分为三种类型离散变量离散变量连续变量连续变量9数据的计量及类型数据的计量及类型 按照数据搜集的方法不同,数据可以分为:观测数据和实验数据 观测数据 在自然的未被控制的条件下观测到的数据,称为观测数据(通过调查或观测方法获得)。实验数据 在人
4、工干预和操作情况下收集的数据就称为试验数据。10数据的计量及类型数据的计量及类型 根据描述的对象和时间的关系,数据可分为:截面数据和时间序列数据 截面数据 在相同或相近的时间点上搜集,描述现象在某一时间点上的状态的数据。时间序列数据 在不同时间上搜集、描述现象随时间而变化情况的数据。11数据的计量及类型数据的计量及类型统计数据的类型总结:统计数据的类型按搜集方法按时间状况按计量尺度顺序数据数值数据分类数据观测数据实验数据截面数据时序数据Ret12统计数据的来源统计数据的来源1.统计数据的间接来源 各种媒介上即以存在的数据,它是别人通过调查或实验的方式搜集的,也称二手资料。公开出版物:统计公报、
5、中国统计年鉴、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、中国市场统计年鉴、世界经济年鉴、国外经济统计资料、世界发展报告中国统计中国统计中国统计中国统计年鉴年鉴年鉴年鉴20012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社Next13统计数据的来源统计数据的来源 各类经济中心、咨询机构、专业调查中心、各行
6、业协会和联合会提供的市场信息和行业发展情报;专业期刊、报纸、书籍所提供的文献资料;各种会议上交流的有关资料;RetInternetInternet 网络14统计数据的来源统计数据的来源2.统计数据的直接来源通过调查方法和实验方法获得数据。对于社会经济研究而言,多数采用调查的方式来获得研究数据。Ret15统计调查的方式统计调查的方式3.调查数据的获得存在以下方式16普查普查(概念要点)(概念要点)1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄Ret总体总体总体总体17抽样调查抽样调查(概念要点)(概
7、念要点)1.从总体中随机抽取一部分单位(样本)进行调查2.目的是推断总体的未知数字特征3.最常用的调查方式4.具有经济性、时效性强、适应面广、准确性高等特点总体随机样本 Ret18统计报表统计报表(概念要点)(概念要点)1.统计报表制度是我国统计调查方法体系中的一种重要的组织方式。2.按照国家有关法规规定,根据国家统一规定的表式、统一的指标项目、统一的报送时间,自下而上的逐级定期提供统计自来的调查方式。统计报表制度具备统一性、时效性、全面性、可靠性的特点,可以满足各级管理层次的需要。3.有各种各样的类型 根据管理部门不同有:国家统计报表,业务部门报表,地方统计报表。根据报送周期有:日报、月报、
8、季报等。Ret19重点调查和典型调查重点调查和典型调查重点调查重点调查从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体典型调查典型调查从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体Ret20第二章第二章第二章第二章 数据的搜集、整数据的搜集、整数据的搜集、整数据的搜集、整理和显示理和显示理和显示理和显示数数据据的的整整理理统计整理的意义统计整理的意义统计分组统计分组分配数列分配数列21统计整理意义统计整理意义数据从总体中产生,反映了总体的特征。观察:某车间50名工人日加工零件数如下,试描述该车间工人的日生产能力情
9、况。117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 1
10、20 123 127 135137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121Next22统计整理的意义统计整理的意义原始数据琐碎、凌乱、不系统,对其加以整理,使之条理化、系统化,以符合分析的需要。统计整理是统计调查的继续和发展,是统计分析的前提和基础。统计整理就是以适当的形式展示和表述统计资料。数据的整理通常包括原始数据的预处理、归类或分组、汇总等几个方面的内容。Ret包括:数据审核(保证数据的完整性和准确性)、数据筛选和数据排序。23统计分组统计分组1.统计分组的意义概念:根据统计研究
11、的目的与需要,将所要研究的现象总体按一定的标志划分成若干个部分。意义:统计分组把性质相近或相同的个体划分成一个组,增加了组内的相似性,显示了组间的相异性,有助于揭示事物的本质和规律。Next24统计分组统计分组作用:划分现象的类型 例:经济组织非公有经济公有经济国有控股集体经济外资经济股份经济个体经济私营经济分组标志:所有制性质分组标志:所有制性质分组标志:所有制性质Next25统计分组统计分组 研究总体的内部构成 例:上海市按GDP计算的三次产业结构(%)2000年2001年2002年2003年GDP第一产业第二产业第三产业100 1.8 48.05 50.15100 1.73 47.58
12、50.69100 1.63 47.42 50.951001.49 50.09 48.42Next26统计分组统计分组 分析现象之间的依存关系 例:中国农民家庭按收入分组的恩格尔系数(1984年)Next收入分组(元)200400600800恩格尔系数(100%)64.956.750.543.6反映人民生活水平类型的指标,用家庭或个人食品支出总额占消费支出总额比重计算。30%以下 高度富裕 30%40%富裕水平 40%50%小康水平 50%60%温饱水平 60%以上 绝对贫困 2000年,我国居民的恩格尔系数首次低于50。27统计分组统计分组2.分组标志的选择对总体现象分组,需首先选择分组标志,
13、按不同的分组标志分组,说明不同的问题。根据研究的具体目的选择分组标志 选择最能反映现象本质的标志作为分组标志。选择最具有现实意义的分组标志Next28统计分组统计分组 想一想:研究我国各省市卫生事业和教育发展状况,应选择什么分组标志进行研究?Next29统计分组统计分组3.统计分组的种类统计资料分组,按标志的性质不同,分为品质标志分组和数量标志分组。统计资料可按单个标志分组,也可按多个标志分组。按标志的多少和使用情况,统计分组可以分为简单分组、复合分组和分组体系三个类别。Next30统计分组统计分组 简单分组 只用一个标志对总体进行的分组。复合分组 使用两个及两个以上的标志对总体进行的分组。有
14、层叠式和交叉式两种表现方式。分组体系 把若干个互相联系的标志形成的分组并列起来形成分组体系。Next31统计分组统计分组统计分组形式总结分组标志多少统计分组形式简单分组复合分组分组体系分组标志性质统计分组形式品质分组数量分组品质标志数量标志单个标志两个及以上标志层叠或交叉若干个分组并列Ret32分配数列分配数列1.基本概念概念:对总体分组后,说明总体单位在各组分配情况的数列,就叫分配数列,也称频数分布。例:企业规模工业企业个数比重(%)特大型企业大型中型小型合计06159300205030100Next33分配数列分配数列构成要素 总体各分组 各组单位数 各组单位数又叫次数或频数,各组单位数占
15、总体单位数的比率称为频率。总体各分组各组单位数占总体的比重频数频率Next34分配数列分配数列2.分配数列的种类分配数列品质数列数值数列按按品质标志品质标志分组形成的数列分组形成的数列按按数量标志数量标志分组形成的数列分组形成的数列标志性质35分配数列分配数列 分配数列品质数列数值数列各分组包含变量值的多少组距数列单项数列每组只包含每组只包含一个变量一个变量值值的数列,它按照单的数列,它按照单个数值进行分组编制个数值进行分组编制每组包含每组包含多个变量值多个变量值的数列,的数列,它按照组距分组编制它按照组距分组编制36分配数列分配数列分配数列品质数列数量数列组距数列单项数列异距数列等距数列组距
16、是否相等Next37分配数列分配数列 数值型数列举例 某班组工人一天完成的产品数量件数人数(人)比重(%)2022252850132850 22合计60100Ret38分配数列 组距数列举例 某地区百货公司月销售额资料按销售额分组百货公司个数(个)-5050100100200200300300-1020302515合计100Ret39分配数列分配数列3.组距数列的编制几个概念 组限(上限或下限):一个分组的最大的或最小的变量值,即每个分组的两端数值。组距:上限-下限 开口组:缺上限或缺下限的组。开口组组距:取临组之组距。全距:最大变量值-最小变量值 组数:全距/组距(等距分组时)组中值:下限+
17、组距/2 OR上限-组距/2按销售额分组百货公司个数(个)-5050100100200200300300-1020302515合计100百货公司销售资料Next40分配数列分配数列组距数列的编制原则 穷尽性 互斥性 Next41分配数列分配数列组距数列的编制步骤 排序求全距 续上例:全距=139-107=32117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126
18、122 118 108110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121Next107108108110112112113114115117117117118118118119120
19、12012112212212212212312312312312412412412512512612612712712712812812913013113313313413413513713913942分配数列分配数列 确定组数和组距 确定组数 斯特奇斯经验公式:K=1+lg(n)/lg(2)K=1+lg(50)/lg(2)=6.6 四舍五入,确定组数为7确定组距 组距=全距/组数=32/7 4.6 “5”更符合习惯和方便计算,确定组距为5Next简化和完全的矛盾便于计算符合习惯n为数据个数43分配数列分配数列分配数列分配数列 确定组限、计算组中值组限确定尽量不设或少设开口组等距数列与异距数列
20、 数列编制主要是揭示现象的分布特点,当现象发展在变量上表现极不均匀时,可以编制异距数列。想一想:企业按资产规模分组,用等距分组好,还是异距分组好?Next44分配数列分配数列 确定组限 本例中,组限可定为:105110;110 115;115 120;120 125;125 130;130 135;135 140 计算组中值(略)Next45分配数列分配数列 计算各组频数、频率 注意:上限不再组内 编制组距数列Next10710810811011211211311411511711711711811811811912012012112212212212212312312312312412412
21、412512512612612712712712812812913013113313313413413513713913946频数分配表频数分配表 最后编制频数分配表如下:观察值区间频数频率(%)累计频数累计频率105110 110115 115120 120125 125130130135 135 140 4591496381018281812649183241475081836648294100合计50100.0Ret47第二章第二章第二章第二章 数据的搜集、整数据的搜集、整数据的搜集、整数据的搜集、整理和显示理和显示理和显示理和显示数数据据的的(描描述)述)显显示示统计图统计图统计表统计
22、表48统计图统计图统计图统计图1.图:数据的画图,本质上是一种修辞工具,说服力的一种形式。图的作用可以帮助研究者从数据中提取信息和帮助把信息传递给其他人。图可以包含很多信息,并一眼就能被理解。常言道:一幅图胜过一千个字。Next49统计图统计图统计图统计图2.分类变量:圆形图和条形图 为一个分类变量作图 【例例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。Next50统计图统计图 数据表 某城市居民关注广告类型的频数分布某城市居民
23、关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100Next51统计图统计图 圆饼图也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占36
24、0o的相应比例确定的。Next52某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成圆饼图例 其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成Next53统计图统计图 条形图条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图Next54某城市居民关注不同类型广告的人数构成某城市居民关
25、注不同类型广告的人数构成条形图例人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布Next55统计图统计图 为两个分类变量作图 【例例】在某计算机使用情况调查中发现,在计算机使用者50人的随机样本中,男性有30人,女性20人,其中,每周玩电脑游戏超过2个小时的,男性有14人,女性有6人Next56电脑使用情况调查数据图示电脑使用情况调查数据图示Next57统计图统计图3.度量变量:直方图和点线图 为一个度量变量作图 分组数据直方图用
26、用矩矩形形的的宽宽度度和和高高度度来来表表示示频频数数分分布布的的图图形形,实际上是用矩形的实际上是用矩形的面积面积来表示各组的频数分布来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频率密度(等距分组时,也表示频率或频数),各分组与相应的频率就形成了一个矩形,即直方图(Histogram)直方图下的总面积等于直方图下的总面积等于1 1Next58分组数据分组数据直方图直方图 使用前例中得到的分组数据,绘得直方图频频频频频频数数数数数数(人人人人人人)151512129 96 63 3105105110110115115120120 125125 130130 135135 14
27、0140直方图下的面直方图下的面积之和等于积之和等于11某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120125125之间之间!Go59统计图统计图直方图与条形图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列Next60统计图统计图
28、分组数据折线图折 线 图 也 称 频 数 多 边 形 图(Frequency polygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的Next61分组数据分组数据折线图折线图 直方图折线图折线图下的面积折线图下的面积与直方图的面积与直方图的面积相等!相等!某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图120120151512129 96 63 3105105 110110 11511
29、5125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)频频频频频频数数数数数数(人人人人人人)第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖竖边边中点连接到横轴中点连接到横轴Next62统计图统计图 未分组数据茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形由数字组成以该组数据的高位数值作树茎,低位数字作树叶茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体
30、的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息Next63未分组数据未分组数据茎叶图茎叶图 茎叶图例树茎树茎树茎树茎 树叶树叶树叶树叶78878802234777888902234777888900122223333444667778890012222333344466777889013344579901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似横置的直方图的直方图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工
31、零件数的茎叶图Next64茎叶图的扩展茎叶图的扩展树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10s10s10s10.10.10.11*11*11*11t11t11t11f11f11f11s11s11s11.11.11.12*12*12*12t12t12t12f12f12f12s12s12s12.12.12.13*13*13*12t12t12t13f13f13f13s13s13s13.13.13.7 778 88 88 80 002 2 32 2 32 2 34 54 54 57 7 77 7 77 7 78 8 8 98 8 8 98 8 8 90 0 10 0 10 0 12 2 2
32、2 3 3 3 32 2 2 2 3 3 3 32 2 2 2 3 3 3 34 4 4 5 54 4 4 5 54 4 4 5 56 6 7 7 76 6 7 7 76 6 7 7 78 8 98 8 98 8 90 10 10 13 33 33 34 4 54 4 54 4 57 779 99 99 9树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10*10*10*10.10.10.11*11*11*11.11.11.12*12*12*12.12.12.13*13*13*13.13.13.7 8 87 8 87 8 80 2 2 3 40 2 2 3 40 2 2 3 45 7 7 7
33、8 8 8 95 7 7 7 8 8 8 95 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 90 1 3 3 4 4 0 1 3 3 4 4 0 1 3 3 4 4 5 7 9 95 7 9 95 7 9 9 扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图茎叶图树叶太长,可以考虑把茎叶图扩展Next65统计图统计图 未分组数据箱线图
34、用于显示未分组的原始数据或分组数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最最大大值值、最最小小值值、中中位位数数Me 和两个四四分分位位数数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 Next66箱线图的构成箱线图的构成中位数中位数中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值 简单箱线图简单箱线图简单箱线图简单箱线图Next67未分组数据未分组数据单批数据箱线图单批数据箱线图最小值最小值最小值10
35、7107107最大值最大值最大值139139139中位数中位数中位数123123123下四分位数下四分位数下四分位数117.75117.75117.75上四分位数上四分位数上四分位数128128128105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140105 110 115 120 125 130 135 1405050名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图Next箱线图例箱线图例68分布形状与箱线图分布形状与箱线图对称分布对称分布对称分布对称分布对称分布对
36、称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图Next69未分组数据未分组数据多批数据箱线图多批数据箱线图【例例例例】从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取1111人人,对对8 8门门主主要要课课程程的的考考试试成成绩绩进进
37、行行调调查查,所所得得结结果果如如下下表表。试试绘绘制制各各科科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征考试成绩的批比较箱线图,并分析各科考试成绩的分布特征表表 11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980
38、6087816786918377769070828382928481706972787578918866948085718674687962818155787075687177Next70未分组数据未分组数据多批数据箱线图多批数据箱线图图图图图 8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图Next71未分组数据未分组数据多批数据箱线图多批数据箱线图图图图图 1111名学生名学生名学生名学生8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图Min-Max25%-75%Median value455565
39、758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11Next72统计图统计图 为两个度量变量作图 散点图散点图包括两个轴,横轴、纵轴各代表一个变量两个变量的一对观测值在图中用点来表示Next73度量变量:直方图和点线图度量变量:直方图和点线图【例】夫妇争吵的次数和结婚年数有关吗?下面是来自24对夫妇的数据。结婚年数结婚年数 52413658争吵次数 102016159685结婚年数结婚年数 391015132016 25争吵次数 96534241结婚年数结婚年数 151917203722 14争吵次数 433210733Next74两个变量两个变量散点图散点
40、图夫妇争吵次数与结婚年数夫妇争吵次数与结婚年数Next75统计图统计图 时间序列数据线图时间一般绘在横轴,指标数据绘在纵轴时间一般绘在横轴,指标数据绘在纵轴图图形形的的长长宽宽比比例例要要适适当当,其其长长宽宽比比例例大大致致为为10:7一一般般情情况况下下,纵纵轴轴数数据据下下端端应应从从“0”开开始始,以以便便于于比比较较。数数据据与与“0”之之间间的的间间距距过过大大时时,可以采取折断的符号将纵轴折断可以采取折断的符号将纵轴折断Next76统计图统计图 【例】已知19911998年我国城乡居民家庭的人均收入数据如下表。试绘制线图表表 19911998年城乡居民家庭人均收入年城乡居民家庭人
41、均收入年份年份城镇居民城镇居民农村居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6 784.0 921.61221.01577.71926.12091.12162.0Next77时间序列时间序列线图线图 城镇居民家庭人均收入020004000600019911992199319941995199619971998城镇居民农村居民收收入入(元)(元)图图 城乡居民家庭人均收入城乡居民家庭人均收入Ret78统计表统计表1.统计表的构成 统计表的概念表通常由写在行和列
42、的数字组成,是一种用密集的形式归纳数据的方法。表经常用于表明有多大比例,落入不同的类别中。表是积累统计资料和显示统计资料的良好形式。表有两个作用:传递信息和组织数据 Next79统计表统计表 统计表的构成从形式上看,统计表由总标题、行标题、列标题和数据资料四部分组成。表的行标题一般说明研究总体及(或)其组成部分,构成统计表的说明对象。列标题则是说明总体的各个指标名称或标志。指标数值或标志值,构成表的数据资料。从内容上看,表由主词和宾词构成。Next80统计表的结构统计表的结构图例图例 表表 19971998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1997年年 199
43、8年年 一、调查户数一、调查户数 二、平均每户家庭人口数二、平均每户家庭人口数 三、平均每户就业人口数三、平均每户就业人口数 四、平均每人全部收入四、平均每人全部收入 五、平均每人实际支出五、平均每人实际支出 消费性支出消费性支出 非消费性支出非消费性支出 六、平均每人居住面积六、平均每人居住面积户户人人人人元元元元元元元元平方米平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:中国统计摘要1999,中国统计出版社,1
44、999,第79页。注:1本表为城市和县城的城镇居民家庭抽样调查材料。2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。Next表头表头表头表头行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料附附附附加加加加81统计表统计表2.表的种类表按主词是否分组和分组情况,分为三种类型:简单表:主词栏未分组,仅罗列了各空间范围或不同时间的资料的统计表。分组表:也称简单分组或单一分组表。是总体按单一标志进行分组而形成的表格。复合分组表:指总体按两个或两个以上标志进行分组,以层叠或交叉方式构造的表格。统计表按其作用也可分为调查表、整理表、计算表等。Next82统计表统计表3.统计表的设计 要合理安排统计表的结构 总标题内容应满足3W(where,when,what)要求 数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明 表中的上下两条横线一般用粗线,其他线用细线 通常情况下,统计表的左右两边不封口 表中的数据一般是右对齐,有小数点时应以小数点对 齐,而且小数点的位数应统一 对于没有数字的表格单元,一般用“”表示 必要时可在表的下方加上注释Next83THE ENDTHE END84