《统计数据的描述.ppt》由会员分享,可在线阅读,更多相关《统计数据的描述.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计数据的描述统计数据的描述STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示 第二章第二章 统计数据的描述统计数据的描述2.1 2.1 统计整理与统计分组统计整理与统计分组2.2 2.2 分布数列的编制分布数列的编制2.3 2.3 统计图表统计图表2.4 2.4 分布集中趋势分布集中趋势2.4 2.4 分布离中趋势分布离中趋势STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.1 2.1 统计整理与统计分组统计整理与统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组统计整理
2、统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分组和汇总形成综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程是统计调查的继续,统计分析的是统计调查的继续,统计分析的前提和基础前提和基础地位地位统计数据的处理:统计数据的处理:统计资料的分组、汇总及制表统计资料的分组、汇总及制表统计数据的管理:统计数据的管理:数据的传输、贮存、更新及输出数据的传输、贮存、更新及输出内内容容制定统计整理方案制定统计整理方案对原始资料进行审核对原始资料进行审核数数 据据 处处 理理制作统计表或统计图制作统计表或统计图统计整理的步骤统计整理的步骤STAT统计学第三章统计学第三章
3、统计数据的整理与显示统计数据的整理与显示2.1 2.1 统计整理与统计分组统计整理与统计分组 一、统计整理的意义和步骤一、统计整理的意义和步骤二、统计整理的基本方法二、统计整理的基本方法 统计分组统计分组将总体中所有单位按一定的标志分将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分为性质不同但又有联系的若干部分的过程的过程统计分组统计分组统计分组的作用统计分组的作用:总体经过分组,能够突出组与组之间的差异总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。得条理化,便于进一步分析研究。qq划
4、分社会经济现象的类型划分社会经济现象的类型qq反映社会经济现象的内部结构和比例关系反映社会经济现象的内部结构和比例关系qq揭示社会经济现象之间的相互依存关系揭示社会经济现象之间的相互依存关系选择分选择分组标志组标志确定分确定分组体系组体系总体单总体单位归类位归类科学性科学性:组间差异组间差异大,组内大,组内差异小。差异小。完备性和互斥完备性和互斥性性:每个单位每个单位均能且只能归均能且只能归到某个组中。到某个组中。统计分组的程序与原则统计分组的程序与原则对大学生月生活对大学生月生活费支出情况进行费支出情况进行分组研究:分组研究:按家庭收入水平按家庭收入水平分组;分组;按城乡分组;按城乡分组;按
5、性别分组;按性别分组;按年龄分组。按年龄分组。?统计分组的程序与原则统计分组的程序与原则对父母亲下岗情对父母亲下岗情况进行分组研究:况进行分组研究:单亲下岗;单亲下岗;双亲下岗;双双亲下岗;双亲在岗。亲在岗。不符合不符合科学性科学性不符合不符合完备性和互斥性完备性和互斥性城乡区别城乡区别离退休离退休是否健在是否健在?统计分组的程序与原则统计分组的程序与原则分组体系分组体系指同时使用两个以上标志分指同时使用两个以上标志分组时,分组标志的组合形式。组时,分组标志的组合形式。各分组标志并列使用各分组标志并列使用各分组标志交叉结合使用各分组标志交叉结合使用平行分组体系平行分组体系交叉分组体系交叉分组体
6、系平行分组体系平行分组体系对教师对教师的分类的分类按性别分类按性别分类男性男性女性女性按职称分类按职称分类按年龄分类按年龄分类高级高级中级中级初级初级青年青年中年中年共计共计7组组 2+3+2交叉分组体系交叉分组体系按性别按性别分类分类按职称按职称分类分类按年龄按年龄分类分类男男女女高级高级中级中级初级初级青年青年中年中年共计共计12组组232对教师对教师的分类的分类STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示 第二章第二章 统计数据的描述统计数据的描述2.1 2.1 统计整理与统计分组统计整理与统计分组2.2 2.2 分布数列的编制分布数列的编制3.3 3.3
7、统计图表统计图表2.4 2.4 分布集中趋势分布集中趋势2.4 2.4 分布离中趋势分布离中趋势STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.2 2.2 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率变量数列变量数列品质数列品质数列将总体各单位按某个标志分成若干将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列在总体中所占的比重而形成的数列分布数列分布数列分分类类分组标志的具体表现分组
8、标志的具体表现各组的次数或频率各组的次数或频率构成要素构成要素异距数列异距数列等距数列等距数列组距数列组距数列单值数列单值数列统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.2 2.2 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率单值数列单值数列指每个组值只用一个具体的指每个组值只用一个具体的变量值表现的数列变量值表现的数列同时同时同时同时具备具备具备具备变量数列的编制变量数列的编制变量是
9、离散变量变量是离散变量变量的不同取值个数较少变量的不同取值个数较少编制条件编制条件:【例】【例】【例】【例】己知某车间有己知某车间有24名工人,他们的日产量(件)名工人,他们的日产量(件)分别是:分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示日产量(件)日产量(件)日产量(件)日产量(件)X X工人数(人工人数(人工人数(人工人数(人)f20202121222223
10、232424252526263 35 56 64 43 32 21 1合计合计合计合计2424编制结果如下:编制结果如下:统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示组距数列组距数列指每个组的变量值用一个区指每个组的变量值用一个区间来表现的变量数列间来表现的变量数列变量数列的编制变量数列的编制变量是连续变量;变量是连续变量;或:或:总体单位数较多,变量不同总体单位数较多,变量不同取值个数也较多的离散变量。取值个数也较多的离散变量。编制条件编制条件:变量值变动区间的长度相等变量值变动区间的长度相等变量值变动区间的长度不完全相等变量值变动区间的长度不完全相等等距数列等距数列异
11、距数列异距数列统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示相关概念相关概念指每组两端表示各组界限的变量值,指每组两端表示各组界限的变量值,各组的最小值为各组的最小值为下限下限,最大值为,最大值为上限上限组限组限每组变量值变动区间的长度,为上每组变量值变动区间的长度,为上下限之差下限之差组距组距每组变量取值范围的中点数值每组变量取值范围的中点数值 组中值组中值统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示组中值=某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况销售额销售额(万元)(万元)商店数商店数(个)(个)每百元商品
12、销每百元商品销售额中支付的售额中支付的流通费(元)流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值x=(U+L)/2 =(100+200)/2=150(万元)(万元)统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示编制等距数列编制等距数列适用于总体单位的标志值适用于总体单位的标志值变动比较均匀的情况变动比较均匀的情况实例实例己知某地区某年己知某地区某年己知某地区某年己知某地区某年5050个
13、商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单个商店商品销售额的资料如下(单位:百万元):位:百万元):位:百万元):位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.
14、5 13.2 14.5 17.1 15.6 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.021.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。要求编制组距数列。统计学第三章统计学第三章 统计数据的整理与显示统计
15、数据的整理与显示编制步骤:编制步骤:求变异全距求变异全距确定组距及组数确定组距及组数确定组距的原则:确定组距的原则:q要能要能区分各组的性质差异区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5或或1010的整数倍的整数倍R组距组距(d)组数(组数(m)编制等距数列编制等距数列统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示计算组数(组数不宜过多,也不宜太少)计算组数(组数不宜过多,也不宜太少)上例中,取上例中,取d=5d=5,则有,则有编制等距数列编制等距数列(当(当 的结果为整数时)的结果为整数时)(当
16、(当 的结果为小数时)的结果为小数时)统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示确定组限确定组限q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。组限的表示方法组限的表示方法编制等距数列编制等距数列统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示计算次数计算次数编制等距数列编制等距数列编制编制结果:结果:销售额销售额(百万
17、元)(百万元)组中值组中值 商店数商店数5以下以下51010151520202525以上以上2.57.512.517.522.527.5410161343合计合计50分组划记法分组划记法茎叶图法茎叶图法统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示(5+(5-5))/2=2.5(25+(25+5))/2=27.5统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示茎叶表示茎叶表示 Stem-and-Leaf Display将每一观测值分解为茎值和叶值(用直线隔开)垂直线左边的数字称为“茎”,确定组别垂直线右边的数字“叶”,确定频数(计数)Xi开口式组距数列组中
18、值的计算:开口式组距数列组中值的计算:首组假定下限首组上限相邻组组距首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距末组假定上限末组下限相邻组组距先计算开口组的假定上、下限:先计算开口组的假定上、下限:因此有:因此有:首组首组组中值组中值末组末组组中值组中值STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.2 2.2 分布数列的编制分布数列的编制一、分布数列的定义及种类一、分布数列的定义及种类二、变量数列的编制二、变量数列的编制三、累计次数与累计频率三、累计次数与累计频率频率频率各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重累计次数(频率
19、)累计次数(频率)从变量值从变量值低低的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值高高的组累计,的组累计,说明某一组说明某一组上限以下各组的累计次数上限以下各组的累计次数(频率)(频率)。向向上上累累计计向向下下累累计计 从变量值从变量值高高的组开始,将各组次数的组开始,将各组次数(频率)逐次向变量值(频率)逐次向变量值低低的组累计,的组累计,说明某一组说明某一组下限以上各组的累计次数下限以上各组的累计次数(频率)(频率)。统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示频数表频数表(用(用SPSS制作)制作)有效有效数据数据频数频数频率频
20、率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向上向上累计累计5以下以下51010151520202525以上以上4101613438203226864143043475082860869
21、4100合计合计50100统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计5以下以下51010151520202525以上以上410161343820322686414304347505046362073828608694100100927240146合计合计50100统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示 第二章第二章
22、 统计数据的描述统计数据的描述3.1 3.1 统计整理与统计分组统计整理与统计分组3.2 3.2 分布数列的编制分布数列的编制3.3 3.3 统计图表统计图表2.4 2.4 分布集中趋势分布集中趋势2.4 2.4 分布离中趋势分布离中趋势STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.3 2.3 统计图表统计图表一、统计图一、统计图二、统计表二、统计表统计图统计图以点、线条、面积等方法描述、以点、线条、面积等方法描述、显示统计数据的形式显示统计数据的形式具有直观、醒目、易于理解等特点具有直观、醒目、易于理解等特点组成:组成:坐标系坐标系图形图形图例图例单式图单式图
23、复合图复合图叠加图叠加图一个图只用来显示一种现象的一个图只用来显示一种现象的数量特征数量特征用一个图同时显示几种数量的用一个图同时显示几种数量的分布或变化情况分布或变化情况统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示几种常用的统计图几种常用的统计图条形图条形图(BarBar)用于显示离散型变量的次数分布用于显示离散型变量的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示几种常用的统计图几种常用的统计图条形图条形图(BarBar)用于显示离散型变量的次数分布用于显示离散型变量的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显
24、示几种常用的统计图几种常用的统计图条形图条形图(BarBar)用于显示离散型变量的次数分布用于显示离散型变量的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示几种常用的统计图几种常用的统计图条形图条形图(BarBar)用于显示离散型变量的次数分布用于显示离散型变量的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示条形图条形图(BarBar)用于显示离散型变量的次数分布用于显示离散型变量的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示直方图直方图(Histogram )用于显示连续型变量的用于显示连续型变量的次数分布
25、次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示直方图直方图条形图条形图圆形图圆形图(饼图饼图 Pie )主要用于显示定类变量主要用于显示定类变量的次数分布的次数分布统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示线图线图(LineLine)主要用于显示连续型变量的次主要用于显示连续型变量的次数分布和现象的动态变化数分布和现象的动态变化统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示散点图散点图(Sca
26、tterScatter)主要用来观察变量间的相关主要用来观察变量间的相关关系,也可显示数量随时间关系,也可显示数量随时间的变化情况的变化情况统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示STAT统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示2.3 2.3 统计图表统计图表一、统计图一、统计图二、统计表二、统计表具有容量大、方便计算等特点具有容量大、方便计算等特点统计表的常用结构:统计表的常用结构:统计表统计表以纵横交叉的线条所形成的表格以纵横交叉的线条所形成的表格来表现统计资料的形式来表现统计资料的形式统计学第三章统计学第三章 统计数据的整理与显示统计数
27、据的整理与显示总总 标标 题题宾词栏宾词栏主词栏主词栏数据栏数据栏某地区某地区100个百货商店个百货商店月销售额与流通费用情况月销售额与流通费用情况统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示销售额(万元)销售额(万元)每百元商品销售额中每百元商品销售额中支付的流通费(元)支付的流通费(元)213536394545464732936038718.316.917.215.614.714.213.612.98.27.17.6按销售额分组按销售额分组(万元)(万元)商店数商店数(个)(个)每百元商品销售额每百元商品销售额中支付的流通费中支付的流通费(元)(元)50以下以下501
28、00100200200300300以上以上102030251514.211.410.19.28.5统计表的编制规则统计表的编制规则统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示q选择合适的总标题;选择合适的总标题;q主词栏与宾词栏要各归其位,相互对主词栏与宾词栏要各归其位,相互对应;应;q表的上、下端用粗线或双线封口,左表的上、下端用粗线或双线封口,左右两端一般不封口;右两端一般不封口;q可在各列的文字标题下面设置编号加可在各列的文字标题下面设置编号加以标识;以标识;q数据栏不能有空白。数据栏不能有空白。统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示统计
29、表的加工方法统计表的加工方法对主词栏加工对主词栏加工对宾词栏加工对宾词栏加工(对主体进行分组)(对主体进行分组)单式加工单式加工复式加工复式加工(选择指标及对指标进行分组)(选择指标及对指标进行分组)简单分组简单分组交叉分组交叉分组对主词栏的单式加工对主词栏的单式加工统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示对主词栏的复式加工对主词栏的复式加工统计学第三章统计学第三章 统计数据的整理与显示统计数据的整理与显示按月工资按月工资按月工资按月工资分组分组分组分组按性别分(人按性别分(人按性别分(人按性别分(人)按级别分按级别分按级别分按级别分小计小计小计小计男男男男女女女女小
30、计小计小计小计技工技工技工技工学徒工学徒工学徒工学徒工300300以下以下以下以下300300400400400400500500500500600600600600700700700700以上以上以上以上4 416162222151510105 51 16 6101011118 84 43 3101012124 42 21 14 416162222151510105 50 02 24 45 58 85 54 41414181810102 20 0合计合计合计合计727240403232727224244848对宾词栏的简单分组对宾词栏的简单分组按月工资按月工资按月工资按月工资分组分组分组分组
31、按级别分(人)按级别分(人)按级别分(人)按级别分(人)总总总总计计计计技工技工技工技工学徒工学徒工学徒工学徒工小计小计小计小计男男男男女女女女小计小计小计小计男男男男女女女女对宾词栏的交叉分组对宾词栏的交叉分组思考题思考题 Thinking Challenge我没办法有效率的分配人手销售浮动太大了!生产经理生产经理的演示图:营销经理的演示图:36394245JMMJSN0 204060JMMJSN数据表示中的错误数据表示中的错误Errors in Presenting Data1.使用使用花哨花哨(Junk)图表图表2.数据比较时没有可靠数据比较时没有可靠的相对基准的相对基准3.压缩纵轴压缩
32、纵轴Compressing the Vertical Axis4.纵轴上无零点纵轴上无零点No Zero Point on the Vertical Axis花哨花哨图表图表Chart Junk不准确的表示不准确的表示准确的表示准确的表示1960:$1.001970:$1.601980:$3.101990:$3.80最低工资最低工资0241960197019801990$花哨花哨图表图表Chart Junk 在报纸、杂志上的图表里通常都会加上花在报纸、杂志上的图表里通常都会加上花哨的图标和符号以增加吸引力,这种做法哨的图标和符号以增加吸引力,这种做法常常会掩盖或曲解数据应传递的准确信息常常会掩
33、盖或曲解数据应传递的准确信息实例实例1 1:“人民生活步步高”北京日报1997年9月10日实例实例2 2:北大画册(英文版)2001无相对基准无相对基准No Relative Basis准确的表示准确的表示按年级统计的按年级统计的A按年级统计的按年级统计的A 不准确的表示不准确的表示0100200300大一大一大二大二 大三大三 大四大四频数频数0%10%20%30%大一大一大二大二 大三大三 大四大四百分比百分比无相对基准无相对基准No Relative Basis 通常百分比之间较为可比,而绝对数之通常百分比之间较为可比,而绝对数之间比较却可能产生误解。间比较却可能产生误解。不适当的图标不
34、适当的图标也会影响数据比较的准确性也会影响数据比较的准确性。实例实例3 3:“Liquid Gold:Australians are Changing the World of Wine,”Time,November 22,1999实例实例4 4:“工业生产增幅快”北京青年报2000年9月12日压缩纵轴压缩纵轴Compressing Vertical Axis季度销售季度销售季度销售季度销售不准确的表示不准确的表示025501季季2季季3季季 4季季$01002001季季 2季季3季季 4季季$准确的表示准确的表示实例分析实例分析 Case Analysis纵坐标设定不恰当实例实例5 5:共同
35、基金宣传资料Investing for Growth:Investing for Growth:One Group Mutual Funds实例实例6 6:“亚马逊公司股票走势图”北京青年报2000年7月31日纵轴无零点纵轴无零点No Zero Point on Vertical Axis月销售量月销售量月销售量月销售量不准确的表示不准确的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$准确的表示准确的表示纵轴无零点纵轴无零点No Zero Point on Vertical Axis没有在纵坐标上指出零点实例实例7 7:“经济增长速度和物价上涨幅度”人民日报1997年9月11日实例实例8 8:“居家过日子那个城市花销大”金融时报2000年9月1日