《统计学第四章分组和次数分布精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学第四章分组和次数分布精品文稿.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第四章分组和次数分布第1页,本讲稿共27页 学习目标学习目标掌握统计分组的基本理论和方法掌握统计分组的基本理论和方法掌握分配数列的特性和编制方法掌握分配数列的特性和编制方法 第2页,本讲稿共27页重点、难点重点、难点1 1、统计分组的概念和作用、统计分组的概念和作用2 2、统计分组的原则、统计分组的原则3 3、分组标志选择及界限的确定(统计分组的关键分组标志选择及界限的确定(统计分组的关键)(单选、判断)(单选、判断)4 4、统计分组的方法、统计分组的方法(单选、判断)(单选、判断)5 5、变量数列的编制、变量数列的编制(计算)(计算)(难点)(难点)第3页,本讲稿共27页第一节第一节
2、统计分组(统计分组(统计整理的关键统计整理的关键)一、统计分组的概念和作用一、统计分组的概念和作用二、统计分组的种类二、统计分组的种类 三、统计分组的原则三、统计分组的原则四、分组标志选择及界限的确定四、分组标志选择及界限的确定 (统计分组的关键)(统计分组的关键)五、统计分组的方法五、统计分组的方法第4页,本讲稿共27页一、统计分组的概念和作用统计分组的概念和作用统计分组(统计分组(statistical classificationstatistical classification)就是就是 根据统计研究的需要和总体的内在特征,将根据统计研究的需要和总体的内在特征,将总体总体按照一按照一
3、定的标志划分为若干个组成部分的一种统计方法。定的标志划分为若干个组成部分的一种统计方法。(对总体而言是分,对个体而言是合)对总体而言是分,对个体而言是合)统计分组的作用主要体现在以下三个方面统计分组的作用主要体现在以下三个方面:1 1划分事物的类型划分事物的类型 2 2反映现象总体的内部结构反映现象总体的内部结构 3 3分析现象之间的依存关系分析现象之间的依存关系 第5页,本讲稿共27页二、统计分组的种类(二、统计分组的种类(p9094p9094)1 1按分组按分组的作用的作用或目的不同,分为或目的不同,分为类型分组、结构类型分组、结构 分组和分析分组。分组和分析分组。(补充补充)2 2按分组
4、标志的多少及其排列形式,可分为简单分组、按分组标志的多少及其排列形式,可分为简单分组、复合分组和复合分组和分组体系分组体系 平行分组体系平行分组体系(p93)(p93)复合分组体系复合分组体系(p94)(p94)3 3按分组标志的性质,可分为品质标志分组和数量标按分组标志的性质,可分为品质标志分组和数量标 志分组。志分组。三、统计分组的原则三、统计分组的原则1、保证组内单位的同质性,组间单位的差异性、保证组内单位的同质性,组间单位的差异性2、必须复合完备性原则,即所谓、必须复合完备性原则,即所谓“穷举性穷举性”。3、必须遵循、必须遵循“互斥性互斥性”原则原则 第6页,本讲稿共27页四、分组标志
5、选择及界限的确定四、分组标志选择及界限的确定统计整理的关键是统计分组,统计整理的关键是统计分组,统计分组的关键是正确选择统计分组的关键是正确选择分组标志和划分各组界限。分组标志和划分各组界限。1 1、正确选择分组标志应遵循的原则、正确选择分组标志应遵循的原则(1 1)应根据研究的目的与任务选择分组标志)应根据研究的目的与任务选择分组标志(2 2)选择最能体现现象本质特征的标志作为分组标志)选择最能体现现象本质特征的标志作为分组标志(3 3)结合现象发展的具体历史条件和经济条件选择分组结合现象发展的具体历史条件和经济条件选择分组标志标志 (补充)(补充)第7页,本讲稿共27页四、分组标志选择及界
6、限的确定四、分组标志选择及界限的确定 2、划分各组界限、划分各组界限 (1)含义:在分组标志的变异范围内,划分各相邻组间的性)含义:在分组标志的变异范围内,划分各相邻组间的性质界限和数量界限(据客观事物本身从量变到质变的内在规律质界限和数量界限(据客观事物本身从量变到质变的内在规律性确定各组间的的数量界限)性确定各组间的的数量界限)(2)原则:保证组内单位的同质性,组间单位的差异性)原则:保证组内单位的同质性,组间单位的差异性 3、确定各组的指标(、确定各组的指标(p97)统计分组是把现象总体划分为不同统计分组是把现象总体划分为不同 类型或性质不同的组,而统计指标类型或性质不同的组,而统计指标
7、 是为了揭示现象的数量特征。是为了揭示现象的数量特征。第8页,本讲稿共27页五、五、统计分组的方法统计分组的方法1、品质标志分组、品质标志分组 组数的确定取决于事物的特点和组数的确定取决于事物的特点和统计研究的任务统计研究的任务2、数量标志分组、数量标志分组(补充)(补充)单项式分组(变动范围不大的离散单项式分组(变动范围不大的离散变量)变量)组距式分组(连续性变量和变动组距式分组(连续性变量和变动范围较大的离散变量)范围较大的离散变量)数量标志分组,不是简单的确定各数量标志分组,不是简单的确定各组间的数量差异,而是通过分组体现组间的数量差异,而是通过分组体现数量变化来确定数量变化来确定现象的
8、不同性质和类现象的不同性质和类型。型。第9页,本讲稿共27页 第二节第二节 次数分布次数分布一、分配数列的定义一、分配数列的定义二、分配数列的种类二、分配数列的种类三、累计频数分布三、累计频数分布 第10页,本讲稿共27页一、分配数列的定义一、分配数列的定义 按一定次序排列的一列数称为数列(按一定次序排列的一列数称为数列(sequence of number)。数列中的每一个数都叫做这个)。数列中的每一个数都叫做这个数列的项。数列的项。1 1、定义:、定义:在在统计分组的基础上统计分组的基础上,将总体的所有单位按组进行,将总体的所有单位按组进行归类整理并按一定顺序排列,计算出归类整理并按一定顺
9、序排列,计算出各组的单位数各组的单位数,形,形成了一个反映总体中各单位在各组中的分布情况的数列,这成了一个反映总体中各单位在各组中的分布情况的数列,这个数列称为个数列称为分配数列或次数分布分配数列或次数分布(frequency frequency distributiondistribution)。)。(以此为准,书上过于简单)(以此为准,书上过于简单)分配数列由两要素分配数列由两要素组组成,成,一是一是总总体中按某体中按某标标志分的志分的组组,二是,二是各各组组相相应应的分配次数或的分配次数或频频率或率或标标志志值值。次数(次数(频频数)数)比率(比率(频频率)率)第11页,本讲稿共27页二
10、、分配数列的种类二、分配数列的种类(1 1)分配数列按分)分配数列按分组标组标志特征的不同,分志特征的不同,分为为品品质质分配数列分配数列(品(品质质数列)和数列)和变变量分配数列(量分配数列(变变量数列)。量数列)。(2 2)按)按连续连续与否,与否,变变量数列分量数列分为间为间断分布数列断分布数列(以整数形式(以整数形式出出现现的数列,的数列,对应单项对应单项式式变变量数列)量数列)和和连续连续分布数列(分布数列(p100p100,表,表4-94-9和表和表4-10 4-10)(3 3)按其分)按其分组组方法的不同,可以分方法的不同,可以分为单项为单项式式变变量数列和量数列和组组距式距式变
11、变量数列。量数列。(p100p100,表,表4-94-9和表和表4-104-10)三、累计次数(频数)分布(书三、累计次数(频数)分布(书100101)()向上累计()向上累计 (上限以下上限以下)()向下累计()向下累计(下限以上下限以上)第12页,本讲稿共27页 第三第三节节 变量分布数列的编制变量分布数列的编制一、单项式变量数列(分布表)的编制一、单项式变量数列(分布表)的编制 变量值列在左方,变量值出现的次数列在右方。如变量值列在左方,变量值出现的次数列在右方。如拥有发电机组(套)发电厂属(个)比率(%)1352824838.432620.84129.6543.2合计125100第13
12、页,本讲稿共27页 生成频数分布表(例题分析)【例】某电脑【例】某电脑公司公司120120天的天的销售额数据销售额数据(单位:万元单位:万元)。生成一张频数生成一张频数分布表观察分布表观察销售额分布销售额分布的特征的特征第14页,本讲稿共27页生成频数分布表(例题分析)某电脑公司销售额的频数分布 第15页,本讲稿共27页二、二、组距式变量数列(分布表)的编制1 1、组距式变量数列(分布表)的编制步骤(、组距式变量数列(分布表)的编制步骤(p105p105)原始资料按数值大小依次排序原始资料按数值大小依次排序 计算全距计算全距确定确定组距、组数、组限和组距、组数、组限和组中值组中值(可不求)(可
13、不求)编制组距式变量数列次数分布表编制组距式变量数列次数分布表考分人数(人)比率(%)60以下2560-70717.570-801127.580-90123090-100820合计40100第16页,本讲稿共27页二、二、组距式变量数列(分布表)的编制2、注意区分的几组概念注意区分的几组概念n闭口组和开口组闭口组和开口组n等距变量数列和异距变量数列等距变量数列和异距变量数列(书(书9999页表页表4-84-8)n同限分组和异限分组同限分组和异限分组(书(书9999页表页表4-84-8)第17页,本讲稿共27页二、组距式变量数列(分布表)的编制3、确定组距和组数确定组距和组数 全距(全距(R)=
14、R)=最大值最大值-最小值最小值 组距(组距(d)=d)=上限上限-下限下限(同限分组)同限分组)组距(组距(d)=d)=本组上限本组上限-前组上限(前组上限(连续连续异限(间断)异限(间断)组数(组数(n)=R/dn)=R/d 确定组距与组数应遵循的原则:尽可能反映总体单位的分确定组距与组数应遵循的原则:尽可能反映总体单位的分布情况及总体单位的集中趋势,体现组内资料的同质性和组布情况及总体单位的集中趋势,体现组内资料的同质性和组间资料的差异性间资料的差异性,即主要据资料的性质确定组距与组数即主要据资料的性质确定组距与组数第18页,本讲稿共27页二、二、组距式变量数列(分布表)的编制4、确定组
15、限确定组限l确定组限应遵循的原则:分组后,标志值在各组的变动能反确定组限应遵循的原则:分组后,标志值在各组的变动能反映总体单位的规律性。映总体单位的规律性。确定组限应注意特殊的界限点必须作为组确定组限应注意特殊的界限点必须作为组限。限。l离散型变量的组限:由于变量值之间有离散型变量的组限:由于变量值之间有明显的界限,上下限可用明显的数值表明显的界限,上下限可用明显的数值表示,组限明确、清楚。示,组限明确、清楚。l连续型变量的组限:由于变量值之间连续型变量的组限:由于变量值之间可作无限分割,有小数存在,上下限不能用两个确定的数值表示,前可作无限分割,有小数存在,上下限不能用两个确定的数值表示,前
16、组的上限和本组的下限应同为一个数值。组的上限和本组的下限应同为一个数值。连续性变量,确定组限应遵循连续性变量,确定组限应遵循“上组限不在内上组限不在内”原则。原则。离散变量,对于同限分组也遵循离散变量,对于同限分组也遵循“上组限不在内上组限不在内”原则原则第19页,本讲稿共27页二、二、组距式变量数列(分布表)的编制5、组中值组中值 为了反映每个组的一般水平,一般采用组中值来代替组距。为了反映每个组的一般水平,一般采用组中值来代替组距。组中值具有一定的假定性,即假定次数在各组内的分布是均匀组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。的,代表了各组内的一般水
17、平。组中值的计算组中值的计算:同限分组同限分组 组中值组中值=(书(书104)缺上限的开口组缺上限的开口组 组中值组中值=下限下限+缺下限的开口组缺下限的开口组 组中值组中值=上限上限-异限分组异限分组 组中值组中值=(本组下限(本组下限+后一组下限)后一组下限)/2 (书(书69,多选,多选10题)题)第20页,本讲稿共27页第四节、变量数列次数分布图的绘制第四节、变量数列次数分布图的绘制一、单项式变量数列次数分布图编制一、单项式变量数列次数分布图编制 以以变变量量值值为为横横轴轴,以以次次数数为为纵纵轴轴,找找出出各各组组的的变变量量值值与与对对应应的的次次数数所所代代表表的的点点,将将各
18、各点点连连接接起起来来,即得分布图。即得分布图。第21页,本讲稿共27页二、组距式变量数列分布图(书106页)1 1、等距变量数列次数分布图等距变量数列次数分布图 横轴:变量值横轴:变量值 纵轴:次数纵轴:次数 组组距距为为宽宽,次次数数为为高高,画画矩矩形形,矩矩形形的的集集合合体体是是次次数数分分布图的直方图。布图的直方图。连连接接各各矩矩形形顶顶边边的的中中点点(即即各各组组的的组组中中值值),形形成成一一条条折折线线,并并在在直直方方图图的的左左右右两两边边各各假假设设有有一一个个组组,将将折折线线与与两个假设组的中点连接,就形成两个假设组的中点连接,就形成次数分布曲线(次数分布曲线(
19、次数分布图)次数分布图)第22页,本讲稿共27页分组数据看分布直方图(SPSS绘制的直方图)第23页,本讲稿共27页二、组距式变量数列分布图(书106页)2、异距变量数列次数分布图异距变量数列次数分布图 横轴:变量值横轴:变量值 纵轴:标准组距次数纵轴:标准组距次数 组组距距为为宽宽,标标准准组组距距次次数数为为高高,画画矩矩形形,矩矩形形的的集集合合体体是是次次数分布图的直方图。数分布图的直方图。连连接接各各矩矩形形顶顶边边的的中中点点(即即各各组组的的组组中中值值),形形成成一一条条折折线线,并并在在直直方方图图的的左左右右两两边边各各假假设设有有一一个个组组,将将折折线线与与两两个个假假
20、设设组组的的中中点连接,就形成点连接,就形成次数分布曲线(次数分布图)次数分布曲线(次数分布图)标准组距次数标准组距次数=该组次数密度该组次数密度*标准组距标准组距(书(书5555页实例页实例3.33.3)次数密度次数密度=各组的次数各组的次数/各组的组距各组的组距 标准组距是异距变量数列组距中最小的组距标准组距是异距变量数列组距中最小的组距第24页,本讲稿共27页(1)钟型分布(正态分布)钟型分布(正态分布)(2)U型分布型分布(3)J型分布型分布三、三、次数分布的主要类型次数分布的主要类型(书108-110)第25页,本讲稿共27页习题与实践训练习题与实践训练1 1、某班学生统计学考试成绩
21、(分)如下:、某班学生统计学考试成绩(分)如下:93 50 78 85 66 71 63 83 52 95 93 50 78 85 66 71 63 83 52 95 78 72 85 78 82 90 80 55 95 6778 72 85 78 82 90 80 55 95 6772 85 77 70 90 70 76 69 58 89 72 85 77 70 90 70 76 69 58 89 80 61 67 99 89 63 78 74 82 8880 61 67 99 89 63 78 74 82 8898 62 81 24 76 86 73 83 85 8198 62 81 24
22、 76 86 73 83 85 81根据上述资料,根据上述资料,(1 1)编制组距数列,说明每一组的上下限、组中值。)编制组距数列,说明每一组的上下限、组中值。(2 2)绘制次数分布的曲线图,据此分析成绩分布的特点。)绘制次数分布的曲线图,据此分析成绩分布的特点。(3 3)编制累计频数分布表,并回答)编制累计频数分布表,并回答6060分以下及分以下及8080分以上的人数。分以上的人数。第26页,本讲稿共27页习题与实践训练习题与实践训练 2 2、利用第二章、利用第二章“应用能力训练题应用能力训练题5”5”所搜集的资料,所搜集的资料,(1 1)按性别分组,编制品质分配数列)按性别分组,编制品质分配数列(2 2)按年龄分组,编制单项式变量数列)按年龄分组,编制单项式变量数列(3 3)按身高分组,编制组距式变量数列)按身高分组,编制组距式变量数列第27页,本讲稿共27页