《组距式变量分布数列.ppt》由会员分享,可在线阅读,更多相关《组距式变量分布数列.ppt(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计基础统计基础财会部财会部许许 丽丽 君君课前回顾变量分布数列单项式变量分布数列【教学目标教学目标】组距式变量分布数列概念、类型、编制组距式变量分布数列概念、类型、编制【教学重点、难点教学重点、难点】组距式变量分布数列的编制组距式变量分布数列的编制组距式变量分布数列组距式变量分布数列 组距式变量分布数列组距式变量分布数列一、组距式变量分布数列的概念一、组距式变量分布数列的概念组距式变量分布数列组距式变量分布数列概概念念 每一组别都是由数域(区间)表示,则每一组别都是由数域(区间)表示,则称为组距式变量分布数列。称为组距式变量分布数列。适用于离散型变量和连续型变量,变量值多,变动范围适用于离散
2、型变量和连续型变量,变量值多,变动范围较大的情况。较大的情况。将原始数据按顺序排列起来将原始数据按顺序排列起来,并确定变量性质并确定变量性质 计算全距计算全距 确定组限、组距和组数确定组限、组距和组数 写出组限并据以归类汇总计算各组次数写出组限并据以归类汇总计算各组次数编制整理表编制整理表二、组距式变量数列的编制二、组距式变量数列的编制 组距式变量分布数列组距式变量分布数列三、组距式变量分布数列的类型:三、组距式变量分布数列的类型:类类型型 1、等距变量分布数列、等距变量分布数列 2、开口组组距变量分布数列、开口组组距变量分布数列 3、异距变量分布数列、异距变量分布数列 组距式变量分布数列组距
3、式变量分布数列1 1、等距式变量分布数列、等距式变量分布数列 等距数列:各组组距相等的数列。等距数列:各组组距相等的数列。适用于变量值变动比较均匀、集中的情况。适用于变量值变动比较均匀、集中的情况。例例2-72-7:对某班:对某班4040名学生某科某次考试成绩按试卷登记得到名学生某科某次考试成绩按试卷登记得到如下资料:如下资料:54 60 62 97 85 52 83 79 95 80 54 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75
4、78 90 66 78 73 71 89 80 85 75 78 90 66 78 73 82 82 99 77 88 84 75 88 76 80 82 82 99 77 88 84 75 88 76 80 组距式变量分布数列组距式变量分布数列(1 1)将原始数据按顺序排列起来,并确定变量性质。)将原始数据按顺序排列起来,并确定变量性质。该例的变量为连续变量。确认变量性质,是为了正确该例的变量为连续变量。确认变量性质,是为了正确进行数列的编制和确认组限的表示方法。进行数列的编制和确认组限的表示方法。根据例根据例2-72-7,对数据按成绩有低到高排列可得到:,对数据按成绩有低到高排列可得到:5
5、2 54 60 62 66 68 70 71 73 75 52 54 60 62 66 68 70 71 73 75 76 77 77 78 78 78 79 80 80 80 76 77 77 78 78 78 79 80 80 80 81 82 82 83 84 85 85 85 86 88 81 82 82 83 84 85 85 85 86 88 88 89 89 89 89 90 93 95 97 99 88 89 89 89 89 90 93 95 97 99 组距式变量分布数列组距式变量分布数列(2)计算全距。确认全距是是为了适当进行分组。)计算全距。确认全距是是为了适当进行分组
6、。全距全距是指在全部变量值中最大变量值与最小变量值的差距。是指在全部变量值中最大变量值与最小变量值的差距。全距全距=最大变量值最大变量值-最小变量值最小变量值 上例中,该班成绩全距上例中,该班成绩全距=99-52=47 在计算组数与组距时所使用的变量值在计算组数与组距时所使用的变量值 最小值最小值略低于略低于现实资料的最小值,自现实资料的最小值,自50分开始,分开始,最大值最大值略高于略高于现实资料的最大值,取至现实资料的最大值,取至100分。分。则全距为则全距为 100-50=50。组距式变量分布数列组距式变量分布数列(3)确认组限、组距和组数。)确认组限、组距和组数。组限组限是指每个组的两
7、端变量值。是指每个组的两端变量值。每个组的最大值(或称终点值)为每个组的最大值(或称终点值)为上限上限。每个组的最小值(或称起点值)为每个组的最小值(或称起点值)为下限下限。组距组距是指每个组中的最大值与最小值之差。是指每个组中的最大值与最小值之差。组距组距=上限上限-下限下限 组数组数是指某个变量数列应划分为多少个组。是指某个变量数列应划分为多少个组。组数组数全距全距组距组距 组距式变量分布数列组距式变量分布数列组距组距全距全距组数组数例题中全距为例题中全距为 100-50=50一定,而组数与组距是可变的。一定,而组数与组距是可变的。一般组距应尽可能取一般组距应尽可能取5或或10的整倍数,而
8、组数则必须是整数。的整倍数,而组数则必须是整数。根据例根据例2-7确定组数为:确定组数为:若组距为若组距为5,组数,组数=全距全距/组距组距=50/5=10(组)(组)若组距为若组距为10,组数,组数=全距全距/组距组距=50/10=5(组)(组)上例适合以上例适合以10为组距,分为为组距,分为5组。组。组距式变量分布数列组距式变量分布数列(4)写出组限并据以归类汇总计算各组次数。)写出组限并据以归类汇总计算各组次数。归类汇总归类汇总是指依据各个总体单位的具体标志值,将其归入某一是指依据各个总体单位的具体标志值,将其归入某一具体组中。具体组中。归类汇总时,要遵循归类汇总时,要遵循“不重复,不遗
9、漏不重复,不遗漏”的基本原则。的基本原则。相邻两组之间的组限以相同数值标记,称为重限分组。相邻两组之间的组限以相同数值标记,称为重限分组。重限分组时,要遵循重限分组时,要遵循“上限不在内上限不在内”的原则。如表的原则。如表2-13所示。所示。组距式变量分布数列组距式变量分布数列(5)编制整理表)编制整理表将数据用表格形式表现出来。将数据用表格形式表现出来。左端左端是各组的变量值,是各组的变量值,右端右端是各组变量值出现的频数(频率)。是各组变量值出现的频数(频率)。可以通过画可以通过画“正正”字来记录每组变量值出现的频数。表字来记录每组变量值出现的频数。表2-13所示。所示。归类汇总后,便可计
10、算频数如表归类汇总后,便可计算频数如表2-14所示。所示。组距式变量分布数列组距式变量分布数列【例例2-8】对某班对某班40名学生某次考试成绩按试卷登记得到如下资料名学生某次考试成绩按试卷登记得到如下资料 64 70 89 64 56 95 98 79 88 88 78 89 60 78 68 79 79 95 68 70 78 89 100 36 75 84 78 64 78 85 85 79 70 84 68 75 89 75 78 75(1)将原始资料按变量指大小的顺序重新排列。)将原始资料按变量指大小的顺序重新排列。36 56 60 60 64 64 64 68 68 68 70 70
11、 75 75 75 75 78 78 78 78 78 78 79 79 79 79 84 84 85 85 88 88 89 89 89 89 95 95 98 100 组距式变量分布数列组距式变量分布数列考试成绩(分)不含上限考试成绩(分)不含上限考试人数(人)考试人数(人)30-4040-5050-6060-7070-8080-9090-100101816103合计合计39 按等距变量编制数列,其结果如表按等距变量编制数列,其结果如表2-15。表表2-15 某班学生某科考试成绩某班学生某科考试成绩 组距式变量分布数列组距式变量分布数列2.开口组组距变量分布数列开口组组距变量分布数列 注意
12、:注意:变量值是否会因上限不在内而被漏掉了。变量值是否会因上限不在内而被漏掉了。表表2-15中,中,100分者被漏掉了。分者被漏掉了。成绩在成绩在60分以下只有分以下只有2人,特意为这人,特意为这2人开设三个组没有必要。人开设三个组没有必要。并且此并且此2人皆属于不及格者,人皆属于不及格者,为了避免出现空白组或个别极端值被遗漏可以采用开口组标记。为了避免出现空白组或个别极端值被遗漏可以采用开口组标记。组距变量数列中缺上限或缺下限的组叫组距变量数列中缺上限或缺下限的组叫开口组。开口组。第一组和最后一组可以标记为:第一组和最后一组可以标记为:“XX以下以下”、“XX以上以上”。开口组的组距通常开口
13、组的组距通常以相邻组组距作为其组距以相邻组组距作为其组距。重新编制该班学生考试成绩的,其结果如表重新编制该班学生考试成绩的,其结果如表2-16所示。所示。组距式变量分布数列组距式变量分布数列两个开口组,第一组与最末组组距分别是两个开口组,第一组与最末组组距分别是?每个组上限与下限的中点值叫组中值,它是各组变量值的代每个组上限与下限的中点值叫组中值,它是各组变量值的代表性水平。表性水平。(2)编制开口组组距变量数列。)编制开口组组距变量数列。组距式变量分布数列组距式变量分布数列组中值的一般计算方法如下:组中值的一般计算方法如下:闭口组(上下限齐全)的组中值,可按下列公式计算:闭口组(上下限齐全)
14、的组中值,可按下列公式计算:缺上限或缺下限的开口组的组中值,可按下列公式计算:缺上限或缺下限的开口组的组中值,可按下列公式计算:组距式变量分布数列组距式变量分布数列第一组组中值是第一组组中值是?第二组组中值是第二组组中值是?最末组组中值是最末组组中值是?异距数列:各组组距不相等的数列。异距数列:各组组距不相等的数列。任何事物都有质和量两个方面。没有质任何事物都有质和量两个方面。没有质,也就没有量;也就没有量;没有量没有量,也就没有质。也就没有质。统计所研究的量统计所研究的量,都有质的规定性都有质的规定性,离开事物质的规定性离开事物质的规定性,统计就不能研究它的量。统计就不能研究它的量。同时同时
15、,量变会引起质变。量变会引起质变。因此因此,在兼顾质与量两个方面时在兼顾质与量两个方面时,可采用异距式变量分布可采用异距式变量分布数列。数列。3 3、异距式变量分布数列、异距式变量分布数列 组距式变量分布数列组距式变量分布数列 组距式变量分布数列组距式变量分布数列 组距式变量分布数列组距式变量分布数列第一组组中值是第一组组中值是?第二组组中值是第二组组中值是?最末组组中值是最末组组中值是?组距式变量分布数列的概念组距式变量分布数列的概念组距式变量分布数列的编制组距式变量分布数列的编制组距式变量分布数列的类型组距式变量分布数列的类型 组距式变量分布数列组距式变量分布数列1、某村农民人均收入最高为
16、、某村农民人均收入最高为426元,最低为元,最低为270元,据此分为六元,据此分为六个组,形成闭口式等距数列,则组距应为(个组,形成闭口式等距数列,则组距应为()A.71 B.26 C.156 D.3482、编制组距式变量分布数列(从小到大)顺序排列时,划分组、编制组距式变量分布数列(从小到大)顺序排列时,划分组限时相邻组的上下限重叠时,则(限时相邻组的上下限重叠时,则()A.与上限相等的标志值计入小一组与上限相等的标志值计入小一组 B.与下限相等的标志值计入大一组与下限相等的标志值计入大一组 C.与上限相等的标志值计入大一组与上限相等的标志值计入大一组 D.与下限相等的标志值计入小一组与下限
17、相等的标志值计入小一组3、一个容量为、一个容量为80的样本最小值是的样本最小值是50,最大值是,最大值是143,其组距为,其组距为10,则可以分成(,则可以分成()组。)组。A.7 B.8 C.9 D.10BCD单项选择题1、将某班学生的统计考试成绩分为将某班学生的统计考试成绩分为60分一下、分一下、6070分、分、7080分、分、8090分、分、90100分共五个组。正确的说法是(分共五个组。正确的说法是()A.某学生的成绩如果是某学生的成绩如果是80分,他应分为分,他应分为7080分这一组。分这一组。B.第一组的第一组的组中值是组中值是55 C.相邻组组限是重叠的相邻组组限是重叠的 D.第
18、三组组中值是第三组组中值是752、对一些企业按计划完成程度不同分为三组;第一组为对一些企业按计划完成程度不同分为三组;第一组为80100,第二组为第二组为100120,第三组为,第三组为120以上,则(以上,则()A.若将上述各组组别及次数依次排列,就是变量分布数列若将上述各组组别及次数依次排列,就是变量分布数列 B.该数列的变量属于连续变量,所以相邻组的组限必须重叠该数列的变量属于连续变量,所以相邻组的组限必须重叠 C.此类数列只能是等距数列,不可能采取异距数列此类数列只能是等距数列,不可能采取异距数列 D.各组的上限分别为各组的上限分别为80、100、120,某企业计划完成,某企业计划完成
19、100应归第一组应归第一组3、组中值的计算公式为组中值的计算公式为()。A.组中值组中值=(上限上限+下限下限)2 B.组中值组中值=上限上限+(上上限限下下限限)2 C.组中值组中值=上限上限2+下限下限 D.组中值组中值=下限下限+(上限下限上限下限)2BCDAB多项选择题ABD 习题册习题册P24:17题编制组距为题编制组距为15的组距式变量分布数列的组距式变量分布数列感谢您的光临!感谢您的光临!4.组距式变量分布数列的图形描述常用的用于描述组距式变量分布数列的图形有直方图、折线图、圆滑曲线图。(1)直方图(2)折线图(3)圆滑曲线图例:某林地上有云杉1000株,分组整理得到分布数列,如图所示。无垠文海 邀你畅享更改更改PPTPPT母版功能键:母版功能键:PPTPPT文档讨论群:文档讨论群:253147947253147947