《众数中位数和平均数ppt课件.ppt》由会员分享,可在线阅读,更多相关《众数中位数和平均数ppt课件.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、问题提出问题提出在前面几节课中,我们学习了用图、表来在前面几节课中,我们学习了用图、表来组织样本数据,用样本的分布情况估计总组织样本数据,用样本的分布情况估计总体的分布情况。为了从整体上更好地把握体的分布情况。为了从整体上更好地把握总体的规律,我们还应从哪些方面来对总总体的规律,我们还应从哪些方面来对总体的数字特征进行研究?体的数字特征进行研究?一、用众数、中位数、平均数来反映一、用众数、中位数、平均数来反映总体的平均状况总体的平均状况二、用方差和标准差来反映总体的波二、用方差和标准差来反映总体的波动状况动状况目标导学目标导学1、正确理解众数、中位数、平均数的、正确理解众数、中位数、平均数的概
2、念,能够计算和估计样本的数字特概念,能够计算和估计样本的数字特征。征。2、通过对样本数据提取的基本数字特、通过对样本数据提取的基本数字特征进行合理的解释,进一步体会统计征进行合理的解释,进一步体会统计的思想,培养应用意识和能力。的思想,培养应用意识和能力。一、了解众数、中位数、平均数的概念一、了解众数、中位数、平均数的概念 众数:众数:在一组数据中,出现次数最多在一组数据中,出现次数最多的数据叫做这组数据的众数的数据叫做这组数据的众数 众数、中位数、平均数众数、中位数、平均数都是描述一组都是描述一组数据的集中趋势的特征数,只是描述的角数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应
3、用最为广泛度不同,其中以平均数的应用最为广泛.)xxx(n1n21平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 x= 中位数:中位数:将一组数据按大小依次排列,将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的间两个数据的平均数)叫做这组数据的中位数中位数 练习练习1: 在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成绩成绩(单单位:位:米米)150160165170175180185190人数人数232341
4、11分别求这些运动员成绩的众数、中位数与分别求这些运动员成绩的众数、中位数与平均数平均数 。二、学会求众数,中位数和平均数二、学会求众数,中位数和平均数解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间的是最中间的一个数据,即这组数据的中位数是一个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数
5、名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米). 练习练习2:在某赛季中,甲运动员在在某赛季中,甲运动员在15场场比赛的得分如下:比赛的得分如下: 12,15,24,25,31,31,31,36,37,44,49,50,53,53,62分别求甲运动员成绩的众数,中位数分别求甲运动员成绩的众数,中位数与平均数与平均数 。问:如果上面的数据改为:问:如果上面的数据改为:12,15,24,25,31,31,31,36,37,44,49,50,53,53,102众数,中位数与平均数的结果有何改变?众数,中位数与平均数的结果有何改变?
6、练习练习3:已知已知100位居民月均用水量的位居民月均用水量的频率分布表和频率分布直方图(课本频率分布表和频率分布直方图(课本67页),试求出该组数据的众数、中位数页),试求出该组数据的众数、中位数和平均数和平均数 下面,让我们看看从原始数下面,让我们看看从原始数据中得到的三个量的值分别是据中得到的三个量的值分别是多少。多少。思考:你能解释为什么结果不同吗?思考:你能解释为什么结果不同吗? 归纳:归纳: 众数、中位数、平均众数、中位数、平均数与频率分布直方图的关系数与频率分布直方图的关系 1.众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是中,就是最高矩形的中点的横坐标最高
7、矩形的中点的横坐标。频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 2.在样本中,有在样本中,有50的个体小于或等的个体小于或等于中位数,也有于中位数,也有50的个体大于或等于中的个体大于或等于中位数,因此,在频率分布直方图中,位数,因此,在频率分布直方图中,中位中位数左边和右边的直方图的面积应该相等数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。由此可以估计中位数的值。频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)3、平均数是
8、频率分布直方图的、平均数是频率分布直方图的“重重心心”.是直方图的平衡点。等于频率分布直是直方图的平衡点。等于频率分布直方图中每个小矩形的面积(即方图中每个小矩形的面积(即落在该落在该组中的频率组中的频率)乘以乘以小矩形底边中点的小矩形底边中点的横坐标(横坐标(组中值组中值)之和之和。频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)日睡眠时间日睡眠时间/h人数人数频率频率6, 6.5) 5 0.056.5, 7) 17 0.177 , 7.5)330.337.5, 8)370.378, 8.5)6 0.068.5, 9
9、)20.02合计合计1001练习练习4.某校学生日睡眠时间的抽样频率分布见下表某校学生日睡眠时间的抽样频率分布见下表:试估计该校学生的平均日睡眠时间试估计该校学生的平均日睡眠时间练习练习5.某校为了了解学生的课外阅读情况某校为了了解学生的课外阅读情况,随机抽查了随机抽查了50名学生名学生,得到他们在某一天各自课外阅读所用时间的得到他们在某一天各自课外阅读所用时间的数据数据,结果用如图所示的条形图表示结果用如图所示的条形图表示,根据条形图可得这根据条形图可得这50名学生这一天平均每人的课外阅读时间为名学生这一天平均每人的课外阅读时间为( )A. 0.6h B. 0.9h C. 1.0h D. 1
10、.5h时间时间(h)人数人数5102000.51.01.52.0B练习练习6:”八八.一一”前夕前夕,某中学举行国防知识竞赛某中学举行国防知识竞赛:满满分为分为100分分,80分以上为优秀分以上为优秀,现将高一的两个班参赛现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图率分布直方图,已知图中从左到右的第一、第二、第已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是三、第四、第五小组的频率分别是0.3,0.4,0.15,0.1,0.0550 60 70809010000.0050.0100.0150.030.
11、04 求:求:(1)成绩的众数、)成绩的众数、 中位数;中位数;(2)平均成绩)平均成绩频率频率/组距组距三三 三种数字特征的优缺点三种数字特征的优缺点1.众数众数体现了样本数据的最大集体现了样本数据的最大集中点,中点,但它对其它数据信息的忽但它对其它数据信息的忽视使得无法客观地反映总体特征视使得无法客观地反映总体特征.如前面例中众数是如前面例中众数是2.25t,它告诉我它告诉我们们,月均用水量为月均用水量为2.25t的居民数比的居民数比月均用水量为其它数值的居民数月均用水量为其它数值的居民数多多,但它并没有告诉我们多多少但它并没有告诉我们多多少. 2.中位数是样本数据所占频率的中位数是样本数
12、据所占频率的等分线,它等分线,它不受少数几个极端值的影不受少数几个极端值的影响响,这在某些情况下是优点,但它对极这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为上例中假设有某一用户月均用水量为10t,那么它所占频率为,那么它所占频率为0.01,几乎不几乎不影响中位数影响中位数,但显然这一极端值是不能但显然这一极端值是不能忽视的。忽视的。 3.由于平均数与每一个样本的数由于平均数与每一个样本的数据有关,所以据有关,所以任何一个样本数据的改任何一个样本数据的改变都会引起平均数的改变,这是众数、变都会引起平均数的改变,这是
13、众数、中位数都不具有的性质。中位数都不具有的性质。也正因如此也正因如此 ,与众数、中位数比较起来,与众数、中位数比较起来,平均数可平均数可以反映出更多的关于样本数据全体的以反映出更多的关于样本数据全体的信息,信息,但平均数受数据中的极端值的但平均数受数据中的极端值的影响较大,影响较大,使平均数在估计时可靠性使平均数在估计时可靠性降低。降低。 练习练习7 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理 管理人员管理人员 高级技工高级技工 工人工人学徒学徒 合计合计周工资周工资2200 250220200100人数人数16510123合计合计2200 150011002000
14、 1006900(1)指出这个问题中周工资的众数、中)指出这个问题中周工资的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么? 分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。 因平均数为因平均数为300,由表格中所列出的数据可,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂数以下,故用平均数不能客观真实地反映该工厂的工资水平。的工资水平。评注评
15、注:平均数受数据中的极端值的影响较大平均数受数据中的极端值的影响较大,妨碍了对总妨碍了对总体估计的可靠性体估计的可靠性,这时平均数反而不如众数、中位数更这时平均数反而不如众数、中位数更客观。客观。练习练习8.从甲、乙、丙三个产品中,各抽出从甲、乙、丙三个产品中,各抽出8件产品,对件产品,对其使用寿命进行跟踪调查,结果如下(单位:年)其使用寿命进行跟踪调查,结果如下(单位:年)甲:甲:3,4,5,6,8,8,8,10乙:乙:4,6,6,6,8,9,12,13丙:丙:3,3,4,7,9,10,11,12三家广告中都称该种产品的使用寿命是三家广告中都称该种产品的使用寿命是8年,请根据年,请根据调查结
16、果判断厂家在广告中分别运用了平均数、众数、调查结果判断厂家在广告中分别运用了平均数、众数、中位数中哪一种集中趋势的特征数。中位数中哪一种集中趋势的特征数。小结:小结:1、正确理解众数、中位数、平均数的概念;、正确理解众数、中位数、平均数的概念;2、能够计算和估计样本的数字特征(尤其是利用、能够计算和估计样本的数字特征(尤其是利用频率分布表和直方图)。频率分布表和直方图)。3、通过对样本数据提取的基本数字特征进行合理、通过对样本数据提取的基本数字特征进行合理的解释,体会三个特征的优缺点,进一步体会统计的解释,体会三个特征的优缺点,进一步体会统计的思想,培养应用意识和能力。的思想,培养应用意识和能
17、力。目标导学目标导学1、通过实例体会分布的意义和、通过实例体会分布的意义和作用。学会列频率分布表、画频作用。学会列频率分布表、画频率分布直方图、频率折线图、茎率分布直方图、频率折线图、茎叶图,体会它们各自的特点。叶图,体会它们各自的特点。2、会解决一些简单的实际问题。、会解决一些简单的实际问题。统计的基本思想方法统计的基本思想方法 用样本估计总体,即通常不直用样本估计总体,即通常不直接去研究总体,而是通过接去研究总体,而是通过从总体中从总体中抽取一个样本抽取一个样本,根据样本的情况去根据样本的情况去估计总体的相应情况估计总体的相应情况. .统计的核心问题统计的核心问题 如何根据样本的情况对总体
18、的情如何根据样本的情况对总体的情况作出一种推断况作出一种推断. . 这里包括两类问题:这里包括两类问题:一类是如何从总体中抽取样本一类是如何从总体中抽取样本? ?另一类是如何根据对样本的整另一类是如何根据对样本的整理、计算、分析理、计算、分析, ,对总体的情对总体的情况作出推断况作出推断. . 用样本的有关情况去估计总体用样本的有关情况去估计总体的相应情况的相应情况, ,这种估计大体分为两这种估计大体分为两类,类,一类是用样本频率分布估计总一类是用样本频率分布估计总体分布体分布,一类是用样本的某种数字一类是用样本的某种数字特征(例如平均数、方差等)去估特征(例如平均数、方差等)去估计总体的相应
19、数字特征计总体的相应数字特征。 整体介绍整体介绍 将一批数据按要求分为若干个组,将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的各组内数据的个数,叫做该组的频数频数。 频率:每组数据的个数除以全体数频率:每组数据的个数除以全体数据个数的商叫做该组的据个数的商叫做该组的频率频率。 根据随机抽取样本的大小,分别计根据随机抽取样本的大小,分别计算某一事件出现的频率,这些频率的分算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做布规律(取值状况),就叫做样本的频样本的频率分布率分布。说明说明:样本频率分布与总体频率:样本频率分布与总体频率分布有什么关系?分布有什么关系?通过样本的通
20、过样本的频数分布频数分布、频率频率分布分布可以估计总体的频率分可以估计总体的频率分布布.如何用样本的频率分布如何用样本的频率分布估计总体分布?估计总体分布?我国是世界上严重缺水的国家之一我国是世界上严重缺水的国家之一城市缺水问题较为突出。城市缺水问题较为突出。1 1:某市政府为了节约生活用水,:某市政府为了节约生活用水,计划在本市试行居民生活用水定额计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标管理,即确定一个居民月用水量标准准a , 用水量不超过用水量不超过a的部分按平价的部分按平价收费,超过收费,超过a的部分按议价收费。的部分按议价收费。 如果希望大部分居民的日常如果希望大部
21、分居民的日常生活不受影响,那么标准生活不受影响,那么标准a定为定为多少比较合理呢?多少比较合理呢? 为了较合理地确定这个标准,为了较合理地确定这个标准,你认为你认为需要做哪些工作?需要做哪些工作?提出问题提出问题 思考思考:由上表,大家可以得到什么信息?由上表,大家可以得到什么信息? 1.1.求极差求极差: 步骤:步骤: 频率分布直方图频率分布直方图 2.2.决定组距与组数决定组距与组数: 组数组数= = 4.3 4.3 - - 0.2 = 4.10.2 = 4.14.14.10.50.5 = 8.2 = 8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5 ) ),0.5
22、0.5,1 1 ) ),4 4,4.54.5 4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图一一、求求极差极差,即数据中最大值与最小值的差,即数据中最大值与最小值的差二、决定二、决定组距与组数组距与组数 :组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开区间左闭右开区间 , 最后一组取闭区间最
23、后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以可以按以下的步骤进行下的步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2
24、)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的)的百分比是多少百分比是多少? 解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/ 组距组距12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组
25、距0.0100.0200.0300.0400.05012.5 15.50.0600.070小长方形有何实际意义?24.52、对某电子元件进行寿命跟踪调查,情况如下:、对某电子元件进行寿命跟踪调查,情况如下:1)、列出频率分布表)、列出频率分布表2)、估计电子元件寿命在)、估计电子元件寿命在100h400h以以内的频率内的频率3)、估计电子元件寿命在)、估计电子元件寿命在400h以上频以上频率率3.已知样本已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为那么频率为0.2范围的是范围的是 ( )A. 5.57.5
26、B. 7.59.5 C. 9.511.5 D. 11.513.5 分组分组 频数频数 频率频率 频数累计频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 合计合计 20 1.0D4.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组分组 频数频数 频率频率 频率累计频率累计12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1.00合计合计 100 1.00课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点.