《人教版高中数学:2.2.2《用样本的数字特征估计总体的数字特征》课件(2)(新人教B必修3).ppt》由会员分享,可在线阅读,更多相关《人教版高中数学:2.2.2《用样本的数字特征估计总体的数字特征》课件(2)(新人教B必修3).ppt(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.2 用样本的数字特征用样本的数字特征估计总体的数字特征估计总体的数字特征2021/8/9 星期一1平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中数中数:将一组数据按大小依次排列,:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位两个数据的平均数)叫做这组数据的中位数数 众数众数:在一组数据中,出现次数最多:在一组数据中,出现次数最多的数据叫做这组数据的众数的数据叫做这组数据的众数 2021/8/9 星期一2 二二、众数、
2、中位数、平均数众数、中位数、平均数与频率分布直方图的关系与频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。例如,在上一节调查的例如,在上一节调查的100位居民的月位居民的月均用水量的问题中,从这些样本数据的频率均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是分布直方图可以看出,月均用水量的众数是2.25t.如图所示:如图所示:2021/8/9 星期一3频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水
3、量(t)2021/8/9 星期一4 2、在样本中,有在样本中,有50的个体小于或等于的个体小于或等于中位数,也有中位数,也有50的个体大于或等于中位的个体大于或等于中位数数,因此,在频率分布直方图中,中位数左,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为均用水量的中位数的估计值,此数据值为2.02t.2021/8/9 星期一5频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5
4、4 4.5 月平均用水量月平均用水量(t)2021/8/9 星期一6 2.02这个中位数的估计值这个中位数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致.2.02这个中位数的估计值这个中位数的估计值,与样本的中与样本的中位数值位数值2.0不一样不一样,你能解
5、释其中的原因吗?你能解释其中的原因吗?2021/8/9 星期一7 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.n 个样本数据的平均个样本数据的平均数由公式数由公式:X=给出给出.下图显示了居民月均用水量的平下图显示了居民月均用水量的平均数均数:x=1.9732021/8/9 星期一8频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)2021/8/9 星期一9三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中
6、点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.2021/8/9 星期一10 2、中位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感
7、有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。2021/8/9 星期一11 3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本
8、数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。2021/8/9 星期一12四四 众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例1 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理 管理人员管理人员 高级技工高级技工 工人工人学徒学徒 合计合计周工资周工资2200250220200100人数人数16510123合计合计2200150011002000100 6900(1)指出这个问题中周工资的众数、中)指出这个问题中周
9、工资的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么?2021/8/9 星期一13 分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出的数据,由表格中所列出的数据可见,只有经理在平均数以上,其余的人可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。实地反映该工厂的工资水平。2021/8/9 星期一142021/8/9 星期
10、一152021/8/9 星期一162021/8/9 星期一172021/8/9 星期一182021/8/9 星期一192021/8/9 星期一2090 100 110 120 130 140分分数数频率频率0.450.050.151 1、某市高三数学抽样考试中,对、某市高三数学抽样考试中,对9090分以上分以上(含(含9090分)的成绩进行统计,其频率分布图分)的成绩进行统计,其频率分布图如图,若如图,若130130140140分数段的人数为分数段的人数为9090人;则人;则9090100100分数段的人数为:分数段的人数为:;810(2003,安徽)2021/8/9 星期一212 2、一个容
11、量为、一个容量为2020的样本数据的样本数据.分组后分组后.组距与频组距与频数如下:数如下:(0,20 2;(20,30 3,(30,40 4;(0,20 2;(20,30 3,(30,40 4;(40,50 5;(50,60 4;(60,70 2(40,50 5;(50,60 4;(60,70 2。则样本。则样本在在(,50,50上的频率为:上的频率为:,7/10(2002,江西)2021/8/9 星期一222400 2700 3000 3300 3600 3900X 体重体重y0.0013 3、观察新生婴儿的体重,其频率分布直方图、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重如图所示,则新生婴儿体重(2700,3000)(2700,3000)的频的频率为:率为:;0.32021/8/9 星期一234、某射手对、某射手对100个靶各射击个靶各射击5次,记下命中次,记下命中数,设计结果如下:数,设计结果如下:频数频数43210命中数命中数514312918351、列出频率分布表;、列出频率分布表;2、画出分布频率条形图;、画出分布频率条形图;3、求命中不少于、求命中不少于3次的概率。次的概率。(2003,东北)2021/8/9 星期一24