《222《用样本的数字特征估计总体的数字特征》.ppt》由会员分享,可在线阅读,更多相关《222《用样本的数字特征估计总体的数字特征》.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.2 2.2.2 用样本的用样本的数字特征估计总体数字特征估计总体的数字特征的数字特征1.1.众数、中位数、平均数众数、中位数、平均数2.2.2 2.标准差标准差1 练习:练习:频率条形图的绘制频率条形图的绘制为了估计某人的射击技术状况为了估计某人的射击技术状况,在他的训练记录中抽取了在他的训练记录中抽取了50次进行检验次进行检验,他命中环数如下他命中环数如下:7 8 6 8 6 5 9 10 7 95 6 5 6 7 8 7 9 10 98 5 7 8 7 6 8 6 7 79 6 5 8 6 9 6 8 10 78 7 8 6 9 8 7 10 8 9(1)作出频率分布表作出频率分布
2、表;(2)画出频率分布条形图画出频率分布条形图;(3)估计该人命中估计该人命中68环的百分比是多少环的百分比是多少.分析分析:此题属总体分布的第一种情况此题属总体分布的第一种情况,即总体的个数取不同即总体的个数取不同数值较少数值较少(本题为本题为5,6,7,8,9,10六个数六个数),可直接列表画图可直接列表画图.解解:(1)频率分布表如下频率分布表如下:环数数频数数频率率5 55 50.100.106 610100.200.207 711110.220.228 812120.240.249 98 80.160.161 10 04 40.080.08(2)以命中环数为横轴以命中环数为横轴,频率
3、为纵轴频率为纵轴,建立频率分布条形图建立频率分布条形图.(3)由由频率分布条形率分布条形图知知:0.20+0.22+0.24=0.66,知知该人人命中命中68环的百分比的百分比为66%.规律技巧规律技巧:在数据统计中在数据统计中,当样本数据中当样本数据中取不同的数值较少时取不同的数值较少时,可以绘制频率条可以绘制频率条形图来直观的反映数据的分布情况形图来直观的反映数据的分布情况,其其条图形的宽度相同条图形的宽度相同,高度高度(即纵坐标即纵坐标)为为相应的频率相应的频率(这一点与直方图不同这一点与直方图不同).一一 众数、中位数、平均数的概念众数、中位数、平均数的概念 中位数中位数:将一组数据按
4、大小依次排列,把处:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数 众数众数:在一组数据中,出现次数最多的数:在一组数据中,出现次数最多的数据叫做这组数据的众数据叫做这组数据的众数 众数、中位数、平均数都是描述一组数据众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛其中以平均数的应用最为广泛.平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=7 练习练习:在一次中
5、学生田径运动会上,参加在一次中学生田径运动会上,参加男子跳高的男子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示:成成绩绩(单单位位:米米)150160165170175180185190人数人数23234111 分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间是
6、最中间的一个数据,即这组数据的中位数是的一个数据,即这组数据的中位数是1.70;8这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).9变变式式训训练练若若某某校校高高一一年年级级8个个班班参参加加合合唱唱比比赛赛的的得得分分如如茎茎叶叶图图所所示示,则则这这组组数数据据的的中中位位数数和平均数分和平均数分别别是是()A91.5和和91.5 B91.5和和92C91和和91.5 D92和和921011频率频率组距组距0.10.20.30.40.5O
7、0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)例如,在上一节调查的例如,在上一节调查的100位居民的月均用水量的位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是出,月均用水量的众数是2.25t.如图所示:如图所示:二二、众数、中位数、平均数与众数、中位数、平均数与频率分布直方图的关系频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。12 2、在样本中,有、在样本中,有50的个体小于或等于
8、中位的个体小于或等于中位数,也有数,也有50的个体大于或等于中位数,因此,的个体大于或等于中位数,因此,在频率分布直方图中,在频率分布直方图中,中位数左边和右边的直方中位数左边和右边的直方图的面积应该相等,图的面积应该相等,由此可以估计中位数的值。由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计下图中虚线代表居民月均用水量的中位数的估计值,此数据值为值,此数据值为2.03t.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)13说明说明:2.03这个中位数的估计值这个中位数的估计值,与样本与样本的中位数
9、值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致.14 3、平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的平衡点是直方图的平衡点.n 个样本数据的平均数个样本数据的平均数由公式由公式:给出给出X=下图显示了居民月均用下图显示了居民月均用水量的平均数水量的平均数:x
10、=1.973频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)15三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.16 2、中
11、位数是样本数据所占频率、中位数是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。17 3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数
12、的改变,这是众改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因数、中位数都不具有的性质。也正因如此如此,与众数、中位数比较起来,平,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时端值的影响较大,使平均数在估计时可靠性降低。可靠性降低。18 四四 众数、中位数、平均数的简单应用众数、中位数、平均数的简单应用例例 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒合计合计周工资周
13、工资2200250220200100人数人数16510123合计合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?的工资水平吗?为什么?19【解解】(1)由由表表格格可可知知:众众数数为为200,中中位位数数为为220.平平 均均 数数 为为(2200 2506 2205 20010100)23(2200150011002000100)23690023300.(2)虽虽然然平平均均数数为为300
14、,但但由由表表格格中中所所列列出出的的数数据据可可知知,只只有有经经理理在在平平均均数数以以上上,其其余余人人员员的的工工资资都都在在平平均均数数以以下下,故故用用平平均均数数不不能能客客观观地地反反映映该该工厂的工工厂的工资资水平水平【思思维维总总结结】极极端端值值影影响响平平均均数数,故故平平均均数数有有时时不能代表事不能代表事实实情况情况2 2上上图图是是某某班班学学生生在在一一次次数数学学考考试试中中的的成成绩绩的的频频率率分分布布直直方方图图根根据据直直方方图图估估计计其其成成绩绩的的(1)众数;众数;(2)中位数;中位数;(3)平均数平均数【思思路路点点拨拨】矩矩形形最最高高意意思
15、思其其中中的的频频数数最最多多,可可求求众众数数,分分别别计计算算每每个个小小矩矩形形的的面面积积来来估估计计中中位位数数的的位位置置,通通过过矩矩形形宽宽的的中点求平均数中点求平均数v标准差标准差24平均数向我们提供了样本数据的重要信息平均数向我们提供了样本数据的重要信息,但是平均但是平均有时也会使我们作出对总体的片面判断因为这个平有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的因此,只有平均数还难以概括样本数据的不能忽的因此,只有平均数还难以概括样本数据的实际状态实际状态如:有两位射击运动员在一
16、次射击测试中各射靶如:有两位射击运动员在一次射击测试中各射靶10次,每次,每次命中的环数如下:次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平就没有什那么两个人的水平就没有什么差异吗么差异吗?25(甲)45678910环数频率0.10.20.3频率(乙)456789 100.10.20.30.4环数 直观上看直观上看,还是有差异的还是有差异的.如如:甲成绩比较分散甲成绩比较分散,乙成绩相
17、对集中乙成绩相对集中(如上图所示如上图所示).因此因此,我们还需要从另外的角度来考察这两组我们还需要从另外的角度来考察这两组数据数据.例如例如:在作统计图表时提到过的极差在作统计图表时提到过的极差.26通通常改用如下公式来计算标准差常改用如下公式来计算标准差一个样本中的个体与平均数之间的距离关系可用下图表示一个样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为考虑一个容量为2的样本的样本:考察样本数据的分散程度的大小,最常用的统计量是标准差考察样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示表示2
18、7 显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越大数据的离散程度越大;标标准差越小准差越小,数据的离散程度越小数据的离散程度越小.用计算器可算出甲用计算器可算出甲,乙两人的的成绩的标准差乙两人的的成绩的标准差由由 可以知道可以知道,甲的成绩离散程度大甲的成绩离散程度大,乙的成乙的成绩离散程度小绩离散程度小.由此可以估计由此可以估计,乙比甲的射击成绩稳定乙比甲的射击成绩稳定.a2829例2 甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲甲 25.46,25.32,25.45,25
19、.39,25.36 25.34,25.42,25.45,25.38,25.42 25.39,25.43,25.39,25.40,25.44 25.40,25.42,25.35,25.41,25.39乙乙 25.40,25.43,25.44,25.48,25.48 25.47,25.49,25.49,25.36,25.34 25.33,25.43,25.43,25.32,25.47 25.31,25.32,25.32,25.32,25.48 从生产的零件内径的尺寸看,谁生产的质量较高?30解:用计算器计算可得:从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很
20、小;从样本标准差看,由于313 3 甲甲、乙乙两两机机床床同同时时加加工工直直径径为为100 cm的的零零件,件,为检验质为检验质量,各从中抽取量,各从中抽取6件件测测量,数据量,数据为为:甲:甲:9910098100100103乙:乙:9910010299100100(1)分分别计别计算两算两组组数据的平均数及方差;数据的平均数及方差;(2)根据根据计计算算结结果判断哪台机床加工零件的果判断哪台机床加工零件的质质量量更更稳稳定定【思思维维总总结结】本本题题易易出出现现判判断断甲甲机机床床质质量量更更稳稳定定的的错错误误,其其原原因因是是对对方方差差的的概概念念理理解解错错误误小结:小结:1.1.众数、中位数、平均数的概念众数、中位数、平均数的概念2.2.众数、中位数、平均数与频率分布直方众数、中位数、平均数与频率分布直方图的关系图的关系3.3.三种数字特征的优缺点三种数字特征的优缺点4.4.什么是标准差什么是标准差?5.5.如何利用标准差刻画数据的离散程度如何利用标准差刻画数据的离散程度?35