《用直方图算平均数中位数、众数、标准差.ppt》由会员分享,可在线阅读,更多相关《用直方图算平均数中位数、众数、标准差.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 在一次射击比赛中在一次射击比赛中,甲、乙两名运动员各射击甲、乙两名运动员各射击10次,命中环数如下次,命中环数如下甲运动员甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?的更稳定些吗?问题问题 为了从整体上更好地把握总体的规律,我们要通为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。过样本的数据对总体的数字特征进行研究。用样用样本的数字特征估计总体的数字特征。本的数字特征估计总体的数字特征。1、众数众数 在一
2、组数据中,在一组数据中,出现次数最多出现次数最多的数据的数据叫做这一组数据的众数叫做这一组数据的众数.2、中位数中位数 将一组数据按大小依次排列,将一组数据按大小依次排列,把把处在最中间位置的一个数据处在最中间位置的一个数据(或两个数据(或两个数据的平均数)叫做这组数据的中位数的平均数)叫做这组数据的中位数.3、平均数平均数 (1)x=(x1+x2+xn)/n (2)x =x1f1+x2f2+xkfk 如何从频率分布直方图中估计众数、如何从频率分布直方图中估计众数、中位数、平均数呢?中位数、平均数呢?思考思考众数:众数:最高矩形的中点的横坐标最高矩形的中点的横坐标2.25中位数:中位数:左右两
3、边直方左右两边直方图的面积相等图的面积相等.2.02平均数:平均数:频率分布直方频率分布直方图中每个小矩形的面图中每个小矩形的面积乘以小矩形底边中积乘以小矩形底边中点的横坐标之和点的横坐标之和.2.020.160.160.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量月均用水量/t频率频率组距组距0.080.08O0.30.30.440.440.50.50.280.28频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水月平均用水量量(t)众数在样本数据的频率
4、分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。如何在频率分布直方图中估计如何在频率分布直方图中估计众数众数可将众数看作直方图中面积最大长方形的可将众数看作直方图中面积最大长方形的“中心中心”0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02前四个小矩形的前四个小矩形的面积和面积和=0.49后四个小矩形的后四个小矩形的面积和面积和=0.262.02如何在频率分布直方图中估计如何在频率分布直方图中估计中位数中位数思考:思考:平均数是频率分布直方图的平均数是频率分布直
5、方图的“重心重心”,在城市居民月均用水量样本数据的频率分,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别直方图估计总体在各组数据内的平均数分别为多少?为多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5
6、 2 2.5 3 3.5 4 4.5 O O0.250.040.250.04+0.750.080.750.08+1.250.151.250.15+1.751.750.220.22+2.250.252.250.25+2.750.142.750.14+3.25 3.25 0.060.06+3.750.043.750.04+4.250.02=2.024.250.02=2.02(t t).平均数是平均数是2.02.2.02.3 3、平均数、平均数平均数的估计值等于每个小矩形的面积平均数的估计值等于每个小矩形的面积乘以小矩形底边中点的横坐标之和乘以小矩形底边中点的横坐标之和 平均数:平均数:x =x1f
7、1+x2f2+xkfk 选择平均数更好:因为,此时的众数选择平均数更好:因为,此时的众数20万比中位万比中位数数25万还小,所以众数代表的是局部的数。中位数代万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征不能显示出具体的数字特征 练习练习课本课本P74 练习练习三种数字特征的优缺点三种数字特
8、征的优缺点探究探究 一个企业中,一个企业中,有职工的人数很多,他们有职工的人数很多,他们的月收入是的月收入是两千两千左右,然后有少数人员是经左右,然后有少数人员是经理以上层次的人,他们的月收入是理以上层次的人,他们的月收入是三万三万左右。左右。如果是你老板,去招聘时,回答有关工资待如果是你老板,去招聘时,回答有关工资待遇方面的问题,你更愿意用哪个数字特征来遇方面的问题,你更愿意用哪个数字特征来回答这个问题呢?如果你是应聘者,你更愿回答这个问题呢?如果你是应聘者,你更愿意希望老板是用哪个特征数字来回答?意希望老板是用哪个特征数字来回答?平均数向我们提供了样本数据的重要信平均数向我们提供了样本数据
9、的重要信息,但是,有时它也会影响我们,使我们对息,但是,有时它也会影响我们,使我们对总体作出片面判断。总体作出片面判断。平均数反映数据的集中平均数反映数据的集中趋势趋势,但是,只有平均数还难以概况样本数,但是,只有平均数还难以概况样本数据的实际状态。当样本的平均数相等或相差据的实际状态。当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计无几时,就要用样本数据的离散程度来估计总体的数字特征。这时,我们引进了一个概总体的数字特征。这时,我们引进了一个概念:标准差!念:标准差!12标准差标准差 有两位射击运动员在一次射击测试中各射有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数
10、如下靶十次,每次命中的环数如下:如果你是教练,你应当如何对这次射击情况作出如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选评价?如果这是一次选拔性考核,你应当如何作出选择?择?标准差标准差 标准差标准差是样本数据到平均数的一种平均距是样本数据到平均数的一种平均距离离.它用来描述样本数据的离散程度它用来描述样本数据的离散程度.在实际应在实际应用中,标准差常被理解为稳定性用中,标准差常被理解为稳定性.1、平均距离、平均距离标准差标准差 标准差是样本数据到平均数的一种平均距离标准差是样本数据到平均数的一种平均距离.它它用来描述样本数据的离散程度用来描述样本数据
11、的离散程度.在实际应用中,标准在实际应用中,标准差常被理解为稳定性差常被理解为稳定性.规律:标准差越大,规律:标准差越大,大则大则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程度越小度越小.计算标准差的算法:计算标准差的算法:1、算出样本数据的平均数2、算出每个样本数据与样本平均数的差3、算出 ,这n个数的平均数,即为样本方差4、算出方差的算术平均值,即为样本标准差s。16 注意:注意:1、标准差、方差的取值范围:、标准差、方差的取值范围:当标准差,方差为当标准差,方差为0时,样本各数据全相等,表时,样本各数据全相等,表明数据没有波动幅度,数据没有离
12、散性。明数据没有波动幅度,数据没有离散性。2、因为方差与原始数据的单位不同,且平方后可能、因为方差与原始数据的单位不同,且平方后可能增大了偏差的程度,所以虽然方差与标准差在刻增大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实画样本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差。际问题时,一般采用标准差。17例例1:画出下列四组样本数据的直方图,说画出下列四组样本数据的直方图,说明它们的异同点明它们的异同点.(1)(2)(3)(4)18例例2:甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两人的生产质量进行评
13、比,从他们生产的零件中为了对两人的生产质量进行评比,从他们生产的零件中各抽出各抽出20件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mm)甲甲乙乙从生产的零件内径的尺寸来看,谁生产的质量较高?从生产的零件内径的尺寸来看,谁生产的质量较高?X甲甲25.401X乙乙25.406s甲甲0.037S乙乙0.06819 从样本平均数看,甲生产的零件内径比从样本平均数看,甲生产的零件内径比乙更接近内径标准,但是差异很小;乙更接近内径标准,但是差异很小;从样本标准差看,由于从样本标准差看,由于s甲甲S乙,因此乙,因此甲生产的零件内径比乙的稳定程度高很多。甲生产的零件内径比乙的稳定程度高很多。于
14、是,可以作出判断,甲生产的零件的质于是,可以作出判断,甲生产的零件的质量比乙的高一些。量比乙的高一些。X甲甲25.401 X乙乙25.406s甲甲0.037 S乙乙0.068 20 练习练习课本课本P79 练习练习21解解:依题意计算可得依题意计算可得 x1=900 x2=900 s123.8 s2 42.6 甲乙两种水稻甲乙两种水稻6年平均产量的平均数相同年平均产量的平均数相同,但甲的标准差比乙的小但甲的标准差比乙的小,所以甲的生产比较稳所以甲的生产比较稳定定.22解解:(1)平均重量约为平均重量约为496.86 g,标准差约为标准差约为6.55(2)重量位于重量位于(x-s,x+s)之间有
15、之间有14袋白糖袋白糖,所占所占百分比为百分比为66.67%.23P81 练习:若甲、乙两队比赛情况如下练习:若甲、乙两队比赛情况如下,下列说法哪些下列说法哪些 说法是不正确的:说法是不正确的:甲甲乙乙平均失球数平均失球数平均失球个数的标准差平均失球个数的标准差1.52.11.10.41、平均来说,甲的技术比乙的技术好;、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;、甲队有时表现差,有时表现好;4、乙队很少不失球。、乙队很少不失球。全对全对241.用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数字特征分两类:a.用样本平均数估计总体平均数。用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,用样本标准差估计总体标准差。样本容量越大,估计就越精确。估计就越精确。2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的作用,代表一组数据的平均水平。的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。映了一组数据变化的幅度。小结小结26