《众数中位数平均数标准差方差讲稿.ppt》由会员分享,可在线阅读,更多相关《众数中位数平均数标准差方差讲稿.ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于众数中位数平均数标准差方差第一页,讲稿共二十六页哦一、求一、求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组数:组数=极差极差/组距组距三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间 ,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)复习回顾复习回顾画频率分布直方图的步骤画频率分布直方图的步骤:第二页,讲稿共二十六页哦连接频率分布直方图中各小长方形上
2、端的中点连接频率分布直方图中各小长方形上端的中点,得到得到频频率分布折线图率分布折线图总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体体分分布布的的工具工具.画茎叶图的步骤画茎叶图的步骤:(1)(1)将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分;(2)(2)将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列,写写在一侧在一侧;(3)(3)将各个数据的叶按大小次序写在其茎的另一侧将各个数据的叶按大小次序写在其茎的另
3、一侧.第三页,讲稿共二十六页哦练习练习:在一次中学生田径运动会上,参加男在一次中学生田径运动会上,参加男子跳高的子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示:成成绩绩(米米)150160165170175180185190人数人数23234111分别求这些运动员成绩的众数,中位数与平分别求这些运动员成绩的众数,中位数与平均数均数 第四页,讲稿共二十六页哦第五页,讲稿共二十六页哦众数、中位数、平均数的概念众数、中位数、平均数的概念中位数中位数:将一组数据按大小依次排列,把处在最中间:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做位置的一个数
4、据(或最中间两个数据的平均数)叫做这组数据的中位数这组数据的中位数 众数众数:在一组数据中,出现次数最多的数据叫做:在一组数据中,出现次数最多的数据叫做这组数据的众数这组数据的众数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 x=x=第六页,讲稿共二十六页哦二、众数、中位数、平均数与频率分布直方二、众数、中位数、平均数与频率分布直方图的关系图的关系例如,在上一节调查的例如,在上一节调查的100位居民的月均用水位居民的月均用水量的问题中,从这些样本数据的频率分布直量的问题中,从这些样本数据的频率分布直方图可以看出众数、中位数、平均数为多少方图可以看出众数、中位数、平均数为多少?
5、第七页,讲稿共二十六页哦频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)在样本数据的频率分布直方图中,在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。众众数数众数众数众数体现了样本数据的最大众数体现了样本数据的最大集中点,但它对其它数据信集中点,但它对其它数据信息的忽视使得无法客观地反息的忽视使得无法客观地反映总体特征映总体特征.特点特点:第八页,讲稿共二十六页哦频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(
6、t)2.022.02这个中位数的估计值这个中位数的估计值,与样本的中位数与样本的中位数值值2.02.0不一样,为什么?不一样,为什么?因为样本数据的频率分布直方图因为样本数据的频率分布直方图,只是直观地表明分布的形状只是直观地表明分布的形状,但但是从直方图本身得不出原始的是从直方图本身得不出原始的数据内容数据内容,所以由频率分布直所以由频率分布直方图得到的中位数估计值往往方图得到的中位数估计值往往与样本的实际中位数值不一致与样本的实际中位数值不一致.左边和右边的直方图的面积应该相左边和右边的直方图的面积应该相等,由此可以估计中位数的值。等,由此可以估计中位数的值。中位数:中位数:2 2、中位数
7、不受少数几个极端值的影响、中位数不受少数几个极端值的影响1 1、中位数易计算,能较好地表现数据信息、中位数易计算,能较好地表现数据信息3 3、常用于计算数据质量较差时、常用于计算数据质量较差时第九页,讲稿共二十六页哦频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)是频率分布直方图的是频率分布直方图的“重心重心”,等于频率分,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和横坐标之和平均数平均数3 3、平均数受数据中的极端值的、平均数受数据中的极端值的影响较大,
8、使平均数在估计时可影响较大,使平均数在估计时可靠性降低。靠性降低。1 1、平均数与每一个样本的数据有关,所以任何一、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变个样本数据的改变都会引起平均数的改变2 2、平均数可以反映出更多的关于样本、平均数可以反映出更多的关于样本数据全体的信息数据全体的信息第十页,讲稿共二十六页哦练习练习:有两位射击运动员在一次射击测试中各射靶有两位射击运动员在一次射击测试中各射靶10次,次,每次命中的环数如下:每次命中的环数如下:甲:甲:乙:乙:如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本
9、次射击的平均成绩如果看两人本次射击的平均成绩,由于由于 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么两个人的水平那么两个人的水平就没有什么差异吗就没有什么差异吗?第十一页,讲稿共二十六页哦考察样本数据的分散程度的大小,考察样本数据的分散程度的大小,所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:标准差是样本数据到平均数的一种平均距离,标准差是样本数据到平均数的一种平均距离,一般用一般用s s表示表示标准差标准差第十二页,讲稿共二十六页哦由于上式含有绝对值,运算不太方便,因此,通常由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差改用如下
10、公式来计算标准差第十三页,讲稿共二十六页哦探究提高探究提高 (1 1)平均数与方差都是重要的数字特征)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小集中趋势,方差和标准差描述波动大小.(2 2)平均数、方差的公式推广)平均数、方差的公式推广若数据若数据x x1 1,x,x2 2,x xn n的平均数为的平均数为 ,那么那么mxmx1 1+a a,mxmx2 2+a a,mxmx3 3+a a,mxmx
11、n n+a a的平均数是的平均数是.数据数据x x1 1,x x2 2,x xn n的方差为的方差为s s2 2.a.a.s s2 2=b.b.数据数据x x1 1+a a,x x2 2+a a,x xn n+a a的方差为的方差为 ;c.c.数据数据axax1 1,axax2 2,axaxn n的方差为的方差为 .第十四页,讲稿共二十六页哦知识补充知识补充1.1.标准差的平方标准差的平方s s2 2称为方差,有时用方差代替称为方差,有时用方差代替标准差测量样本数据的离散度标准差测量样本数据的离散度.方差与标准差方差与标准差的测量效果是一致的,在实际应用中一般多的测量效果是一致的,在实际应用中
12、一般多采用标准差采用标准差.2.2.现实中的总体所包含的个体数往往很多,总现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性准差,但要求样本有较好的代表性.第十五页,讲稿共二十六页哦例例4 4 在去年的足球甲在去年的足球甲A A联赛中,甲队每场比赛平联赛中,甲队每场比赛平均失球数是均失球数是1.51.5,全年比赛失球个数的标准差为,全年比赛失球个数的标准差为1.11.1;乙队每场比赛平均失球数是;乙队每场比赛平均失球数
13、是2.12.1,全年比,全年比赛失球个数的标准差为赛失球个数的标准差为0.4.0.4.你认为下列说法是你认为下列说法是否正确,为什么?否正确,为什么?(1 1)平均来说)平均来说甲队比乙队防守技术好;甲队比乙队防守技术好;(2 2)乙队比甲队技术水平更稳定;)乙队比甲队技术水平更稳定;(3 3)甲队有时表现很差,有时表现又非常)甲队有时表现很差,有时表现又非常 好;好;(4 4)乙队很少不失球)乙队很少不失球.第十六页,讲稿共二十六页哦例题分析例题分析例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点.(1)(1),;,;(2)(2),;,
14、;O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)第十七页,讲稿共二十六页哦(3)(3),;,;(4)(4),.频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(4 4)第十八页,讲稿共二十
15、六页哦2.2.已已知知一一组组数数据据按按从从小小到到大大的的顺顺序序排排列列,得得到到-1-1,0 0,4 4,x x,7,7,1414,中中位位数数为为5 5,则则这这组组数数据据的的平平均均数数和和方方差差分分别别为为()A.5,24 A.5,24 B.5,24B.5,24 C.4,25 C.4,25 D.4,25D.4,25 解析解析 中位数为中位数为5 5,5=5=,x x=6.=6.s s2 2=(5+15+1)2 2+(5-05-0)2 2+(5-45-4)2 2+(5-65-6)2 2+(5-75-7)2 2+(5-145-14)2 2=24 .=24 .A第十九页,讲稿共二十
16、六页哦9.9.(20092009福建)福建)某校开展某校开展“爱我海西、爱我家乡爱我海西、爱我家乡”摄摄 影比赛,影比赛,9 9位评委为参赛作品位评委为参赛作品A A给出的分数如茎叶图所给出的分数如茎叶图所 示示.记分员在去掉一个最高分和一个最低分后,算得记分员在去掉一个最高分和一个最低分后,算得 平均分为平均分为9191,复核员在复核时,发现有一个数字(茎,复核员在复核时,发现有一个数字(茎 叶图中的叶图中的x x)无法看清,若记分员计算无误,则数字)无法看清,若记分员计算无误,则数字x x 应该是应该是 .解析解析 当当x x44时,时,x x4,4,则则 =91,=91,x x=1.=1
17、.1 1第二十页,讲稿共二十六页哦11.11.下图是某市有关部门根据该市干部的月收入情下图是某市有关部门根据该市干部的月收入情况,作抽样调查后画出的样本频率分布直方图,况,作抽样调查后画出的样本频率分布直方图,已知图中第一组的频数为已知图中第一组的频数为4 0004 000,请根据该图提供,请根据该图提供的信息解答下列问题的信息解答下列问题:(图中每组包括左端点(图中每组包括左端点,不包不包 括右端点,如第一组表示收入在括右端点,如第一组表示收入在1 0001 000,1 5001 500)第二十一页,讲稿共二十六页哦(1 1)求样本中月收入在)求样本中月收入在2 5002 500,3 500
18、3 500)的人数;)的人数;(2 2)为了分析干部的收入与年龄、职业等方面的关)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再用分层抽样方系,必须从样本的各组中按月收入再用分层抽样方法抽出法抽出100100人作进一步分析,则月收入在人作进一步分析,则月收入在1 5001 500,2 0002 000)的这段应抽多少人?)的这段应抽多少人?(3 3)试估计样本数据的中位数)试估计样本数据的中位数.解解 (1 1)月收入在月收入在1 0001 000,1 5001 500)的概率为)的概率为0.000 8500=0.40.000 8500=0.4,且有,且有4 0004
19、 000人,人,样本的容量样本的容量n n=10 000=10 000;月收入在月收入在1 5001 500,2 0002 000)的频率为)的频率为0.000 45000.000 4500=0.2=0.2;第二十二页,讲稿共二十六页哦月收入在月收入在2 0002 000,2 5002 500)的频率为)的频率为0.000 3500=0.000 3500=0.150.15;月收入在月收入在3 5003 500,4 0004 000)的频率为)的频率为0.000 1500=0.000 1500=0.05.0.05.月收入在月收入在2 5002 500,3 5003 500)的频率为)的频率为1-
20、1-(0.4+0.2+0.15+0.050.4+0.2+0.15+0.05)=0.2.=0.2.样本中月收入在样本中月收入在2 5002 500,3 5003 500)的人数为)的人数为0.210 000=2 000.0.210 000=2 000.(2 2)月收入在月收入在1 5001 500,2 0002 000)的人数为)的人数为0.210 000=2 0000.210 000=2 000,第二十三页,讲稿共二十六页哦再从再从10 00010 000人中用分层抽样方法抽出人中用分层抽样方法抽出100100人,则月人,则月收入在收入在1 5001 500,2 0002 000)的这段应抽取
21、)的这段应抽取100100=20=20(人)(人).(3 3)由)由(1)(1)知月收入在知月收入在1 0001 000,2 000)2 000)的频率为的频率为0.4+0.2=0.60.4+0.2=0.60.50.5,样本数据的中位数为样本数据的中位数为1 500+=1 500+250=1 7501 500+=1 500+250=1 750(元)(元).第二十四页,讲稿共二十六页哦三种数字特征的优缺点三种数字特征的优缺点1 1、众数体现了样本数据的最大集中点,但它对其它数、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征据信息的忽视使得无法客观地反映总体特征
22、.2 2、中位数它不受少数几个极端值的影响,这在某些情况下是、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。优点,但它对极端值的不敏感有时也会成为缺点。3 3、由于平均数与每一个样本的数据有关,所以任何一个、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此数都不具有的性质。也正因如此 ,与众数、中位数比较,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。时可靠性降低。第二十五页,讲稿共二十六页哦感谢大家观看第二十六页,讲稿共二十六页哦