《频率分布直方图.pptx》由会员分享,可在线阅读,更多相关《频率分布直方图.pptx(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、教学目标1 通过实例体会分布的意义和作用。2 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。3 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。第1页/共53页二、教学重点与难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。难点:能通过样本的频率分布估计总体的分布。第2页/共53页第3页/共53页能思考的苇草四川能思考的苇草四川/一考生我很喜欢那样一个比喻一一一考生我很喜欢那样一个比喻一一人是能思考人是能思考的苇草。的苇草。也许思考就是那个让人可以凌驾于万物之上的台阶。但也正
2、是这思考的也许思考就是那个让人可以凌驾于万物之上的台阶。但也正是这思考的能力赋予了人类以思想,从而把人类置于了很多旭旭的境地,比如亲情与真理。能力赋予了人类以思想,从而把人类置于了很多旭旭的境地,比如亲情与真理。我清楚地记得康德曾经说过我清楚地记得康德曾经说过:有两样东西我越是思考就越感到无上敬畏之情有两样东西我越是思考就越感到无上敬畏之情:我们我们头上的灿烂星空,我们心中的道德法则。头上的灿烂星空,我们心中的道德法则。这句镑刻在人类思想史上的话语也许很这句镑刻在人类思想史上的话语也许很精当地为人类摆脱揽恤境地提供了柳暗花明的一招坚持自然真理与思想的道德法精当地为人类摆脱揽恤境地提供了柳暗花明
3、的一招坚持自然真理与思想的道德法则。也许这样,人类才可以真正做一棵生长在自然之基上的能思考的苇草。则。也许这样,人类才可以真正做一棵生长在自然之基上的能思考的苇草。我相信人类在判断认知事物的时候一定都会烙上思想感情的印迹,更何况是那样我相信人类在判断认知事物的时候一定都会烙上思想感情的印迹,更何况是那样一种与生俱来挥之不去的神圣感情。中国历史长河中清风明月般的人物当然有,一种与生俱来挥之不去的神圣感情。中国历史长河中清风明月般的人物当然有,但是完全割裂亲情毫无私念的例子又实在不算多。而我也许真的不太主张做一个但是完全割裂亲情毫无私念的例子又实在不算多。而我也许真的不太主张做一个冷血无情的人,否
4、则世界没有了感情,也没有了色彩。我很喜欢鲁迅,喜欢冷血无情的人,否则世界没有了感情,也没有了色彩。我很喜欢鲁迅,喜欢他那横眉下的犀利思想。先生一定可以算是一个深刻的人。而先生客观冷静的观他那横眉下的犀利思想。先生一定可以算是一个深刻的人。而先生客观冷静的观点绝不是众叛亲离而来的,点绝不是众叛亲离而来的,无情末必真豪杰,怜子如何不丈夫无情末必真豪杰,怜子如何不丈夫这是先生的诗,这是先生的诗,而先生也是这样做的。所以先生的面孔永远是鲜活的,泛着血的殷红。世而先生也是这样做的。所以先生的面孔永远是鲜活的,泛着血的殷红。世我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺
5、水情况排在前10位的城市第4页/共53页 某市政府为了节约生活用水,计划在本市试行居 民生活用水定额管理,即确定一个居民月用水量 标准a,用水量不超过a的部分按平价收费,超过a 的部分按议价收费。如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,为了较合理地确定这个标准,你认为你认为需要做需要做 哪些工作?哪些工作?第5页/共53页 思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民
6、某年的月平均用水量(单位:单位:t)t),如下表:,如下表:第6页/共53页1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差)2.2.决定组距与组数决定组距与组数组数组数=4.3 4.3-0.2=4.10.2=4.14.14.10.50.5=8.2=8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5),0.50.5,1 1),4 4,4.54.5 组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,第7页/共53页4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布
7、表位居民月平均用水量的频率分布表注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图用面积表示概率。第8页/共53页频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.55.5.画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积组距组距频率频率=组距组距频率频率=注意:这里的纵坐标不是频率,而是频率/组距;某个区间上的频率用这个区间的面积表示;直方图直方图思考:所有小长方形的面积之和等于?思考:所有小长
8、方形的面积之和等于?第9页/共53页一一、求求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以下的可以按以下的步骤进行步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)第10页/共53页频率频率/组距组距月平均用水
9、量月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.5如果当地政府希望如果当地政府希望85%85%以上的居民每月的用水量不超出标准以上的居民每月的用水量不超出标准,根据频率分布表和频率分根据频率分布表和频率分布直方图布直方图,你能对制定月用水量提出建议吗你能对制定月用水量提出建议吗?你认为你认为3 3吨这个标准一定能够保证吨这个标准一定能够保证85%85%以上的居民用水量不超过标准吗以上的居民用水量不超过标准吗?第11页/共53页频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 00.5 1 1
10、.5 2 2.5 3 3.5 4 4.5分析:分析:月用水量在月用水量在3 t3 t以上的居民所占的比例为以上的居民所占的比例为6%6%+4%+2%=12%+4%+2%=12%,即大约有,即大约有12%12%的居民月用水量在的居民月用水量在3t3t以以上,上,88%88%的居民月用水量在的居民月用水量在3t3t以下以下.因此,居民月因此,居民月用水量标准定为用水量标准定为3t3t是一个可以考虑的标准是一个可以考虑的标准.第12页/共53页频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.5想一想:想一想
11、:你认为你认为3t3t这个标准一定能够保证这个标准一定能够保证8585以以上的居民用水不超标吗?如果不一定,那么哪些上的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?环节可能会导致结论的差别?第13页/共53页所得到的结论的统计意义3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。第14页/共53页高考题型:13第15页/共53页练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频
12、数如下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的)的百分比是多少百分比是多少?第16页/共53页解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)
13、530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第17页/共53页频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.515.50.0600.07018.521.5 24.527.5频率频率/组距组距0.0200.0530.0600.0730.0670.0330.027第18页/共53页所得到的结论的统计意义一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。也正因为这样,统计结果的好坏,往往需要进
14、一步的评价,或通过理论方法的检验,或通过实际应用的检验。第19页/共53页频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。频率分布直方图的优缺点是什么?第20页/共53页例例1.一个容量为一个容量为100的样本的样本,数据的分组和各组的数据的分组和各组的相关信息如下表相关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00合计合计 100
15、 1.00应用举例:第21页/共53页连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图频率分布折线图。第22页/共53页思考:思考:上例的样本容量为上例的样本容量为100100,如果增至,如果增至10001000,其频率,其频率分布直方图的情况会有什么变化?分布直方图的情况会有什么变化?假如增至假如增至1000010000呢?呢?分析:分析:样本容量越大,这种估计越精确。但样本容量越大,这种估计越精确。但随着样本容量的增加,作图时所分的组数增随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线接近于一
16、条光滑曲线.第23页/共53页频率频率组距组距产品产品尺寸尺寸(mm)ab 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线条光滑曲线总体密度曲线总体密度曲线区间区间 在总体内取值的概率在总体内取值的概率总体密度曲线总体密度曲线总体密度曲线第24页/共53页甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 843 8 9 11 1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分
17、:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图茎叶图叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数第25页/共53页画茎叶图的步骤:画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上分,在此例中,茎为十位上的数字,叶为个位上的数字。的数字。2.将最小茎和最大茎之间的数按大小次序排成一将最小茎和最大茎之间的数按大小次序排成一
18、列。列。3.将各个数据的叶按读数次序(或按大小次序)将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。写在其茎的左(右)侧。第26页/共53页 茎叶图不仅能够保留原始数据,而且能够茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。的发挥更稳定。在样本数据较少时,用茎叶图表示数据的在样本数据较少时,用茎叶图表示数据的
19、效果较好。它不但可以保留所有信息,而且可效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。一个空间,如果数据很多,枝叶就会很长。第27页/共53页第28页/共53页知识回顾频率分布直方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表
20、5.5.画频率分布直方图画频率分布直方图第29页/共53页频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.5频率分布折线图连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图第30页/共53页频率频率组距组距产品产品尺寸尺寸(mm)当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体在区间总体在区间 内取值的频率内取值的频率S总体密度曲线a b第31页/共53页例2、对某电子元件进行寿命追踪调查,情况如下:寿命寿命个数个数10020020030030040040
21、05005006002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h400h以内的频率;(4)估计电子元件寿命在400h以上的频率;应用举例:第32页/共53页(1)列出频率分布表;100200200300300400400500500600寿命寿命合计合计频率频率频数频数累积频率累积频率20308040302000.100.150.400.200.1510.100.250.650.851频率/组距第33页/共53页第34页/共53页高考题型:第35页/共53页探究:探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会同
22、样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1 1和和0.10.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。第36页/共53页例题、从某企业全体员工某月的工资表中随机例题、从某企业全体员工某月的工资表中随机抽取抽取 了了50名员工的工资资料如下:名员工的工资资料如下:800、800、800、800、800、1000、1000、1000、1000、1000、1000、1000、1000、10
23、00、1000、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1200、1500、1500、1500、1500、1500、1500、1500、2000、2000、2000、2000、2000、2500、2500、2500(1)画出)画出50名员工的工资的频率分布直方图名员工的工资的频率分布直方图第37页/共53页一、列出频率分布表一、列出频率分布表分组分组频数频数频率频率频率频率/组距组距750 1050150.30.0011050 1350200.4
24、0.00131350 165070.140.000471650 19500001950 225050.10.000332250 255030.060.0002第38页/共53页第39页/共53页新课讲授新课讲授初中我们学过用平均数、众数和中位数反映总体的初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。水平,用方差考察稳定程度。我们还有一种简易的方法,就是将这些数据有条理我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就的列出来,从中观察数据的分布情况,这种方法就是是茎叶图茎叶图。制作茎叶图的方法制作茎叶图的方法将所有两位数的将所有两位
25、数的十位数字作为十位数字作为“茎茎”,个位数字作,个位数字作为为“叶叶”,茎相同者共用一个茎,茎按茎相同者共用一个茎,茎按从小到大从小到大的的顺序从上向下列出,共茎的叶一般按从大到小(或顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。从小到大)的顺序同行列出。第40页/共53页123452545116679049茎:茎:十位十位数字数字叶:表叶:表示个位示个位数字数字例例1:某篮球运动员在某赛季各场比赛的得:某篮球运动员在某赛季各场比赛的得分情况如下:分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:茎叶图:第41页/共53页
26、注:注:1 1、重复出现的数据要重复记录,不能遗、重复出现的数据要重复记录,不能遗漏;特别是漏;特别是“叶叶”部分;部分;2 2、所有的信息都可以从这个茎叶图中得到;、所有的信息都可以从这个茎叶图中得到;3 3、茎叶图便于记录和表示;、茎叶图便于记录和表示;4 4、不足的是其分析只是粗略的,对差异不、不足的是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上大的两组数据不易分析;表示三位数以上的数据时不够方便;的数据时不够方便;第42页/共53页例例2:甲、乙两篮球运动员上赛季每场比:甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得赛的得分如下,试比较这两位运动员
27、的得分水平:分水平:甲甲 12,15,24,25,31,31,36,36,37,39,44,49,50乙乙 8,13,14,16,23,26,28,33,38,39,51,33,29第43页/共53页甲甲 乙乙 0 8 2 5 1 3 4 6 0 5 2 3 6 8 9 1 1 6 6 7 9 3 8 9 1 3 4 9 4 0 5 1 注:中间的数字表示得分的十位数字。注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。旁边的数字分别表示两个人得分的个位数。第44页/共53页为了了解各自受欢迎的程度,甲、乙两个网为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了站分别
28、随机选取了14天,记录下上午天,记录下上午8:0010:00间各自的点击量:间各自的点击量:甲:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?乙两个网站哪个更受欢迎?例3:第45页/共53页第46页/共53页第47页/共53页第48页/共53页2.有有两两个个班班级级,每每班班各各自自按按学学号号随随机机选选出出10名名学学生生,测测验验铅铅球球成成绩绩,以以考考察
29、察体体育达标程度,测验成绩如下:单位(米)育达标程度,测验成绩如下:单位(米)甲甲 9.12 7.88 8.42 6.94 5.20 7.22 7.96 8.06 6.69 4.92乙乙 8.80 8.45 7.34 7.06 6.71 8.38 9.80 8.68 6.83 5.86 两两个个班班相相比比较较,哪哪个个班班整整体体实实力力强强一一些?些?第49页/共53页第50页/共53页小结小结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失一些丢失一些直方图直方图 2)直观地表明分布地)直观地表明分布地 情况情况 信息信息 1)无信息损失)无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据第51页/共53页第52页/共53页感谢您的观看!第53页/共53页