《用样本频率分布估计总体分布PPT.ppt》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布PPT.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、怀怀 天天 下下 ,求求 真真 知知 ,学学 做做 人人2.2.1 2.2.1 用样本的频率分布用样本的频率分布估计总体分布估计总体分布频率分布频率分布 样本中所有数据(或数据组)的样本中所有数据(或数据组)的频数频数和和样本容量的比样本容量的比,叫做该数据的,叫做该数据的频率频率。频率分布的表示形式有:频率分布的表示形式有:样本频率样本频率分布表分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方图直方图样本频率分布样本频率分布折线图折线图 所有数据(或数据组)的频数的分布所有数据(或数据组)的频数的分布变化规律叫做变化规律叫做样本的频率分布
2、。样本的频率分布。1 1、抛掷硬币的大量重复试验的结果:、抛掷硬币的大量重复试验的结果:35 96435 964反面向上反面向上36 12436 124正面向上正面向上频率频率频数频数实验结果实验结果0.501 1 0.501 1 0.498 90.498 9频率分布条形图频率分布条形图0.10.10.20.20.30.30.40.40.50.50.60.60.70.70 01 1试验结果试验结果频率频率“正面向上正面向上”记为记为0 0“反面向上反面向上”记为记为1 1频率分布表频率分布表:注意:注意:各长方形长条的宽度要相同各长方形长条的宽度要相同。相邻长条的间距要适当。相邻长条的间距要适
3、当。结论:当试验次数结论:当试验次数无限增大时,两种试验无限增大时,两种试验结果的频率大致相等。结果的频率大致相等。长方形长条的高度长方形长条的高度表示取各值的频率表示取各值的频率。例例1.1.为为检检测测某某种种产产品品的的质质量量,抽抽取取了了一一个个容容量量为为3030的的样样本本,检测结果为一级品检测结果为一级品5 5件,二级品件,二级品8 8件,三级品件,三级品1313件,次品件,次品4 4件件 (1)(1)列出样本的列出样本的频率分布表频率分布表;(2)(2)画出表示样本频率分布的画出表示样本频率分布的条形图条形图;(3)(3)根据上述结果,估计此种产品为二级品或三级品的根据上述结
4、果,估计此种产品为二级品或三级品的概率概率约是多少约是多少 解:解:(1 1)样本的频率分布表为:)样本的频率分布表为:0.130.134 4次品次品0.430.431313三级品三级品0.270.278 8二级品二级品0.170.175 5一级品一级品频率频率频数频数产品产品解:解:(2 2)样本频率分布)样本频率分布 的的条形图条形图为:为:0.10.10.20.20.30.30.40.40.50.50.60.60.70.7一级品一级品 二级品二级品产品产品频率频率三级品三级品 次品次品(3)(3)此种产品为二级品或三级品的此种产品为二级品或三级品的概率概率约为约为0.270.270.43
5、0.430.70.7 知识探究(一):频率分布表知识探究(一):频率分布表【问题问题】我国是世界上严重缺水的国家我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月生活用水定额管理,即确定一个居民月用用水量标准水量标准a a,用水量,用水量不超过不超过a a的部分按平价的部分按平价收费,收费,超出超出a a的部分按议价收费的部分按议价收费.通过抽样通过抽样调查,获得调查,获得100100位居民位居民20132013年的月均用水量年的月均用水量如
6、下表(单位:如下表(单位:t t):):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 3.4 2.6 2.2 2.2 1.5 1.2 0.20.2 0.4 0.3 0.4 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8
7、 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.
8、5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2显然:这个例子与前面抛掷硬币的问题是不同的,这显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为里的总体可以在一个实数区间取值,称为连续型总体连续型总体。样本的频率分布
9、表示形式有:样本的频率分布表示形式有:频率分布表频率分布表和和频率分布直方图频率分布直方图1.1.极差:极差:样本数据中的样本数据中的最大值最大值和和最小最小值的差值的差称为极差称为极差2.2.确定组距,组数:确定组距,组数:.如果将上述如果将上述100100个数据按组距为个数据按组距为0.50.5进行分组,进行分组,那么这些数据共分为多少组?那么这些数据共分为多少组?0.20.24.34.3()()0.5=8.20.5=8.2画频率分布直方图的步骤画频率分布直方图的步骤 3 3 将数据分组,决定分点:将数据分组,决定分点:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个
10、数据共分为个数据共分为9 9组,组,各组数据的取值范围可以如何设定?各组数据的取值范围可以如何设定?4 4 画频率分布表:画频率分布表:如何统计上述如何统计上述100100个数个数据在各组中的频数?如何计算样本数据据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表在各组中的频率?你能将这些数据用表格反映出来吗?格反映出来吗?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.分分 组组 频频数累数累计计 频频数数 频频率率 00,0.50.5)4 0.044 0.04 0.5 0.5,1 1)正正 8 0.088 0.08 1
11、 1,1.51.5)正正 正正 正正 15 0.1515 0.15 1.5 1.5,2 2)正正 正正 正正 正正 22 0.2222 0.22 2 2,2.52.5)正正 正正 正正 正正 正正 25 0.2525 0.25 2.5 2.5,3 3)正正 正正 14 0.1414 0.14 3 3,3.53.5)正正 一一 6 0.066 0.06 3.5 3.5,4 4)4 0.044 0.04 4 4,4.5 2 0.024.5 2 0.02 合合计计 100 1.00100 1.00知识探究(二):频率分布直方图知识探究(二):频率分布直方图 5 5 画频率分布直方图画频率分布直方图
12、为了直观反映样本为了直观反映样本数据在各组中的分布情况,我们数据在各组中的分布情况,我们将上述将上述频率分布表中频率分布表中的有关信息用下面的图形的有关信息用下面的图形表示:表示:月均用水量月均用水量/t/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O上图称为上图称为频率分布直方图频率分布直方图,其中,其中横轴横轴表表示月均用水量,示月均用水量,纵轴纵轴表示频率表示频率/组距组距.频率分布直方图中频率分布直方图中各小长方形的宽度和各小长方形的宽度
13、和高度高度在在数量上有何特点数量上有何特点?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O宽度:宽度:组距组距高度:高度:频率频率组距组距2 2 图形的意义图形的意义 图形的意义:图形的意义:频率分布直方图中频率分布直方图中各小长各小长方形的面积方形的面积表示什么?表示什么?各小长方形的面各小长方形的面积之和为积之和为多少?多少?各小长方形的面积各小长方形的面积=频率频率各小长方形的面积之和各小长方形的面积之和=1 1月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1
14、.5 2 2.5 3 3.5 4 4.5 O O宽度:宽度:组距组距高度:高度:频率频率组距组距频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容横轴:两者表示内容相同相同思考:思考:频率分布条形图和频率分布直方图是两个频率分布条形图和频率分布直方图是两个相同的概念吗?相同的概念吗?有什么区别?有什么区别?纵轴:两者表示的内容纵轴:两者表示的内容不相同不相同频率分布条形图频率分布条形图的纵轴(长方形的高)的纵轴(长方形的高)表示频率表示频率 频率分布直方图频率分布直方图的纵轴(长方形的高)的纵轴(长方形的高)表示
15、表示频率与组距的比值,频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。其相应组距上的频率等于该组距上长方形的面积。3 3 分析例题:分析例题:频率分布直方图非常直观频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式据模式,但,但原始数据不能在图中表示原始数据不能在图中表示出出来来.你能根据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.
16、20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且状的,而且是是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O O频率分布直方图如下频率分
17、布直方图如下:月均用水量月均用水量/t/t频率频率组距组距0.100.100.200.200.300.300.400.400.500.500.50.51 11.51.5 2 22.52.53 33.53.54 44.54.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频率分布折线图利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(2 2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1 1)上上例例的的样样本本容容量量为为100100,如如果果增增至至10001000,其其频频率率分分布布直直
18、方方图图的的情情况况会会有有什什么么变变化化?假假如如增增至至1000010000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/t/ta ab b (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a,b)(a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时
19、,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线1 1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的
20、变动范围4.3-0.2=4.14.3-0.2=4.12 2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3 3、将数据分组将数据分组(8.2(8.2取整取整,分为分为9 9组组)画频率分布直方图的步骤画频率分布直方图的步骤4 4、列出、列出频率分布表频率分布表.(.(填写频率填写频率/组距一栏组距一栏)5 5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100100个以内时,个以内时,按数据多少常分按数据多少常分5-125-12组。组。小结小结1 1、一个容量为
21、、一个容量为2020的样本数据的样本数据.分组后分组后.组距与频组距与频数如下:数如下:(0,20 2;(20,30 3,(30,40 4;(0,20 2;(20,30 3,(30,40 4;(40,50 5;(50,60 4;(60,70 2(40,50 5;(50,60 4;(60,70 2。则样本。则样本在在(,50,50上的频率为:上的频率为:,7/107/102 2为了了解某地区高三学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100100名年龄为名年龄为17.517.5岁岁1818岁的男生体重岁的男生体重(kg),(kg),得到频率分布直方图如下
22、:得到频率分布直方图如下:C C0.030.030.050.050.070.07体重体重(kg)(kg)频率频率/组距组距54.5 54.5 58.5 58.5 62.5 62.5 66.5 66.5 70.5 70.5 74.5 74.5 根据上图可得这根据上图可得这100100名学生中体重在名学生中体重在56.5,64.556.5,64.5的学生人数是的学生人数是()()A.20 B.30 C.40 D.50A.20 B.30 C.40 D.502400 2700 3000 3300 3600 3900X X 体重体重y y0.0013 3、观察新生婴儿的体重,其频率分布直方图、观察新生婴
23、儿的体重,其频率分布直方图如图所示,则新生婴儿体重如图所示,则新生婴儿体重(2700,3000)(2700,3000)的频的频率为:率为:;0.30.34.4.为为了了了了解解小小学学生生的的体体能能情情况况,抽抽取取了了某某小小学学同同年年级级部部分分学学生生进进行行跳跳绳绳测测试试,将将所所得得数数据据整整理理后后,画画出出频频率率分分布布直直方方图图如如图图,已已知知图图中中从从左左到到右右前前三三个个小小组组的的频频率率分分别别是是0.10.1,0.3,0.40.3,0.4,第一小,第一小组组的的频频数数为为5.5.(1)(1)求第四小求第四小组组的的频频率;率;(2)(2)问问参加参
24、加这这次次测试测试的学生人数是多少?的学生人数是多少?(3)(3)问问在在这这次次测试测试中,学生跳中,学生跳绳绳次数的中位数落在第几小次数的中位数落在第几小组组内?内?【解解】(1)(1)第第四四小小组组的的频频率率1 1(0.1(0.10.30.30.4)0.4)0.2.0.2.(2)(2)n n第一小第一小组组的的频频数数 第一小第一小组组的的频频率率50.150.150.50.(3)(3)因因为为0.10.150505,0.35,0.3505015,0.415,0.4505020,0.220,0.2505010.10.即即第第一一、第第二二、第第三三、第第四四小小组组的的频频数数分分别
25、别为为5,15,20,10.5,15,20,10.所以学生跳所以学生跳绳绳次数的中位数落在第三小次数的中位数落在第三小组组内内解本题的关键是准确掌握频率、频数、样本容量解本题的关键是准确掌握频率、频数、样本容量(数据总数数据总数)之间的关系及中位数的概念之间的关系及中位数的概念变变式式训训练练为为了了了了解解高高一一学学生生的的体体能能情情况况,某某校校抽抽取取部部分分学学生生进进行行一一分分钟钟跳跳绳绳次次数数测测试试,将将所所得得数数据据整整理理后后,绘绘制制出出频频率率分分布布直直方方图图(如如图图所所示示),图图中中从从左左到到右右各各小小矩矩形形的的面面积积之之比比为为2 24 41
26、717151510102 2,第第二二小小组组频频数数为为12.12.1)1)第二小组的频率是多少?第二小组的频率是多少?样本容量是多少?样本容量是多少?(2)(2)若次数在若次数在110110以上以上(含含110110次次)为达标,试估计该校全体高一为达标,试估计该校全体高一学生的达标率是多少?学生的达标率是多少?解解:(1)(1)第二小组的频率是第二小组的频率是100.008100.0080.080.08,样本容量是样本容量是120.08120.08150.150.(2)(2)达标率为达标率为(0.034(0.0340.0300.0300.0200.0200.004)100.004)100
27、.088100.0881088%.88%.0 01 12 23 34 48 80 50 50 5 70 5 71 1 51 1 53 3茎茎叶叶 甲甲运动员得分:运动员得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939;乙乙运动员得分:运动员得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,39.39.甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 55 5 4 41 1 6 1
28、6 6 1 6 7 97 94 4 9 90 02 2 5 5当样本数据较少时,用茎叶图表示数据的效果较好当样本数据较少时,用茎叶图表示数据的效果较好练习:练习:某中学高一(某中学高一(2 2)班甲,乙两)班甲,乙两名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成绩情况如下:绩情况如下:甲的得分:甲的得分:9595,8181,7575,9191,8686,8989,7171,6565,7676,8888,9494乙的得分:乙的得分:8383,8686,9393,9999,8888,9696,9898,9898,7979,8585,9797画出两人数学成绩茎叶图,请根据画出两人数学成
29、绩茎叶图,请根据茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。表示样本分布的方法表示样本分布的方法:(1 1)频率分布表)频率分布表优点优点是在数量表示上比较确切,是在数量表示上比较确切,缺点缺点是不够直观、形象,分析数据分布的总体态势不太方便是不够直观、形象,分析数据分布的总体态势不太方便(2 2)频率分布图)频率分布图(包括直方图和条形图)(包括直方图和条形图)优点优点:易表示:易表示大量数据大量数据 ,直观直观地表明分布地地表明分布地 情况情况 ;缺点:缺点:丢失一些信息。丢失一些信息。(3 3)频率分布折线图)频率分布折线图优点是它反映了数据的变化趋势优点是它反映了数据的变化
30、趋势(4 4)茎叶图)茎叶图优点优点:(1 1)保留了原始数据,没有损失样)保留了原始数据,没有损失样本信息;(本信息;(2 2)数据可以随时记录、添加或修改)数据可以随时记录、添加或修改.缺点:缺点:只能处只能处理样本容量较小数据理样本容量较小数据小结小结1.1.频率分布表频率分布表 表示样本的分布的方法:表示样本的分布的方法:频率频率/组距组距产品尺寸产品尺寸(mm)mm)2.2.频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无限增大,组距无限缩小大,组距无限缩小4.4.样本频率分布直方图样本频率分布直方图接接近于一条光滑曲线近于一条光滑曲线总总体密度曲线体密度曲线,反映了总体,反映了总体分布。分布。3.3.频率分布折线图频率分布折线图5.5.茎叶图茎叶图