《必修三用样本的频率分布估计总体分布.pptx》由会员分享,可在线阅读,更多相关《必修三用样本的频率分布估计总体分布.pptx(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:统计的核心问题:如何根据样本的情况对总体的情况作如何根据样本的情况对总体的情况作出一种推断出一种推断.这里包括两类问题:这里包括两类问题:一类是如何从总体中抽取样本一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计另一类是如何根据对样本的整理、计算、分析算、分析,对总体的情况作出推断对总体的情况作出推断.第1页/共52页 用样本的有关情况去估计总体的相应用样本的有关情况去估计总体的相应情况情况,这种估计大体分为两类,这种估计大体分为两类,一类是
2、用样一类是用样本频率分布估计总体分布,本频率分布估计总体分布,一类是用样本一类是用样本的某种数字特征(例如平均数、方差等)的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。去估计总体的相应数字特征。整体介绍:整体介绍:第2页/共52页 将一批数据按要求分为若干个组,将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的各组内数据的个数,叫做该组的频数频数。每组数据的个数除以全体数据个数每组数据的个数除以全体数据个数的商叫做该组的的商叫做该组的频率频率。复习复习频数与频率频数与频率根据随机抽取样本的大小,根据随机抽取样本的大小,分别计算某分别计算某一事件出现的频率一事件出现的频率
3、,频率的分布规律频率的分布规律(取值状况),就叫做(取值状况),就叫做样本的频率分布样本的频率分布。频率分布频率分布第3页/共52页思考:样本频率分布与总体频率分 布有什么关系?通过样本的通过样本的频数分布、频率分布频数分布、频率分布可可以估计总体的频率分布以估计总体的频率分布.第4页/共52页频率分布频率分布 样本中所有数据(或数据组)的频数和样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的样本容量的比,叫做该数据的频率频率。频率分布的表示形式有:频率分布的表示形式有:样本频率样本频率分布表分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布直方图直方图样本频率分布样本频
4、率分布折线图折线图 所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。第5页/共52页知识探究(一):频率分布表知识探究(一):频率分布表【问题问题】我国是世界上严重缺水的国我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个行居民生活用水定额管理,即确定一个居民月用水量标准居民月用水量标准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价的部分按议价收费收费.通过抽样调查,获得通过抽样调查,
5、获得100100位居民的位居民的月均用水量如下表(单位:月均用水量如下表(单位:t t):):第6页/共52页3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 3.4 2.6 2.2 2.2 1.5 1.2 0.20.2 0.4 0.3 0.4 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3
6、 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.
7、32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2第7页/共52页 如果希望大部分居民的日常生活不受影响,那么标准 a 定为多少比较合理呢?为了较合理地确定这个标准,你认为需要做哪
8、些工作?显然:这里的总体可以在一个实数区间取值,称为连显然:这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:续型总体。样本的频率分布表示形式有:频率分布表频率分布表和和频率分布直方图频率分布直方图画频率分布表和频率分布直方图其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图第8页/共52页1.1.极差:极差:样本数据中的最大值和最小样本数据中的最大值和最小值的差称为极差值的差称为极差2.2.确定组距,组数:确定组距,组数:.如果将上述如果将上述100100个数据按组距为个数据按组
9、距为0.50.5进行分组,进行分组,那么这些数据共分为多少组?那么这些数据共分为多少组?0.20.24.34.3(4.3-0.24.3-0.2)0.5=8.20.5=8.28.28.2取取过剩过剩整数值整数值,分为分为9 9组组第9页/共52页 3 3 将数据分组,决定分点:将数据分组,决定分点:以组距为以组距为0.50.5进行分组,上述进行分组,上述100100个数据共分为个数据共分为9 9组,组,各组数据的取值范围可以如何设定?各组数据的取值范围可以如何设定?4 4 画频率分布表:画频率分布表:如何统计上述如何统计上述100100个数个数据在各组中的频数?如何计算样本数据据在各组中的频数?
10、如何计算样本数据在各组中的频率?你能将这些数据用表在各组中的频率?你能将这些数据用表格反映出来吗?格反映出来吗?0,0.5),0.5,1),1,1.5),4,4.5.第10页/共52页 分 组 频数累计 频数 频率 0,0.5)4 0.04 0.5,1)正 8 0.08 1,1.5)正 正 正 15 0.15 1.5,2)正 正 正 正 22 0.22 2,2.5)正 正 正 正 正 25 0.25 2.5,3)正 正 14 0.14 3,3.5)正 一 6 0.06 3.5,4)4 0.04 4,4.5 2 0.02 合计 100 1.00第11页/共52页知识探究(二):频率分布直方图知识
11、探究(二):频率分布直方图 5 5 画频率分布直方图画频率分布直方图 为了直观反映样本为了直观反映样本数据在各组中的分布情况,我们将上述数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形频率分布表中的有关信息用下面的图形表示:表示:月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第12页/共52页上图称为上图称为频率分布直方图频率分布直方图,其中横轴表,其中横轴表示月均用水量,纵轴表示频率示月均用水量,纵轴表示频
12、率/组距组距.频率分布直方图中各小长方形的宽度和频率分布直方图中各小长方形的宽度和高度在数量上有何特点?高度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距高度:频率频率组距组距2 图形的意义图形的意义 第13页/共52页频率分布直方图频率分布直方图月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5各个小长方形的面积=?频率频率第14页/共52页月均用水量月均用水量/t频率频率组距组距0.100.200.300.400
13、.500.511.5 22.533.544.5小长方形的面积总和=?频率分布直方图频率分布直方图1第15页/共52页月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5月均用水量最多的在哪几个区间?频率分布直方图频率分布直方图第16页/共52页3 3 分析例题:分析例题:频率分布直方图非常直观频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出据模式,但原始数据不能在图中表示出来来.你能根
14、据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第17页/共52页(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民
15、月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第18页/共52页探要点、究所然第19页/共52页探要点、究所然第20页/共52页探要点、究所然第21页/共52页探要点、究所然第22页/共52页探要点、究所然第23页/共52页频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.20.30.40.50.511.5 22.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图第24页/共52页利用样本频率分布对总体分布进行相
16、应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?第25页/共52页总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线第26页/共52页 用样本
17、分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线总体密度曲线第27页/共52页1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?思考 实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。由于样本是随机的,不同的样本得到的频
18、率分布折由于样本是随机的,不同的样本得到的频率分布折线图不同;即使是同一样本,不同的分组得到的频线图不同;即使是同一样本,不同的分组得到的频率分布折线图也不同。率分布折线图也不同。也就是说:也就是说:频率分布折线图是随着样本的容量和分频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线。布折线图得到准确的总体密度曲线。第28页/共52页2.2.图中阴影部分的面积表示什么?图中阴影部分的面积表示什么?月均用水量月均用水量/t/t频率频率组距组距0ab第29页/共52页2.总体在范围(a,b)内取值
19、的百分比 月均用水量月均用水量/t/t频率频率组距组距0ab第30页/共52页NBANBA某赛季甲、乙两名篮球运动员每场比赛的得分的原始纪录如下:甲运动员得分:1313,5151,2323,8 8,2626,3838,1616,3333,1414,2828,3939;乙运动员得分:4949,2424,1212,3131,5050,3131,4444,3636,1515,3737,2525,3636,39.39.问题一:请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较.引例第31页/共52页频率分布表频率分布表分组分组频数频数频率频率甲甲乙乙甲甲(11)(11)乙乙(13)(13)0
20、,10)0,10)1 10 00.09 0.09 0.00 0.00 10,20)10,20)3 32 20.27 0.27 0.15 0.15 20,30)20,30)3 32 20.27 0.27 0.15 0.15 30,40)30,40)3 36 60.27 0.27 0.46 0.46 40,50)40,50)0 02 20.00 0.00 0.15 0.15 50,60)50,60)1 11 10.09 0.09 0.08 0.08 第32页/共52页第33页/共52页问题二:用上次课所学的制作样本的频率分布直方图来分析好吗?甲:13,51,23,8,26,38,16,33,14,
21、28,39;乙:49,24,12,31,50,31,44,36,15,37,25,36,39.当数据比较少时,应用列分布直方图反当数据比较少时,应用列分布直方图反而不方便而不方便 第34页/共52页简化制图格式和步骤,得到新的统计制图方法:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.茎叶图茎叶图 (一种被用来表示数据的图一种被用来表示数据的图)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎
22、,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图 第35页/共52页 甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 注:注:中间中间的数字表示得分的的数字表示得分的十十位数字。位数字。旁边旁边的数字分别表示两个人得分的的数字分别表示两个人得分的个位个位数。数。茎茎叶叶图图第36页/共52页乙:得分基本上是对称的,叶的分布是乙:得分基本上是对称的,叶的分布是“单峰单峰”的,的,有有10/13的叶是分布在茎的叶是分布在茎2、3、4上,中位数是上,中位数是36.甲:得分除一个特殊得分(甲:得分除一个特
23、殊得分(51分)外,也大致对称,分)外,也大致对称,分布也是分布也是“单峰单峰”的,有的,有9/11的叶主要集中在茎的叶主要集中在茎1、2、3上,中位数是上,中位数是26.从上述中位数的大小就可以看得出,乙运动员的成绩更好.另外,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.请用适当的方法表示上述数据,并对两名请用适当的方法表示上述数据,并对两名运动员的得分能力进行比较运动员的得分能力进行比较第37页/共52页茎叶图特点:茎叶图不仅能保留原始数据,而且能够展示数据的分布情况。当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且 可以随时记录,给数据的记录和
24、表示都方便。第38页/共52页第39页/共52页探要点、究所然第40页/共52页探要点、究所然第41页/共52页探要点、究所然第42页/共52页探要点、究所然A第43页/共52页探要点、究所然C第44页/共52页探要点、究所然D第45页/共52页当堂测、查疑缺C第46页/共52页当堂测、查疑缺A第47页/共52页当堂测、查疑缺乙 第48页/共52页课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布表(2)频率分布图(包括直方图和条形图)频率分布图(包括直方图和条形图)(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图第49页/共52页1.频率分布表频率分布表 表示样本的分布的方法:表示样本的分布的方法:分组分组个数累计个数累计频数频数频率频率频率频率/组距组距产品尺寸产品尺寸(mm)2.频率分布直方图频率分布直方图样本频率分布中,样本频率分布中,当样本容量无限增当样本容量无限增大,组距无限缩小大,组距无限缩小样本频率分布直方图样本频率分布直方图接近接近于一条光滑曲线于一条光滑曲线总体总体密度曲线密度曲线,反映了总体分,反映了总体分布。布。3.频率分布折线图频率分布折线图第50页/共52页作业:练习册 P35 类型二 2 P36 类型三 2 知能达标(十三)第51页/共52页谢谢您的观看!第52页/共52页