《221用样本的频率分布去估计总体.ppt》由会员分享,可在线阅读,更多相关《221用样本的频率分布去估计总体.ppt(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用样本的频率分布用样本的频率分布 估计总体分布估计总体分布复习旧知识复习旧知识1,抛掷硬币的大量重复试验的频率分布表: 0.501 1 0.498 9样本容量为72 088什么叫频率分布条形图?频数?频率?0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记为135 96436 124反面向上反面向上正面向上正面向上频率频率频数频数实验结果实验结果注意点:各直方长条的宽度要相同, 宽窄与频率无关;相邻长条之间的间隔要适当;条形图的高度就是频率;0.10.20.30.40.50.60.701试验结果频率练 习1.在100名学生中,每人参加一个运动队,其中参加
2、田径 队的有13人,参加体操队的有10 人,参加足球队的 有24人,参加篮球队的有27人,参加排球队的有15人, 参加乒乓球队的有11人.(1)列出学生参加各运动队的频率分布表;(2)画出表示频率分布的条形图. 试验结果试验结果 频频 数数频率频率参加田径队参加田径队(1)130.13参加体操队参加体操队(2)100.10参加足球队参加足球队(3)240.24参加篮球队参加篮球队(4)270.27参加排球队参加排球队(5)150.15参加乒乓球队参加乒乓球队(6)110.11解:频率分布表如下:频率分布条形图如下频率分布条形图如下:152346频率结果 例例 某市政府为了节约生活用水,计划在本
3、市试某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水行居民生活用水定额管理,即确定一个居民月用水量标准量标准a ,a ,用水量不超过用水量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按议价收费。的部分按议价收费。 如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那 么标准么标准a a定为多少比较合理呢定为多少比较合理呢? 为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做 哪些工作?哪些工作? 思考思考:由上表,大家可以得到什么信息?:由上表,大家可以得到什么信息? 通过抽样,我们
4、获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量( (单位:单位:t) t) ,如下表:,如下表: 上面这些数字能告诉我们什么呢?很容易上面这些数字能告诉我们什么呢?很容易发现的是一个居民月均用水量的最小值是发现的是一个居民月均用水量的最小值是0.2t,最大值是,最大值是4.3t,其他在,其他在0.24.3t之之间。除此以外,很难发现这间。除此以外,很难发现这100位居民的用位居民的用水量的其他信息。水量的其他信息。1.1.求极差(即一组数据中最大值与最小值的差)求极差(即一组数据中最大值与最小值的差) 2.2.决定组距与组数决定组距与组数组数组数= =
5、4.3 4.3 - - 0.2 = 4.10.2 = 4.14.14.10.50.5 = 8.2= 8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5 ) ),0.50.5,1 1 ) ),4 4,4.54.5 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。组距:指每个小组的两个端点的距离, 这时可以将数据分为这时可以将数据分为9 9组,这个组数是较合适组,这个组数是较合适的,于是取组距为的,于是取组距为0.50.5,组数为,组数为9 94.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表注意:这
6、里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图用面积表示概率。频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积组距组距频率频率=组距组距频率频率= =注意:这里的纵坐标不是频率,而是频率/组距;某个区间上的概率用这个区间的面积表示;频率分布频率分布直方图直方图思考:所有小长方形的面积之和等于?思考:所有小长方形的面积之和等于?从中我们可以
7、看到,月均用水量在区间从中我们可以看到,月均用水量在区间【2,2.5】内的居民最多,在【】内的居民最多,在【1.5,2)内)内的次之,大部分居民的月均用水量都在的次之,大部分居民的月均用水量都在【1,3)之间。之间。直方图能够看到在分布表中看不清楚的数直方图能够看到在分布表中看不清楚的数据模式。例如,从图中可以清楚的看到,据模式。例如,从图中可以清楚的看到,居民月均用水量的分布是居民月均用水量的分布是“山峰山峰”状的,而状的,而且是的且是的“单峰单峰”的,另外还有一定的对称性。的,另外还有一定的对称性。但是,直方图也丢失了一些信息,例如,原但是,直方图也丢失了一些信息,例如,原始数据不能再图中
8、表示出来。始数据不能再图中表示出来。思考:如果当地政府希望使思考:如果当地政府希望使85%以上的居以上的居民每月的用水量不超出标准,根据频率分民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用布表和频率分布直方图,你能对制定月用水量标准提出建议吗?水量标准提出建议吗?想一想:想一想:3t这个标准一定能够保证这个标准一定能够保证85%以上的以上的居民用水不超标吗?如果不一定,那么哪些环居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?节可能导致结论的差别?实际上实际上,这个标准还可能出现偏差这个标准还可能出现偏差.所以所以,在实践中在实践中,对统计的结论是需要进
9、行评价的对统计的结论是需要进行评价的.探究:探究: 同样一组数据,如果组距不同,横轴、纵轴的单位同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分同的印象,这种印象有时会影响我们对总体的判断。分别以别以1 1和和0.10.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。 一一、求求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组距:组距=极差极差/组数组数三、分组三、分组,
10、通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间 , 最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图, ,可以按以下的可以按以下的步骤进行步骤进行: :五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率分布折线图连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图一般的,
11、当总体中的个体数较多时,一般的,当总体中的个体数较多时,抽样时样本容量就不能太小。例如,抽样时样本容量就不能太小。例如,如果要抽样调查一个省乃至全国的如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量居民的月均用水量,那么样本容量就应比调查一个城市的时候大。就应比调查一个城市的时候大。频率频率组距组距产品产品尺寸尺寸(mm) 当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体在区间总体在区间 内取值的概率内取值的概率),(baS总体密度曲线a b说明:在(a,b)内的概率与在a,b)内的概率是一样的 用样本分布直方图去估计相应的总体分布时,一般样本
12、容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值概率。 总体密度曲线反映了总体在各个范围内取值的概率,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线总体密度曲线 (1) 离散型:当总体中的个体所取的不同数值较少时, 其随机变量是离散型的. 试验结果频 数 频频 率率 频率频率 试验结果试验结果01 条形图条形图40.60.小结: (2) 连续型:当总体中的个体所取的数值较多,甚至 无限时,其随机变量是连续型的. 分 组 频 数 频 率 产品尺寸产品尺寸25.295 25.355 频率分布直方图频率分布直方图累
13、积频率频率分布表组距频率3、频率分布条形图和频率分布直方图两者是不同的概念,虽然它们的横坐标表示的内容是相同的,但是频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的面积。例题例题.一个容量为一个容量为100的样本的样本,数据的分组和各组的数据的分组和各组的相关信息如下表相关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1
14、.00合计合计 100 1.00例1、对某电子元件进行寿命追踪调查,情况如下: 寿命寿命个数个数1002002003003004004005005006002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h400h以内的概率;(4)估计电子元件寿命在400h以上的概率;应用举例:应用举例: (1)列出频率分布表; 100200200300300400400500500600寿命寿命合计合计频率频率频数频数累积频率累积频率20308040302000.100.150.400.200.1510.100.250.650.851100200300400
15、500600)寿命(h频率/组距0.65. 0:40010065. 0:4001003的概率为元件寿命在,所以我们估计电子为的电子元件出现的频率出,寿命在)由频率分布表可以看(hhh.:h.:h3504003501502004004以以上上的的概概率率为为估估计计电电子子元元件件寿寿命命在在,故故我我们们元元件件出出现现的的频频率率为为以以上上的的电电子子命命在在由由频频率率分分布布表表可可知知,寿寿)(. .课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频
16、数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点.茎叶图茎叶图情境:情境:某赛季甲、乙两名篮球运动员每场比赛得某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:分的原始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39l问题:如何有条理地列出这些数据,分析该运动如何有条理地列出这些数据,分析该运动员的整
17、体水平及发挥的稳定程度?员的整体水平及发挥的稳定程度? 茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 33 6 83 8 9 1甲乙8 04 6 3 1 2 5 3 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0茎叶图不仅能够保留原始数据茎叶图不仅能够保留原始数据,而且能够展示数据的而且能够展示数据的分布情况分布情况.比如乙运动员的得分基本上是对称的比如乙运动员的得分基本上是对称的,叶的叶的分布是分布是”单峰单峰”的的,有有10/13的叶集中在茎的叶集中在茎2,3,4上上,中位中位数是数是36;甲运动员的得分除一个特殊得分甲
18、运动员的得分除一个特殊得分(51分分)外外,也也大致对称大致对称,叶的分布也是叶的分布也是”单峰单峰”的的,有有9/11的叶主要集的叶主要集中在茎中在茎1,2,3上上,中位数是中位数是26.由此可以看出由此可以看出,乙运动员乙运动员的成绩更好的成绩更好.乙运动员的得分更集中于峰值附近乙运动员的得分更集中于峰值附近,说明说明乙运动员的发挥更稳定乙运动员的发挥更稳定. 一般地:当数据是一位和两位有效数字一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个效数字,两边的数字表示个位数,即第二个有效数字,它
19、的中间部分像植物的茎,两边有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。(或从小到大)的顺序同行列出。1茎叶图的概念:2茎叶图的特征:)用茎叶图表示数据有两个优点:一是从统计图)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记从茎
20、叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;录,随时添加,方便记录与表示;()茎叶图只便于表示两位(或一位)有效数字()茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;够记录,但是没有表示两个记录那么直观,清晰;()茎叶图对重复出现的数据要重复记录,不能()茎叶图对重复出现的数据要重复记录,不能遗漏遗漏制作茎叶图的方法是制作茎叶图的方法是:将所有两位数的十位数字
21、:将所有两位数的十位数字作为作为“茎茎”,个位数字作为,个位数字作为“叶叶”,茎相同者共,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序共茎的叶一般按从大到小(或从小到大)的顺序同行列出同行列出. .茎叶图的制作方法茎叶图的制作方法注意注意:在制作茎叶图时,重复出现的数据要重复在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是记录,不能遗漏,特别是“叶叶”部分;同一数据部分;同一数据出现几次,就要在图中体现几次出现几次,就要在图中体现几次. .用茎叶图表示数据有两个突出的优点:用茎叶图表示数据有两个突出的优点:一一. .是所有的信息都可以从这个茎叶图是所有的信息都可以从这个茎叶图 上得到;上得到;二二. .是茎叶图便于记录和表示是茎叶图便于记录和表示. .用茎叶图表示数据有一个突出的缺点:用茎叶图表示数据有一个突出的缺点:茎叶图茎叶图的缺点的缺点是其分析只是粗略的,对差异是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上不大的两组数据不易分析;表示三位数以上的数据时不够方便的数据时不够方便. .