《221用样本的频率分布估计总体分布 (2).ppt》由会员分享,可在线阅读,更多相关《221用样本的频率分布估计总体分布 (2).ppt(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2.12.2.1用样本的频率分布估计用样本的频率分布估计总体分布总体分布主备主备人:王朝远人:王朝远 张洪华张洪华 审审核人:牟必继核人:牟必继2.2.1 2.2.1 用样本的频率分用样本的频率分布估计总体分布布估计总体分布1、用样本去估计总体,是研究统计问题的一个基本思想、用样本去估计总体,是研究统计问题的一个基本思想2、前面我们学过的抽样方法有、前面我们学过的抽样方法有:简单随机抽样、系统抽样、简单随机抽样、系统抽样、分层抽样分层抽样,这些主要是用来收集数据,那么我们如何分析这些主要是用来收集数据,那么我们如何分析这些数据的规律呢?这些数据的规律呢?3、初中时我们学习过样本的频率分布,
2、包括频数、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。频率的概念,频数分布表和频数分布直方图的制作。20002000年全国主要城市中缺水情况排在前年全国主要城市中缺水情况排在前1010位的城市位的城市探究:我国是世界上严重缺水的国家之一,探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。城市缺水问题较为突出。例例 某市政府为了节约生活用水,计划在本某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居市试行居民生活用水定额管理,即确定一个居民月用水量标准民月用水量标准a,a,用水量不超过用水量不超过a a的部分按平的部分
3、按平价收费,超过价收费,超过a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的日常生活不受影响,如果希望大部分居民的日常生活不受影响,那么标准那么标准a a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,你认为需为了较合理地确定这个标准,你认为需要做哪些工作?要做哪些工作?思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均位居民某年的月平均用水量用水量(单位:单位:t)t),如下表:,如下表:很容易发现的是一个居民月平均用水量的最很容易发现的是一个居民月平均用水量的最小值时小
4、值时0.2t0.2t,最大值是,最大值是4.3t4.3t,其他在,其他在0.2t0.2t4.3t4.3t之间之间,除此之外很难再发现这除此之外很难再发现这100100位居民的用水量位居民的用水量的其它信息了,实际上,我们很难从随意记录下的其它信息了,实际上,我们很难从随意记录下来的数据中直接看出规律,为此,我们需要对统来的数据中直接看出规律,为此,我们需要对统计数据进行整理与分析。计数据进行整理与分析。分析数据的一种基本方法是分析数据的一种基本方法是用图将它们画出来,或者用用图将它们画出来,或者用紧凑的表格改变数据的排列方式紧凑的表格改变数据的排列方式,作图可以达到两个目,作图可以达到两个目的
5、,一是从数据中提取信息,二是利用图形传递信息,表格的,一是从数据中提取信息,二是利用图形传递信息,表格则是通过改变数据的构成形式,为我们提供解释数据的新方式则是通过改变数据的构成形式,为我们提供解释数据的新方式 初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.下面将要学习下面将要学习的频率分布表和频率分布图的频率分布表和频率分布图,则是,则是从各个从各个小组数据在样本容量中所占比例大小的角度,小组数据在样本容量中所占比例大小的角度,来表示数据来表示数据分布的规律分布的规律.它可以使我们看到整个样本数据的它可以使我们看到整个样本数据的频率分布频率分布情况情
6、况.频率分布相关概念频率分布相关概念 频率:频率:样本中某个组的频数和样本容量的比,样本中某个组的频数和样本容量的比,叫做该数据的叫做该数据的频率频率。所有数据(或数据组)的频数的分布变化所有数据(或数据组)的频数的分布变化规律叫做规律叫做样本的频率分布。样本的频率分布。频数:频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数频率分布的表示形式有:频率分布的表示形式有:样本频率分布表样本频率分布表样本频率分布图样本频率分布图 样本频率分布样本频率分布条形图条形图 样本频率分布样本频率分布直方图直方图样本频率分布折线图样本频率分布折线图抛掷硬币的大量重复试验
7、的结果:抛掷硬币的大量重复试验的结果:35 964反面向上反面向上36 124正面向上正面向上频率频率频数频数实验结果实验结果0.501 1 0.498 9样本容量为样本容量为72 088频率分布条形图频率分布条形图0.10.20.30.40.50.60.701试验结果试验结果频率频率“正面向上正面向上”记记为为0“反面向上反面向上”记为记为1频率分布表频率分布表:注意:注意:各长方形长条的宽度要相同。各长方形长条的宽度要相同。相邻长条的间距要适当。相邻长条的间距要适当。结论:当试验次数结论:当试验次数无限增大时,两种试验无限增大时,两种试验结果的频率大致相等。结果的频率大致相等。长方形长条的
8、高度长方形长条的高度表示取各值的频率。表示取各值的频率。第一步第一步:求极差求极差(一组数据中的最大(一组数据中的最大值与最小值的差)值与最小值的差).样本频率分布表样本频率分布表思考思考1 1:上述上述100100个数据中的最个数据中的最大值和最小值分别是什么?由大值和最小值分别是什么?由此说明样本数据的变化范围是此说明样本数据的变化范围是什么?什么?0.20.24.34.3思考思考2:分成多少组合适呢分成多少组合适呢?第二步第二步:决定组距与组数决定组距与组数:组距组距:指每个小组的两个端点的距指每个小组的两个端点的距离;离;组数组数:k=k=极差极差组距,若组距,若k k为整数,为整数,
9、则组数则组数=k=k,否则,组数,否则,组数=k k+1.+1.将数据分组,当数据在将数据分组,当数据在100个以个以内时,内时,按数据多少常分按数据多少常分5-12组。组。(4.30.2)0.58.2.将8.2取整故,可取组距=0.5,组数=9如果将上述如果将上述100个数据按组个数据按组距为距为0.5进行分组,那么这进行分组,那么这些数据共分为多少组?些数据共分为多少组?第四步:列频率分布表第四步:列频率分布表.计算各小组的频率,作出计算各小组的频率,作出下面的下面的频率分布表频率分布表.第三步:确定分点,将数据分组第三步:确定分点,将数据分组.以组距为以组距为0.50.5将数据分组时,将
10、数据分组时,可以分成以下可以分成以下9 9组:组:0,0.5),0.5,1),0,0.5),0.5,1),4,4.5.,4,4.5.思考思考3:各组数据的取值各组数据的取值范围可以如何设定?范围可以如何设定?各组均为左闭右开区间,最后一组是闭区间 思考思考4:如何统计上述如何统计上述100100个数据在各个数据在各组中的频数组中的频数?如何计算样本数据在如何计算样本数据在各组中的频率各组中的频率?你能将这些数据用你能将这些数据用表格反映出来吗表格反映出来吗?列频率分布表列频率分布表:分组分组频数累计频数累计频数频数频率频率0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)
11、3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.000.02频率频率/组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04频率分布表一般分五列频率分布表一般分五列1 1、“分组分组”,2 2、“频数累计频数累计(可省),(可省),3 3、“频数频数”,4 4、“频率频率”,5 5、“频率频率/组距组距”最后一行是合计最后一行是合计频数的合计为频数的合计为样本容量样本容量频率合计为频率合计为1 1为了直观
12、反映样本数据在各组中的分布情况,我们将上述频为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:率分布表中的有关信息用下面的图形表示:月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234频率分布直方图频率分布直方图 第一步:第一步:画平面直角坐标系画平面直角坐标系.第二步:第二步:在横轴上均匀标在横轴上均匀标出各组分点,在纵轴上出各组分点,在纵轴上标出单位长度标出单位长度.第三步:第三步:以组距为宽,各组的频率以组距为宽,各组的频率与组距的商为高,分别画出各组对与组距的商为高,分别画出各
13、组对应的小长方形应的小长方形.y轴:频率频率/组距组距x轴:数据单位频率分布条形图和频率分布直方图两者是不同的概念,虽然它们的横坐标表示的内容是相同的,但是频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的面积。月均用水量月均用水量/t频率频率/组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O各组的频率在图中哪里显示出来?各组的频率在图中哪里显示出来?各小长方体的面积之和是否为定值?各
14、小长方体的面积之和是否为定值?各小长方形的面积之和为各小长方形的面积之和为1.1.宽度:组距宽度:组距高度:高度:频率频率组距组距知识探究(二):频率分布直方图知识探究(二):频率分布直方图 小长方形的面积小长方形的面积=组距组距频率频率=组距组距频率频率月均用水量月均用水量/t0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 你能根据上述频率分布直方图指出居民月均用水量的你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?一些数据特点吗?频率频率/组距组距(
15、1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率频率频率组距组距组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O 同样一组数据,如果同样一组数据,如果组距不同,横轴、纵轴的单位不同,组距不同,横轴、纵
16、轴的单位不同,得到得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以时会影响我们对总体的判断,下面给出以0.1和和1为组距重新作出的为组距重新作出的频率分布直方图。频率分布直方图。如果市政府希望如果市政府希望85%85%左右的居民每月的用水量不超过左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准标准,根据上述频率分布表,你对制定居民月用水量标准(即(即a a的取值)有何建议?的取值)有何建议?问题:问题:月均用水量月均用水量/t频率频率频率频率组距组距组距组距
17、0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O0.150.250.020.220.080.140.040.040.06若将标准a定为2.5,则7474%的居民在的居民在2.52.5t t以下以下若将标准a定为3,则88%88%的居民在的居民在3t3t以下,标准可定为以下,标准可定为3t.3t.频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中连接频率分布直方图中各小长方形上端的中点各小长方形上端的中点,得到得到频率分布折线图频
18、率分布折线图利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计:(1 1)上例的样本容量为)上例的样本容量为100100,如果增至,如果增至1 0001 000,其,其频率分布直方图的情况会有什么变化?假如增至频率分布直方图的情况会有什么变化?假如增至10 00010 000呢?呢?(2 2)样本容量越大,这种估计越精确样本容量越大,这种估计越精确.(3 3)当样本容量无限增大,组距无限缩小,那么)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线频率分布直方图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线.总体密度曲线总体密度曲线月均
19、用月均用水量水量/tab(图中阴影部分的面积,表示总体在某个区间(图中阴影部分的面积,表示总体在某个区间(a,b)a,b)内取值的百分比)内取值的百分比).o频率频率/组距组距 当样本容量无限增大,分组的组距无限缩小,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线总体密度曲线 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的
20、的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总体分布的工具总体分布的工具.总体密度曲线总体密度曲线几种表示频率分布的方法的优点和不足几种表示频率分布的方法的优点和不足1.频率分布表在数量上比较确切,但不频率分布表在数量上比较确切,但不够直观,形象,分析数据分布的总体态够直观,形象,分析数据分布的总体态势不太方便势不太方便2.频率分布直方图能够很容易地表示大量数据,频率分布直
21、方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,但是从直到分布表中看不清楚的数据模式,但是从直方图本身得不出来原始的数据内容,也就是方图本身得不出来原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。据信息就被抹掉了。3.频率分布折线图的优点是它反映了数据频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线
22、。向于总体分布的密度曲线。练练 习习1.有一个容量为有一个容量为50的样本数据的分组的频数如下:的样本数据的分组的频数如下:12.5,15.512.5,15.5)3 315.5,18.515.5,18.5)8 818.5,21.518.5,21.5)9 921.5,24.521.5,24.5)111124.5,27.524.5,27.5)101027.5,30.527.5,30.5)5 530.5,33.530.5,33.5)4 4(1)(1)列出样本的频率分布表列出样本的频率分布表;(2)(2)画出频率分布直方图画出频率分布直方图;(3)(3)根据频率分布直方图估计根据频率分布直方图估计,数
23、据落在数据落在15.5,24.515.5,24.5)的百分比是多少的百分比是多少?解解:组距为组距为3 分组分组 频数频数 频率频率12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率频率/组距组距合计合计 50 1频率分布直方图如下频率分布直方图如下:频率频率/组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070 2
24、 2、为了了解一大片经济林的生长情况,随机测量其中的、为了了解一大片经济林的生长情况,随机测量其中的100100株的底株的底部周长,得到如下数据表(长度单位:部周长,得到如下数据表(长度单位:cmcm):135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991
25、011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)(1)编制频率分布表;(编制频率分布表;(2)2)绘制频率分布直方图;绘制频率分布直方图;(3 3)估计该片经济林中底部周长小于)估计该片经济林中底部周长小于100cm100cm的树木的树木 约占多约占多少,周长不小于少,周长不小于120cm120cm的树木约占多少。的树木约占多少。解解:(1 1)从表中可以看出:)从表中可以看出:这组数据的最大值为这组数据的最大值为135135,最小值为,最小值为8080,1 1、求极差、求极
26、差 极差:极差:135-80=55135-80=55,2 2、可将其分为、可将其分为1111组,组,组距为组距为5 5。3 3、将数据分组、将数据分组 80 80,8585),),85,90),85,90),,130,135130,1354 4、列频率分布表、列频率分布表80859095135110 115 120 125 130100 1053 3、对某电子元件进行寿命跟踪调查,情况如下:、对某电子元件进行寿命跟踪调查,情况如下:1)列出频率分布表2)估计电子元件寿命在100h400h以内的频率3)估计电子元件寿命在400h以上频率4.已知样本已知样本10,8,6,10,8,13,11,10
27、,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围的是范围的是 ()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分组分组 频数频数 频率频率 5.57.5 2 0.1 7.59.5 6 0.3 9.511.5 8 0.411.513.5 4 0.2 合计合计 20 1.0D(20112011湖北高考)有一个容量为湖北高考)有一个容量为200200的样本,其频率的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间计,样本数据落在区间1010,12
28、12)内的频数为()内的频数为()(A A)18 18 (B B)36 36 (C C)54 54 (D D)7272 当总体中的个体数比较少或样本数据不密集时,当总体中的个体数比较少或样本数据不密集时,不存在总体密度曲线,因为组距不能任意缩小不存在总体密度曲线,因为组距不能任意缩小.思考:对于任何一个总体,它的密度曲线是思考:对于任何一个总体,它的密度曲线是不是一定存在?为什么?不是一定存在?为什么?实际上,尽管存在总体密度曲线,但在实际应用实际上,尽管存在总体密度曲线,但在实际应用中需要用样本来估计中需要用样本来估计.由于样本是随机的,不同的样本由于样本是随机的,不同的样本得到的频率分布折
29、线图不同;即便对于同一样本,不得到的频率分布折线图不同;即便对于同一样本,不同的分组情况得到的频率分布折线图也不同同的分组情况得到的频率分布折线图也不同.这条曲线这条曲线并不惟一,所以不能通过样本数据准确地画出总体密并不惟一,所以不能通过样本数据准确地画出总体密度曲线度曲线.思考:对于任何一个总体,它的密度曲线是否思考:对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?可以被非常准确地画出来?为什么?频率分布表、频率分布直方图和折线图的主要频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可作用是表示样本数据的分布情况,此外,我们还可以用以用茎叶
30、图茎叶图来表示样本数据的分布情况来表示样本数据的分布情况.茎叶图茎叶图 情境:情境:某赛季甲、乙两名篮球运动员每场比赛得某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:分的原始记录如下:(1)(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,3913,51,23,8,26,38,16,33,14,28,39(2)(2)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,3949,24,12,31,50,31,44,36,15,37,25,36,39问题:如何有条理地列出这些数据,分析该运动如何有条理地
31、列出这些数据,分析该运动员的整体水平及发挥的稳定程度?员的整体水平及发挥的稳定程度?茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 83 8 9 1在在统计中,上图叫做茎叶图,它也是表示样本数据分布情统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中况的一种方法,其中“茎茎”指的是哪些数,指的是哪些数,“叶叶”指的是指的是哪些数?哪些数?用茎叶图表示,如下图:用茎叶图表示,如下图:甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 52 2 5 55 5 4
32、41 1 6 1 6 6 1 6 7 97 94 4 9 90 0 “茎茎”指的是中间的一列数,表示得分的十位指的是中间的一列数,表示得分的十位数;数;“叶叶”指的是从茎的旁边生长出来的数,分指的是从茎的旁边生长出来的数,分别表示两人得分的个位数别表示两人得分的个位数.你能通过该图说明哪个运动员的发挥更稳定吗?你能通过该图说明哪个运动员的发挥更稳定吗?甲甲 乙乙 8 84 6 3 4 6 3 3 6 83 6 83 8 9 3 8 9 1 10 01 12 23 34 45 52 2 5 55 5 4 41 1 6 1 6 6 1 6 7 97 94 4 9 90 0 乙运动员的得分基本上是对
33、称的,叶的分步是“单峰”的,有 10/13的叶集中在茎2,3,4上,中位数是36。甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分步也是“单峰”的,有 9/11的叶主要集中在茎1,2,3上,中位数是26。从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。画出一组样本数据的茎叶图的步骤:画出一组样本数据的茎叶图的步骤:第一步,将每个数据分为第一步,将每个数据分为“茎茎”(高位)和(高位)和“叶叶”(低位)两部分,茎相同者共用一个茎。(低位)两部分,茎相同者共用一个茎。第二步,茎是中间的一列数,按从小到大的
34、顺序第二步,茎是中间的一列数,按从小到大的顺序从上到下排列;从上到下排列;第三步,将各个数据的叶按大小(大到小或小到第三步,将各个数据的叶按大小(大到小或小到大)次序写在茎右(左)侧同行列出大)次序写在茎右(左)侧同行列出.注意注意:在制作茎叶图时,重复出现的数据要重复记在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是录,不能遗漏,特别是“叶叶”部分;同一数据出现部分;同一数据出现几次,就要在图中体现几次几次,就要在图中体现几次.思考:用茎叶图表示数据的分布情况有哪些优点?思考:用茎叶图表示数据的分布情况有哪些优点?(1 1)所有原始数据都可以从图中得到,没有)所有原始数据都可以从图
35、中得到,没有损失样本信息;损失样本信息;(2 2)数据可以随时记录、添加或修改)数据可以随时记录、添加或修改.思考:对思考:对任意一组样本数据,是否都适合用茎叶图任意一组样本数据,是否都适合用茎叶图表示?为什么?表示?为什么?不适合样本容量很大或茎、叶不分明的样本不适合样本容量很大或茎、叶不分明的样本数据数据.在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长,表示三位以上的数据时不够方便。频数频数茎茎叶叶2107
36、 81111 0 2 2 2 3 6 6 7 7 8 13120 0 1 2 2 3 4 4 6 7 8 84130 2 3 4下表一组数据是某车间下表一组数据是某车间30名工人加工零件的个数名工人加工零件的个数,设计一个设计一个茎叶图表示这组数据茎叶图表示这组数据,并说明这一车间的生产情况并说明这一车间的生产情况.134 112117126 128 124 122 116113107116132 127 128 126 121 120 118108 110133 130 124 116117123 122 120 112112P71 P71 练习练习3 3:茎叶图:茎叶图:2、为了了解各自受
37、欢迎的程度,甲、乙两个、为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了网站分别随机选取了14天,记录下上午天,记录下上午8:0010:00间各自的点击量:间各自的点击量:甲:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?乙两个网站哪个更受欢迎?几种表示频率分布的方法的优点和不足几种表示频率分布的方法的优点和不足1.频率分布表在数量上比较确切,但不频率分布表在
38、数量上比较确切,但不够直观,形象,分析数据分布的总体态够直观,形象,分析数据分布的总体态势不太方便势不太方便2.频率分布直方图能够很容易地表示大量数据,频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,但是从直到分布表中看不清楚的数据模式,但是从直方图本身得不出来原始的数据内容,也就是方图本身得不出来原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数说,把数据表示成直方图后,原有的具体数据信息就被抹掉了。据信息就被抹掉了。3.频率分布折线图的优点是它反映了数据频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。向于总体分布的密度曲线。4.用茎叶图刻画数据有两个优点:一是所有用茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于的信息都可以从图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但记录和表示,能够展示数据的分布情况。但是当样本数据较多或数据位数较多时,茎叶是当样本数据较多或数据位数较多时,茎叶图就不太方便了图就不太方便了