《用样本频率分布估计总体分布精.ppt》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布精.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用样本频率分布估计总体分布第1页,本讲稿共49页 我们用我们用简单随机抽样、系统抽样、分层抽样简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样本研究的方法收集样本数据后,就可以通过样本研究总体。总体。用样本估计总体的两种情况:用样本估计总体的两种情况:用用样本的频率分布样本的频率分布估计总体分布估计总体分布用用样本的数字特征样本的数字特征(平均数、标准差等)(平均数、标准差等)估计总体的数字特征估计总体的数字特征 第2页,本讲稿共49页复习回顾复习回顾频数:频数:不分组时,数据中某个数据出现的次数不分组时,数据中某个数据出现的次数 分组时,一个组内的数据的个数分组时,一个组内
2、的数据的个数频率:频率:极差:极差:最大数最大数-最小数最小数分组分组频数频数频率频率频率频率/组距组距频率分布表:频率分布表:第3页,本讲稿共49页知识探究(一):频率分布表知识探究(一):频率分布表 某某市政府为了节约生活用水,计划在本市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定市试行居民生活用水定额管理,即确定一个居民月用水量标准一个居民月用水量标准a a,用水量不超过,用水量不超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部分按议的部分按议价收费价收费.问题问题1 1:如果希望大部分居民的日常生活如果希望大部分居民的日常生活 不受影响,那么标准不受
3、影响,那么标准a a定为多少比较合理?定为多少比较合理?问题问题2 2:为了较为合理的确定:为了较为合理的确定标准标准a a,需要做,需要做 哪些工作?哪些工作?第4页,本讲稿共49页通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的月均用水年的月均用水量如下表(单位:量如下表(单位:t t):):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 3.4 2.6 2.2 2.2 1.5 1.2 0.20.2 0.
4、4 0.3 0.4 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.34.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.03.0 2.
5、9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0
6、.6 2.22.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2问题问题3:这些数字告诉了我们什么信息?这些数字告诉了我们什么信息?第5页,本讲稿共49页我们可以看出,样本数据中的最大值我们可以看出,样本数据中的最大值4.34.3和最小值,和最小值,其他数据在其他数据在0.20.24.34.3之间之间分析数据的基本方法:分析数据的基本方法:用图画出来用图画出来 用表格重新排列用表格重新排列第6页,本讲稿共49页1、借助于、借助于图:图:频率分布直方图、频率分布折线图、频率分布直方图、频率分布折线图、茎叶图茎叶图两个目的两个目的从数据中提取信息从数据中提取信息 利用图形
7、传递信息利用图形传递信息2、借助于、借助于表格:表格:频率分布表频率分布表两个目的两个目的 改变数据的排列方式改变数据的排列方式提供解释数据的新方式提供解释数据的新方式第7页,本讲稿共49页第二步:确定组距,第二步:确定组距,组数组数组距组距=每个小组两个端每个小组两个端点的差点的差.组数组数=极差极差组距组距 (取整数)(取整数)探究一探究一 频率分布表频率分布表(4.4.10.5=8.210.5=8.2将将8.28.2取整,组数取整,组数=9=9,组,组距距=0.5=0.5思考思考1:上述上述100个数据的最个数据的最小值和最大值分别是多少?小值和最大值分别是多少?第一步:求极差第一步:求
8、极差思考思考2:分成多少组合分成多少组合适?适?如果将上述如果将上述100100个数据按组距为个数据按组距为0.50.5进行分组,那么这些数据共进行分组,那么这些数据共分为多少组?分为多少组?极差:极差:4.3-0.2=4.1512组组第8页,本讲稿共49页第四步:列频率第四步:列频率 分布表分布表探究一探究一 频率分布表频率分布表思考思考3:各组:各组数据的取值范围数据的取值范围如何设定?如何设定?第三步:确定端点,第三步:确定端点,将数据分组将数据分组 各组均为各组均为左开右闭左开右闭区区间,最后一个闭区间间,最后一个闭区间思考思考4:如何统计各族如何统计各族中的频数、频率?中的频数、频率
9、?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.第9页,本讲稿共49页 分分 组组 频数频数 频率频率 频率频率/组距组距 0 0,0.50.5)4 0.04 0.08 4 0.04 0.08 0.5 0.5,1 1)8 0.08 0.168 0.08 0.16 1 1,1.51.5)15 0.15 0.3015 0.15 0.30 1.5 1.5,2 2)22 0.22 0.4422 0.22 0.44 2 2,2.52.5)25 0.25 0.5025 0.25 0.50 2.5 2.5,3 3)14 0.14 0.2814 0.14
10、 0.28 3 3,3.53.5)6 0.06 0.126 0.06 0.12 3.5 3.5,4 4)4 0.04 0.084 0.04 0.08 4 4,4.5 2 0.02 0.044.5 2 0.02 0.04 合计合计 100 1.00 2100 1.00 2第10页,本讲稿共49页探究(二):画频率分布直方图探究(二):画频率分布直方图 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第一步:第一步:画直角坐标系:画直
11、角坐标系:x轴为数据单位,轴为数据单位,y轴为频率轴为频率/组距组距第二步第二步:在在x轴上均匀标出各组分点,轴上均匀标出各组分点,在在y轴上标出单位长度轴上标出单位长度第三步:第三步:以组距为宽,各组的频率以组距为宽,各组的频率/组距为高,组距为高,分别画出各组对应的长方形分别画出各组对应的长方形第11页,本讲稿共49页 问题问题1 1:频率分布直方图中各小长方形频率分布直方图中各小长方形的宽度和高度在数量上有何特点?的宽度和高度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组
12、距高度:高度:频率频率组距组距2 频率分布直方图频率分布直方图的意义的意义 第12页,本讲稿共49页问题问题2 2:频率分布直方图中各小长方形的面频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少积表示什么?各小长方形的面积之和为多少?各小长方形的面积各小长方形的面积=各小组的各小组的频率频率各小长方形的面积之和各小长方形的面积之和=1 1月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:宽度:组距组距高度:高度:频率频率组距组距第13页,本讲稿共49页3 3 分析例题:分析例题:频率分布直方
13、图非常直观地频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来但原始数据不能在图中表示出来.你能根据你能根据上述频率分布直方图指出居民月均用水量上述频率分布直方图指出居民月均用水量的一些数据特点吗?的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第14页,本讲稿共49页(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且状的
14、,而且是是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值附)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第15页,本讲稿共49页思考:思考:对一组给定的样本数据,频率分布对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居直方图的外观形状与哪些因素有关?在居民月均用水量样本
15、中,你能以民月均用水量样本中,你能以1 1为组距画频为组距画频率分布直方图吗?率分布直方图吗?与分组数(或组距)及坐标系的单位长度与分组数(或组距)及坐标系的单位长度有关有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3 4 51 2 3 4 5 O第16页,本讲稿共49页1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、将数据分组将数据分组(8.2取整取整,分为分为9组组)画频
16、率分布直方图的步骤画频率分布直方图的步骤4、列出、列出频率分布表频率分布表.(填写频率填写频率/组距一栏组距一栏)5、画出、画出频率分布直方图频率分布直方图。组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。小结小结第17页,本讲稿共49页理论迁移理论迁移 例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4
17、343,5454,4343,3434,4444,40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在323
18、25252岁的知识分子所占的比例约是多岁的知识分子所占的比例约是多少少.第18页,本讲稿共49页(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 频率频率/组距组距 27 27,3232)3 0.06 0.0123 0.06 0.012 32 32,3737)3 0.06 0.0123 0.06 0.012 37 37,4242)9 0.18 0.0369 0.18 0.036 42 42,4747)16 0.32 0.06416 0.32 0.064 47 47,5252)7 0.14 0.0287 0.
19、14 0.028 52 52,5757)5 0.10 0.0205 0.10 0.020 57 57,6262)4 0.08 0.0164 0.08 0.016 62 62,6767)3 0.06 0.0123 0.06 0.012 合合 计计 50 1.00 0.20050 1.00 0.200样本频率分布表:样本频率分布表:第19页,本讲稿共49页(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 5
20、7 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.第20页,本讲稿共49页9090100100110110120120130130140140150150次数次数o o0.0040.0040.0080.0080.0120.0120.0160.0160.0200.0200.0240.0240.0280.028频率频率/组距组距0.0320.0320.0360.036例例2 2:为了了解高一学生的体能情为了了解高一学生的体能
21、情况况,某校抽取部分学生进行一分钟跳绳某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出次数次测试,将所得数据整理后,画出频率分布直方图频率分布直方图(如图如图),图中从左到右,图中从左到右各小长方形面积之比为各小长方形面积之比为2 2:4 4:1717:1515:9 9:3 3,第二小组频数为,第二小组频数为12.12.第二小组的频率是多少?样本容量是多少第二小组的频率是多少?样本容量是多少?若次数在若次数在110110以上(含以上(含110110次)为达标,试次)为达标,试估计该学校全体高一学生的达标率是多少估计该学校全体高一学生的达标率是多少?第21页,本讲稿共49页练习巩
22、固练习巩固 1 有一个容量为有一个容量为50的样本数据的分组的样本数据的分组及各组的频数如下:及各组的频数如下:12.5,15.5)3 24.5,27.5)1015.5,18.5)8 27.5,30.5)518.5,21.5)9 30.5,33.5)421.5,24.5)11列出样本的频率分布表和画出频率列出样本的频率分布表和画出频率分布直方图;分布直方图;根据样本的频率分布估计,小于根据样本的频率分布估计,小于30.5的数据约占多少?的数据约占多少?第22页,本讲稿共49页解解:组距为组距为3 3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)81
23、8.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第23页,本讲稿共49页频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.515.50.0600.070第24页,本讲稿共49页课堂练习课堂练习2(2006年全国卷年全国卷II)一个社会调查机构就某地居民一个社会调查机构就某地居民的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并
24、根据所得数据画了样本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出人中再用分层抽样方法抽出100人作进一步调查,人作进一步调查,则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040.00051000 1500 2000 2500 3000 3500 4000月收入月收入(元元)频率频率/组距组距第25页,本讲稿共49页课堂练习课堂练习2一个社会调查机构就某地居民的月收入调查了
25、一个社会调查机构就某地居民的月收入调查了10 000人,并人,并根据所得数据画了样本的频率分布直方图根据所得数据画了样本的频率分布直方图(如下图如下图).为了分析居为了分析居民的收入与年龄、学历、职业等方面的关系,要从这民的收入与年龄、学历、职业等方面的关系,要从这10 000人人中再用分层抽样方法抽出中再用分层抽样方法抽出100人作进一步调查,则在人作进一步调查,则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040.0005月收入月收入(元元)频率频率/组距组距251000 1500 2000 2500 3000 3500 40
26、00第26页,本讲稿共49页课堂练习课堂练习3某班某班50名学生在一次百米测试中,成绩全部介于名学生在一次百米测试中,成绩全部介于13秒与秒与19秒之间,将测试结果按如下方式分成六组:第秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于一组,成绩大于等于13秒且小于秒且小于14秒;第二组,成绩秒;第二组,成绩大于等于大于等于14秒且小于秒且小于15秒;秒;第六组,成绩大于等于第六组,成绩大于等于18秒且小秒且小于等于于等于19秒右图是按上述分组秒右图是按上述分组方法得到的频率分布直方图设方法得到的频率分布直方图设成绩小于成绩小于17秒的学生人数占全班秒的学生人数占全班总人数的百分比为总
27、人数的百分比为x,成绩大于等,成绩大于等于于15秒且小于秒且小于17秒的学生人数为秒的学生人数为y,则从频率分布直方图中可分析出则从频率分布直方图中可分析出x和和y分别为分别为()A0.9,35 B0.9,45C0.1,35 D0.1,45O13 141516171819秒秒频率频率/组距组距0.360.340.180.060.040.02第27页,本讲稿共49页课堂练习课堂练习3某班某班50名学生在一次百米测试中,成绩全部介于名学生在一次百米测试中,成绩全部介于13秒与秒与19秒之间,将测试结果按如下方式分成六组:第秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于一组,成绩大于等于
28、13秒且小于秒且小于14秒;第二组,成绩秒;第二组,成绩大于等于大于等于14秒且小于秒且小于15秒;秒;第六组,成绩大于等于第六组,成绩大于等于18秒且小秒且小于等于于等于19秒右图是按上述分组秒右图是按上述分组方法得到的频率分布直方图设方法得到的频率分布直方图设成绩小于成绩小于17秒的学生人数占全班秒的学生人数占全班总人数的百分比为总人数的百分比为x,成绩大于等,成绩大于等于于15秒且小于秒且小于17秒的学生人数为秒的学生人数为y,则从频率分布直方图中可分析出则从频率分布直方图中可分析出x和和y分别为分别为()A0.9,35 B0.9,45C0.1,35 D0.1,45O13 1415161
29、71819秒秒频率频率/组距组距0.360.340.180.060.040.02A第28页,本讲稿共49页课堂练习课堂练习4为了了解某地区高三学生的身体发育情况,抽查为了了解某地区高三学生的身体发育情况,抽查了该地区了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg),得得到频率分布直方图如下:到频率分布直方图如下:根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是()A.20 B.30 C.40 D.500.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 7
30、4.5 第29页,本讲稿共49页课堂练习课堂练习4为了了解某地区高三学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg),得到频率分布直方图得到频率分布直方图如下:如下:C0.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是()A.20 B.30 C.40 D.50第30页,本讲稿共49页课堂练习课堂练习身高身高/cm人数人数/
31、人人145 155 165175 18550150250350450550195输入输入A1,A2,Ana0 i4输出输出s是是否否开始开始结束结束第31页,本讲稿共49页课堂练习课堂练习B身高身高/cm人数人数/人人145 155 165175 18550150250350450550195输入输入A1,A2,Ana0 i4输出输出s是是否否开始开始结束结束第32页,本讲稿共49页小结小结:画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)第
32、三步第三步:将数据分组将数据分组 (给出组的界限给出组的界限)第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率(包括分组、频数、频率、频率、频率/组组距距)第五步第五步:画频率分布直方图画频率分布直方图(在频率分布表的基础上绘制,(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率横坐标为样本数据尺寸,纵坐标为频率/组距组距.)组距组距:指每个小组的两个端点的距离,组距指每个小组的两个端点的距离,组距组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。第33页,本讲稿共49页注意注意(2)纵坐标为纵坐标
33、为:第34页,本讲稿共49页第二节第二节第35页,本讲稿共49页3 3 分析例题:分析例题:频率分布直方图非常直观地频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来但原始数据不能在图中表示出来.你能根据你能根据上述频率分布直方图指出居民月均用水量上述频率分布直方图指出居民月均用水量的一些数据特点吗?的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第
34、36页,本讲稿共49页(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而且是状的,而且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第37页,本讲稿共49页频率分布直方图如下频率分布直方图如下:月均用水量月均用水
35、量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5在频率分布直方图中取各小长方形上端的中点用折线依次连接各中点得到频率分布折线图第38页,本讲稿共49页用样本频分布估计总体分布用样本频分布估计总体分布 上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假假如如增增至至10000呢?呢?第39页,本讲稿共49页总体密度曲线总体密度曲线频率频率组距组距月均用水月均用水量量/tab (图中阴影部分的面积,表示总体在某个(图中阴影部分的面积,表示总体在某个区间区间(
36、a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线率分布折线图就会无限接近一条光滑曲线总体密度曲总体密度曲线线总体密度曲线总体密度曲线第40页,本讲稿共49页 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确地反映了总体在各个范围内取值百分比。确地反映了总体在
37、各个范围内取值百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精确地反映了总体的分布规律。是研究总体分布的工具精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线总体密度曲线第41页,本讲稿共49页茎茎 叶叶 图图 某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:原始记录如下:(1)甲运动员得分甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39第42页,
38、本讲稿共49页 甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 (1)甲甲:8,13,16,14,23,26,28,38,33,39,51。(2)乙乙:12,15,24,25,31,36,31,36,37,39,44,49,50,第43页,本讲稿共49页茎叶图茎叶图 当样本数据当样本数据较少较少时,用茎叶图时,用茎叶图表示数据的效果较好,它不但可以表示数据的效果较好,它不但可以保留保留所有的信息,而且所有的信息,而且 可以随时可以随时记记录录,给数据的记录和表示都方便。,给数据的记录和表示都方便。第44页,本讲
39、稿共49页 小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示)易表示大量数据大量数据 丢失一些丢失一些直方图直方图 2)直观直观地表明分布地地表明分布地 情况情况 信息信息 1)无信息损失无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据第45页,本讲稿共49页课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布表(2)频率分布图直方图)频率分布图直方图(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图第46页,本讲稿共49页1.频率分布表频率分布表 表示样本的
40、分布的方法:表示样本的分布的方法:分组分组频数频数频率频率频率频率/组距组距频率频率/组距组距产品尺寸产品尺寸(mm)2.频率分布直方图频率分布直方图样本频率分布中,当样本频率分布中,当样本容量无限增大,样本容量无限增大,组距无限缩小组距无限缩小样本频率分布直方图样本频率分布直方图接近于接近于一条光滑曲线一条光滑曲线总体密度总体密度曲线曲线,反映了总体分布。,反映了总体分布。3.频率分布折线图频率分布折线图第47页,本讲稿共49页频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容横轴:两者表示内容相同相同思考:思
41、考:频率分布条形图和频率分布直方图是两个相频率分布条形图和频率分布直方图是两个相同的概念吗?同的概念吗?有什么区别?有什么区别?纵轴:两者表示的内容纵轴:两者表示的内容不相同不相同频率分布条形图频率分布条形图的纵轴(长方形的高)表示频率的纵轴(长方形的高)表示频率 频率分布直方图频率分布直方图的纵轴(长方形的高)表示的纵轴(长方形的高)表示频率与组距的比值,频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。其相应组距上的频率等于该组距上长方形的面积。第48页,本讲稿共49页 1.总体分布指的是总体取值的频率分布规律,由总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。分布去估计总体的分布。2.总体的分布分两种情况:当总体中的个体取值很少总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方述总体的分布,方法是用频率分布表或频率分布直方图。图。小结小结第49页,本讲稿共49页