《用样本估计总体二.ppt》由会员分享,可在线阅读,更多相关《用样本估计总体二.ppt(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、用样本的数字特征用样本的数字特征估计总体的数字特征估计总体的数字特征复习运用复习运用平均数平均数中位数中位数众数众数探究探究1 1:众数、中位数和平均数:众数、中位数和平均数 思考思考1 1:如何从频率分布直方图中估计众数、中位数、如何从频率分布直方图中估计众数、中位数、平均数?平均数?月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.50.5 1 1.5 2 2.5 3 3.5 4 4.5 O 1 1、众数在样本数据的频率分布直方图中,、众数在样本数据的频率分布直方图中,一般认为是最高矩形的
2、中点的横坐标一般认为是最高矩形的中点的横坐标。取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数.月月均均用用水水量量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O2 2、在样本中,有、在样本中,有5050的个体小于或等于中位数,也有的个体小于或等于中位数,也有5050的个体大于或等于中位数,因此,在频率分布直方图中,的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,中位
3、数左边和右边的直方图的面积应该相等,由此可以估由此可以估计中位数的值。计中位数的值。中位数:直方图面积平分线与横轴交点的中位数:直方图面积平分线与横轴交点的横坐标横坐标思考:思考:在城市居民月均用水量样本数据的频率分布直方图在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是中,从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计总体由此估计总体的中位数是什么?的中位数是什么?0.5-0.04-0.08-0.15-0.5
4、-0.04-0.08-0.15-0.22=0.010.22=0.01,设小矩形的宽为,设小矩形的宽为,则:,则:0.50.50.010.01,得,得0.020.02,所以中位数是,所以中位数是+0.02+0.022.02.2.02.3.3.平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,是直方图的平衡是直方图的平衡点点,在下面的频率分布直方图中,从直方图估计总体在各,在下面的频率分布直方图中,从直方图估计总体在各组数据内的平均数分别为多少?组数据内的平均数分别为多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.2
5、53.25,3.753.75,4.25.4.25.月均月均用用 水水 量量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O样本数据的估计样本数据的估计平均数就是将频率分布直方图中平均数就是将频率分布直方图中每个小矩每个小矩形的面积与形的面积与小矩形底边中点的横坐标小矩形底边中点的横坐标之积相加之积相加.由此估计由此估计总体的平均数就是总体的平均数就是0.250.04+0.750.08+1.250.15+1.750.22+2.250.250.04+
6、0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.250.06+3.750.04+4.250.02=2.0.25+2.750.14+3.250.06+3.750.04+4.250.02=2.0202(t t).1 1、众数体现了样本数据的最大集中点,但它对其、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。它数据信息的忽视使得无法客观地反映总体特征。二、三种数字特征的优缺点:二、三种数字特征的优缺点:2 2、中位数是样本数据所占频率的等分线,它不受、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在
7、某些情况下是优点,但少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。它对极端值的不敏感有时也会成为缺点。3 3、由于平均数与每一个样本的数据有关,所以、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。是众数、中位数都不具有的性质。与众数、中位数比较起来,平均数可以反映出更与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。极
8、端值的影响较大,使平均数在估计时可靠性降低。探究探究2 2:标准差标准差 标准差标准差是样本数据到平均数的一种平均距离。是样本数据到平均数的一种平均距离。它用来描述样本数据的离散程度。在实际应用中,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差常被理解为稳定性。1、平均距离、平均距离 一组数据中,各数据与它们一组数据中,各数据与它们的平均数的差的的平均数的差的平方的平均数。平方的平均数。方差:方差:方差公式:方差公式:一般步骤:一般步骤:求平均求平均求平均求平均再求差再求差再求差再求差然后平方然后平方然后平方然后平方最后再平均最后再平均最后再平均最后再平均样本标准差
9、样本标准差2 2、样本方差、标准差、样本方差、标准差3 3标准差标准差(方差方差)用来衡量用来衡量 ,标准,标准差差(方差方差)越大,数据的离散程度越大,数据的离散程度越大越大;标准差;标准差(方差方差)越越小,数据的离散程度小,数据的离散程度越小。越小。样本数据的离散程度样本数据的离散程度方差越大方差越大,波动越大,越不稳定。波动越大,越不稳定。例例1:为了考察甲、乙两种小麦的长势为了考察甲、乙两种小麦的长势,分别分别从中抽出从中抽出10株苗,测得苗高如下株苗,测得苗高如下(单位单位:cm):甲甲:12 13 14 15 10 16 13 11 15 11乙乙:11 16 17 14 13
10、19 6 8 10 16问哪种小麦长得比较整齐问哪种小麦长得比较整齐?自自 我我 检检 测测2.2.甲、乙两名战士在射击训练中,打靶的次数甲、乙两名战士在射击训练中,打靶的次数相同,且射击成绩的平均数也相同,如果甲的相同,且射击成绩的平均数也相同,如果甲的射击成绩比较稳定,那么方差的大小关系是射击成绩比较稳定,那么方差的大小关系是:S S2 2甲甲_S S2 2乙乙。c c3.(宁夏理宁夏理11文文12)甲、乙、丙三名射箭运动员甲、乙、丙三名射箭运动员在某次测试中各射箭在某次测试中各射箭20次,三人的测试成绩如次,三人的测试成绩如下表下表:甲的成绩甲的成绩环数环数78910频数频数5555乙的
11、成绩乙的成绩环数环数78910频数频数6446丙的成绩丙的成绩环数环数78910频数频数4664s1,s2,s3分别表示甲、分别表示甲、乙、丙三名运动员这次乙、丙三名运动员这次测试成绩的标准差,则测试成绩的标准差,则有有()A.s3s1s2B.s2s1s3C.s1s2s3D.s2s3s1B4 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理管理人员管理人员 高级技工高级技工工人工人学徒学徒合计合计周工资周工资2200250220200100人数人数16510123合计合计22001500110020001006900(1)指出这个问题中周工资的众数、中)指出这个问题中周工资
12、的众数、中位数、平均数位数、平均数(2)这个问题中,工资的平均数能客观)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?地反映该厂的工资水平吗?为什么?5.”八八.一一”前夕前夕,某中学举行国防知识竞赛某中学举行国防知识竞赛:满分为满分为100分分,80分以上为优秀分以上为优秀,现将高一的两个班参赛学生的成绩现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、第二、第三、第四、第五小已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是组的频率分别是0.3,0.4,0.15,0.1,0.05 求:求:(1)成绩的众数、)成绩的众数、中位数;中位数;(2)平均成绩)平均成绩50 60 70809010000.0050.0100.0150.030.04(1)65,65(2)67小结:小结:1.1.众数、中位数、平均数的概念众数、中位数、平均数的概念2.2.众数、中位数、平均数与频率分布直方众数、中位数、平均数与频率分布直方图的关系图的关系3.3.三种数字特征的优缺点三种数字特征的优缺点4 4、样本的方差和标准差、样本的方差和标准差