《数学:2.2.2-1《用样本数字特征估计总体数字特征》课件(新人教A版必修3).ppt》由会员分享,可在线阅读,更多相关《数学:2.2.2-1《用样本数字特征估计总体数字特征》课件(新人教A版必修3).ppt(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.2 2.2 用样本估计总体用样本估计总体.2.2.2.2用样本的数字特征估计总体的用样本的数字特征估计总体的数字特征数字特征 第一课时第一课时 问题提出问题提出1.1.对一个未知总体,我们常用样本的频率分对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?率分布的基本方法有哪些?2.2.美国美国NBANBA在在2006200720062007年度赛季中,甲、年度赛季中,甲、乙两名篮球运动员在随机抽取的乙两名篮球运动员在随机抽取的1212场比赛中场比赛中的得分情况如下:的得分情况如下:甲运动员得分:甲运动员得
2、分:1212,1515,2020,2525,3131,3131,36 36,3636,3737,3939,4444,49.49.乙运动员得分:乙运动员得分:8 8,1313,1414,1616,2323,2626,28 28,3838,3939,5151,3131,29.29.如果要求我们根据上面的数据,估如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计特征进行研究,用样本的数
3、字特征估计总体的数字特征总体的数字特征.甲运动员得分:甲运动员得分:1212,1515,2020,2525,3131,3131,36 36,3636,3737,3939,4444,49.49.乙运动员得分:乙运动员得分:8 8,1313,1414,1616,2323,2626,28 28,3838,3939,5151,3131,29.29.知识探究(一):众数、中位数和平均数知识探究(一):众数、中位数和平均数 思考思考1 1:在初中我们学过众数、中位数和在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何信息的数字
4、特征,对一组样本数据如何求众数、中位数和平均数?求众数、中位数和平均数?思考思考2 2:在城市居民月均用水量样本数据在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是哪个小矩形内?由此估计总体的众数是什么?什么?月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考思考3 3:在频率分布直方图中,每个小矩在频率分布直方图中,每个小矩形的面积表示什么?中位
5、数左右两侧的形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?直方图的面积应有什么关系?取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数.思考思考4 4:在城市居民月均用水量样本数据的频在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面率分布直方图中,从左至右各个小矩形的面积分别是积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计总体的中由此估计总体的中位数是什么?位数是什么?月均用水量月均用水量/t
6、频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.50.10.25=0.020.50.10.25=0.02,中位数是,中位数是2.02.2.02.思考思考5 5:平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,在城市居民月均用水量样本数据的频率分,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从布
7、直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别直方图估计总体在各组数据内的平均数分别为多少?为多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O思考思考6 6:根据统计学中数学期望原理,将频率根据统计学中数学期望原理,将频率分布直方图
8、中每个小矩形的面积与小矩形底分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的边中点的横坐标之积相加,就是样本数据的估值平均数估值平均数.由此估计总体的平均数是什么由此估计总体的平均数是什么?0.250.040.250.04+0.750.080.750.08+1.250.151.250.15+1.751.750.220.22+2.250.252.250.25+2.750.142.750.14+3.25 3.25 0.060.06+3.750.043.750.04+4.250.02=2.024.250.02=2.02(t t).平均数是平均数是2.02.2.02.平均数
9、与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?思考思考7 7:从居民月均用水量样本数据可知,该从居民月均用水量样本数据可知,该样本的众数是样本的众数是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.9731.973,这与我们从样本频率分布直方图得出,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?的结论有偏差,你能解释一下原因吗?频率分布直方图损失了一些样本数据,得频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组到的是一个估计值,且所得估值与数据分组有关有关.注注:在只有样本频率分布直方图的情况下,我在只有样本
10、频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征数,并由此估计总体特征.思考思考8 8:一组数据的中位数一般不受少数一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时一个优点,但它对极端值的不敏感有时也会额成为缺点,你能举例说明吗?样也会额成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解说明什么问题?你怎样理解“我们单位我们单位的收入水平比别的单位高的收入水平比别的单位
11、高”这句话的含这句话的含义?义?如:样本数据收集有个别差错不影响中如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位位数;大学毕业生凭工资中位数找单位可能收入较低可能收入较低.平均数大于(或小于)中位数,说明平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的样本数据中存在许多较大(或较小)的极端值极端值.这句话具有模糊性甚至蒙骗性,其中这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数可以是众数、中位数或平均数.知识探究(二):标准差知识探究(二):标准差 样本的众数、中位数和平均数常
12、用来表示样本样本的众数、中位数和平均数常用来表示样本数据的数据的“中心值中心值”,其中众数和中位数容易计算,不,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中受少数几个极端值的影响,但只能表达样本数据中的少量信息的少量信息.平均数代表了数据更多的信息,但受平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的样本中每个数据的影响,越极端的数据对平均数的影响也越大影响也越大.当样本数据质量比较差时,使用众数、当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,
13、难以反映样本数据的实际状情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的况,因此,我们需要一个统计数字刻画样本数据的离散程度离散程度.思考思考1 1:在一次射击选拔赛中,甲、乙在一次射击选拔赛中,甲、乙两名运动员各射击两名运动员各射击1010次,每次命中的环次,每次命中的环数如下:数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分甲、乙两人本次射击的平均成绩分别为多少环?别为多少环?思考思考2
14、2:甲、乙两人射击的平均成绩相等,观甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?水平差异在那里吗?环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)甲的成绩比较分散,极差较大,乙的甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定成绩相对集中,比较稳定.思考思考3 3:对于样本数
15、据对于样本数据x x1 1,x x2 2,x xn n,设想通过各数据到其平均数的平均距离设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个来反映样本数据的分散程度,那么这个平均距离如何计算?平均距离如何计算?思考思考4 4:反映样本数据的分散程度的大小,最反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用常用的统计量是标准差,一般用s s表示表示.假设假设样本数据样本数据x x1 1,x x2 2,x xn n的平均数为,则标准的平均数为,则标准差的计算公式是:差的计算公式是:那么标准差的取值范围是什么?标准差为那么标准差的取值范围是什么?标准差为0 0的样本数据
16、有何特点?的样本数据有何特点?s0s0,标准差为,标准差为0 0的样本数据都相等的样本数据都相等.思考思考5 5:对于一个容量为对于一个容量为2 2的样本:的样本:x x1 1,x x2 2(x(x1 1x x2 2),则,则 ,在数轴上,这两个统计数据有什么几何意义在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度?由此说明标准差的大小对数据的离散程度有何影响?有何影响?标准差越大离散程度越大,数据较分散;标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中标准差越小离散程度越小,数据较集中在平均数周围在平均数周围.知识迁移知识迁移 s s甲甲=2
17、=2,s s乙乙=1.095.=1.095.计算甲、乙两名运动员的射击成绩的计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性标准差,比较其射击水平的稳定性.甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7小结作业小结作业1.1.用样本的数字特征估计总体的数字特征,用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据差等统计数据,估计总体相应的统计数据.2.2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一的作用,代表一组数据的平均水平组数据的平均水平.标准差描述一组数据围绕标准差描述一组数据围绕平均数波动的幅度平均数波动的幅度.在实际应用中,我们常综在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,合样本的多个统计数据,对总体进行估计,为解决问题作出决策为解决问题作出决策.