《《用样本估计总体》ppt课件.ppt》由会员分享,可在线阅读,更多相关《《用样本估计总体》ppt课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、23.4 23.4 用样本估计总体用样本估计总体1.1.计算样本平均数和标准差使学生认识到只有样本容量计算样本平均数和标准差使学生认识到只有样本容量足够大,才能比较准确地反映总体的特性,这样的样本足够大,才能比较准确地反映总体的特性,这样的样本才可靠,体会只有可靠的样本,才能用样本去估计总体才可靠,体会只有可靠的样本,才能用样本去估计总体. .2.2.通过实例,使学生体会用样本估计总体的思想,能够通过实例,使学生体会用样本估计总体的思想,能够根据统计结果作出合理的判断和推测,能与同学进行交根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点流,用清晰的语言表达自己的观
2、点. . 我们知道在选取样本时应注意的问题,其一是所选取我们知道在选取样本时应注意的问题,其一是所选取的样本必须具有代表性,其二是所选取的样本的容量应该的样本必须具有代表性,其二是所选取的样本的容量应该足够大,这样的样本才能反映总体的特性,所选取的样本足够大,这样的样本才能反映总体的特性,所选取的样本才比较可靠才比较可靠. . 随机抽样调查是了解总体情况的一种重要的数学方随机抽样调查是了解总体情况的一种重要的数学方法,抽样是它的一个关键,法,抽样是它的一个关键,上节课上节课介绍了简单的随机抽介绍了简单的随机抽样方法,即用抽签的方法来选取样本,这使总体的每个样方法,即用抽签的方法来选取样本,这使
3、总体的每个个体都有相等的机会被选入样本个体都有相等的机会被选入样本判断下面这些抽样调查选取样本的方法是否合适,若不合适,判断下面这些抽样调查选取样本的方法是否合适,若不合适,请说明理由请说明理由(1)(1)为调查江苏省的环境污染情况,调查了长江以南的南京市、为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况常州市、苏州市、镇江市、无锡市的环境污染情况(2)(2)从从100100名学生中,随机抽取名学生中,随机抽取2 2名学生,测量他们的身高来估算名学生,测量他们的身高来估算这这100100名学生的平均身高名学生的平均身高(3)(3)从一批灯泡中随机
4、抽取从一批灯泡中随机抽取5050个进行试验,估算这批灯泡的使用个进行试验,估算这批灯泡的使用寿命寿命(4)(4)为了解观众对中央电视台第一套节目的收视率,对所有上因为了解观众对中央电视台第一套节目的收视率,对所有上因特网的家庭进行在线调查特网的家庭进行在线调查解解: :(1)(1)不合适因为调查对象在总体中必须有代表性,现不合适因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表了长江以南在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境污染情况地区,并不能代表整个江苏省的环境污染情况(2)(2)不合适因为抽样调查时所抽取的样本要足够大,
5、现不合适因为抽样调查时所抽取的样本要足够大,现在只抽取了在只抽取了2 2名学生的身高,不能用来估算名学生的身高,不能用来估算100100名学生的平名学生的平均身高均身高(3)(3)合适合适(4)(4)不合适不合适. .虽然调查的家庭很多,但仅仅增加调查的数量,虽然调查的家庭很多,但仅仅增加调查的数量,不一定能够提高调查质量,本题中所调查的仅代表上因特不一定能够提高调查质量,本题中所调查的仅代表上因特网的家庭,不能代表全部的家庭,因此这样的抽样调查不网的家庭,不能代表全部的家庭,因此这样的抽样调查不具有普遍代表性具有普遍代表性从从300300名学生的考试成绩中随机抽取几名学生的成绩,考名学生的考
6、试成绩中随机抽取几名学生的成绩,考察一下抽样调查的结果是否可靠,老师选取的一个样本是:察一下抽样调查的结果是否可靠,老师选取的一个样本是:随机数随机数( (学号)学号)1111112542541671679494276276成绩成绩80808686666691916767它的频数分布直方图、平均成绩和标准差分别如下:它的频数分布直方图、平均成绩和标准差分别如下:另外,同学们也分别选取了一些样本,它们同样也包含另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:五个个体,如下表:随机数随机数(学号)(学号)1321322452455 598988989成绩成绩78787373767
7、669697575同样,也可以作出这两个样本的频数分布直方图、计算同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成绩和标准差,如图所示:它们的平均成绩和标准差,如图所示: 随机数随机数(学号)(学号)909016716786862752755454成绩成绩72728686838382828282样本平均成绩为样本平均成绩为8181分,分,标准差为标准差为4.734.73分分样本平均成绩为样本平均成绩为74.274.2分,分,标准差为标准差为3.063.06分分从以上三张图比较来看,它们之间存在明显的差异,平均从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数
8、与标准差也相差甚远,显然这数和标准差与总体的平均数与标准差也相差甚远,显然这样选择的样本不能反映总体的特性,是不可靠的样选择的样本不能反映总体的特性,是不可靠的. .【规律方法规律方法】当样本中个体太少时,样本的平均数、标当样本中个体太少时,样本的平均数、标准差往往差距较大,如果选取适当的样本的个体数,各准差往往差距较大,如果选取适当的样本的个体数,各个样本的平均数、标准差与总体的平均数、标准差相当个样本的平均数、标准差与总体的平均数、标准差相当接近接近. . 对于简单随机样本,可以用样本的百分比去估计总对于简单随机样本,可以用样本的百分比去估计总体的百分比(收视率、次品率、合格率等)体的百分
9、比(收视率、次品率、合格率等). .也可以用也可以用样本的平均数去估计总体的平均数;用样本的方差去估样本的平均数去估计总体的平均数;用样本的方差去估计总体的方差计总体的方差. .北京在这北京在这3030天的空气污染指数及质量级别,如下表所示:天的空气污染指数及质量级别,如下表所示:体会用样本估计总体的合理性体会用样本估计总体的合理性经比较可以发现,经比较可以发现,虽然从样本获得的虽然从样本获得的数据与总体的不完数据与总体的不完全一致,但这样的全一致,但这样的误差还是可以接受误差还是可以接受的,是一个较好的的,是一个较好的估计估计. . 随着样本容量(样本中包含的个体的个数)的增加,随着样本容量
10、(样本中包含的个体的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学由样本得出的平均数往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的家已经证明随机抽样方法是科学而可靠的. . 对于估计总对于估计总体特性这类问题,数学上的一般做法是给出具有一定可体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一个估计值的范围靠程度的一个估计值的范围. .加权平均数的求法加权平均数的求法问题问题1 1:在计算:在计算2020个男同学平均身高时,小华先将所有数个男同学平均身高时,小华先将所有数据按由小到大的顺序排列,如下表所示:据按由小到大的顺序排列,如下表所示:然后,他这
11、样计算这然后,他这样计算这2020个学生的平均身高:个学生的平均身高:小华这样计算平均数可以吗?为什么?小华这样计算平均数可以吗?为什么?47 .1608 .1603 .1622 .161问题问题2 2:假设你们年级共有四个班级,各班的男同学人数:假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示和平均身高如表所示. .小强这样计算全年级男同学的平均身高:小强这样计算全年级男同学的平均身高:小强这样计算平均数可以吗?为什么?小强这样计算平均数可以吗?为什么?为了估计一批鸡蛋中每个鸡蛋的平均质量为了估计一批鸡蛋中每个鸡蛋的平均质量p,小红专,小红专挑个儿大的鸡蛋挑个儿大的鸡蛋30个,称
12、得总质量为个,称得总质量为1.8kg. .小明随意小明随意拿出拿出40个鸡蛋,称得总质量为个鸡蛋,称得总质量为2.2kg. .(1)分别计算小红、小明选出的鸡蛋的平均质量)分别计算小红、小明选出的鸡蛋的平均质量. .(2)用样本平均数估计)用样本平均数估计p,小红和小明谁的结果,小红和小明谁的结果更客观些?更客观些?121.8 100060g302.2 100055g40 xx 小明的结果更客观些,估计小明的结果更客观些,估计p为为55. .1.1.为了检查一批手榴弹的杀伤半径,抽取了其中为了检查一批手榴弹的杀伤半径,抽取了其中2020颗做试颗做试验,得到这验,得到这2020颗手榴弹的杀伤半径
13、,并列表如下:颗手榴弹的杀伤半径,并列表如下:(1)(1)在这个问题中,总体、个体、样本和样本容量各是什在这个问题中,总体、个体、样本和样本容量各是什么?么?(2)(2)求出这求出这2020颗手榴弹的杀伤半径的众数、中位数和平均颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径数,并估计这批手榴弹的平均杀伤半径解解: :(1)(1)总体是要检查的这批手榴弹的杀伤半径的全体;个总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的体是每一颗手榴弹的杀伤半径;样本是所抽取的2020颗手榴颗手榴弹的杀伤半径;样本容量是弹的杀伤半径;样本容量是20
14、20(2)(2)在在2020个数据中,个数据中,1010出现了出现了6 6次,次数最多,所以众数是次,次数最多,所以众数是10 10 米米2020个数据从小到大排列,第个数据从小到大排列,第1010个和第个和第1111个数据是最中间的个数据是最中间的两个数,分别为两个数,分别为9 9 米和米和1010 米,所以中位数是米,所以中位数是9.5 9.5 米米. .样本样本平均数是平均数是9.49.4 米米. .2.2.为估计一次性木质筷子的用量,为估计一次性木质筷子的用量,20102010年从某县共年从某县共600600家家高、中、低档饭店抽取高、中、低档饭店抽取1010家作样本,这些饭店每天消耗
15、的家作样本,这些饭店每天消耗的一次性筷子盒数分别为:一次性筷子盒数分别为:0.60.6、3.73.7、2.22.2、1.51.5、2.82.8、1.71.7、1.21.2、2.12.1、3.23.2、1.01.0(1)(1)通过对样本的计算,估计该县通过对样本的计算,估计该县20102010年消耗了多少盒一年消耗了多少盒一次性筷子(每年按次性筷子(每年按350350个营业日计算);个营业日计算);(2)2012(2)2012年又对该县一次性木质筷子的用量以同样的方式年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是作了抽样调查,调查的结果是1010个样本饭店,每个饭店平个样本
16、饭店,每个饭店平均每天使用一次性筷子均每天使用一次性筷子2.422.42盒求该县盒求该县20112011年、年、20122012年这年这两年一次性木质筷子用量平均每年增长的百分率(两年一次性木质筷子用量平均每年增长的百分率(20122012年年该县饭店数、全年营业天数均与该县饭店数、全年营业天数均与20102010年相同);年相同);(3)(3)在在(2)(2)的条件下,若生产一套学生桌椅需木材的条件下,若生产一套学生桌椅需木材0.07m0.07m3 3,求该县求该县20122012年使用一次性筷子的木材可以生产多少套学生年使用一次性筷子的木材可以生产多少套学生桌椅计算中需用的有关数据为:每盒
17、筷子桌椅计算中需用的有关数据为:每盒筷子100100双,每双双,每双筷子的质量为筷子的质量为5g5g,所用木材的密度为,所用木材的密度为0.50.510103 3kg/mkg/m3 3;(4)(4)假如让你统计你所在省一年使用一次性筷子所消耗的假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出木材量,如何利用统计知识去做,简要地用文字表述出来来解解: :(1)所以,该县所以,该县20102010年消耗一次性筷子为年消耗一次性筷子为2 2600600350= 350= 420 000420 000(盒)(盒)(2)(2)设平均每年增长的百分率为设平均每
18、年增长的百分率为x x,则,则2(1+x)2(1+x)2 2=2.42=2.42,解得解得x x1 1=0.1=10%=0.1=10%,x x2 2= =2.12.1(不合题意,舍去)(不合题意,舍去)所以,平均每年增长的百分率为所以,平均每年增长的百分率为10%10%(3)(3)可以生产学生桌椅套数为可以生产学生桌椅套数为 (套)(套)1x=(0.6+3.7+2.2+1.5+2.8+1.7+1.2+2.1+3.2+1.0)=2.01030.005 2.42 100 600 350=72600.5 100.07(4)(4)先抽取若干个县(或市、州)作样本,再分别从这些先抽取若干个县(或市、州)
19、作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量子的用量1.1.(南通(南通中考)某纺织厂从中考)某纺织厂从1010万件同类产品中随机抽万件同类产品中随机抽取了取了100100件进行质检,发现其中有件进行质检,发现其中有5 5件不合格,那么估计件不合格,那么估计该厂这该厂这1010万件产品中合格品约为(万件产品中合格品约为( )A A9.59.5万件万件 B B9 9万件万件C C95009500件件 D D50005000件件答案答案: :A A2.2.(凉山(凉山中考)中考)20102010年因干旱影响,凉山州
20、政府鼓年因干旱影响,凉山州政府鼓励居民节约用水,为了解居民用水情况,在某小区随机抽励居民节约用水,为了解居民用水情况,在某小区随机抽查了查了2020户家庭的月用水量,结果如下表:户家庭的月用水量,结果如下表:则关于这则关于这2020户家庭的月用水量,下列说法错误的是(户家庭的月用水量,下列说法错误的是( )A A中位数是中位数是6 6吨吨B B平均数是平均数是5.85.8吨吨C C众数是众数是6 6吨吨D D极差是极差是4 4吨吨答案答案: :D D 月用水量(吨月用水量(吨)4 45 56 68 89 9户数户数4 45 57 73 31 13.3.(嘉兴(嘉兴中考)李大伯有一片果林,共有中
21、考)李大伯有一片果林,共有8080棵果树某棵果树某日,李大伯开始采摘今年第一批成熟的果子,他随机选取日,李大伯开始采摘今年第一批成熟的果子,他随机选取2 2棵果树共摘得棵果树共摘得1010个果子,质量分别为(单位:):个果子,质量分别为(单位:):0.280.28,0.260.26,0.240.24,0.230.23,0.250.25,0.240.24,0.260.26,0.260.26,0.250.25,0.230.23以此估算,李大伯收获的这批果子的单个质以此估算,李大伯收获的这批果子的单个质量和总质量分别约为()量和总质量分别约为()A.0.25A.0.25,200200 B.2.5 B
22、.2.5,100100C.0.25C.0.25,100100 D.2.5 D.2.5,200200答案答案: :C C1.1.一般来说,用样本估计总体时,样本容量越大,样本对一般来说,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确总体的估计也就越精确. .相应地,搜集、整理、计算数据相应地,搜集、整理、计算数据的工作量也就越大的工作量也就越大. .因此,在实际工作中,样本容量既要因此,在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的可能性和所付出的考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小代价的大小. .2.2.随机抽样是经过数学证明了的可靠的方法,它对于估计随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助的总体特征是很有帮助的. .