《2015高考数学(人教A理)一轮讲义:11.2用样本估计总体(共13页).doc》由会员分享,可在线阅读,更多相关《2015高考数学(人教A理)一轮讲义:11.2用样本估计总体(共13页).doc(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上11.2用样本估计总体1频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比(4)当样本数据较少时,用茎叶图表示数据的效果较好,它
2、不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便2用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数:样本数据的算术平均数,即(x1x2xn)在频率分布直方图中,中位数左边和右边的直方图的面积应该相等(2)样本方差、标准差标准差s ,其中xn是样本数据的第n项,n是样本容量,是平均数标准差是反映总体波动大小的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方
3、差很接近总体方差1判断下面结论是否正确(请在括号中打“”或“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()来源:中教网(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()2某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2_.答案3.2解析7,s2(107)2(67)2(87)2(57)2(67)23.2.3一个容量为20的样本,
4、数据的分组及各组的频数如下:10,20),2;20,30),3;30,40),x;40,50),5;50,60),4;60,70),2;则x_;根据样本的频率分布估计,数据落在10,50)的概率约为_答案40.7解析x20(23542)4,P0.7或P10.7.4(2012湖南) 如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_(注:方差s2(x1)2(x2)2(xn)2,其中为x1,x2,xn的平均数)答案6.8解析依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为11.由方差公式得s2(811)2(911)2(10
5、11)2(1311)2(1511)2(941416)6.8.5某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_答案600来源:z。zs。解析由直方图易得数学考试中成绩小于60分的频率为(0.0020.0060.012)100.2,所以所求分数小于60分的学生数为3 0000.2600.题型一频率分布直方图的绘制与应用例1某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段40,5
6、0),50,60),90,100后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分思维启迪利用各小长方形的面积和等于1求分数在70,80)内的频率,再补齐频率分布直方图解(1)设分数在70,80)内的频率为x,根据频率分布直方图,有(0.0100.01520.0250.005)10x1,可得x0.3,所以频率分布直方图如图所示(2)平均分:450.1550.15650.15750.3850.25950.0571(分)思维升华频率分布直方图
7、直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法(2013陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图根据标准,产品长度在区间20,25)上的为一等品,在区间15,20)和区间25,30) 上的为二等品,在区间10,15)和30,35)上的为三等品用频率估计概率,现从该批产品中随机抽取一件,则其为二等品的概率为()A0.09 B0.20 C0.25 D0.45答案D解析设区间25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.
8、020.040.060.03x)51,解得x0.05.产品为二等品的概率为0.0450.0550.45.题型二茎叶图的应用例2如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字09中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有()来源:中+教+网z+z+s+tepAa1a2Ba2a1Ca1a2Da1,a2的大小与m的值有关思维启迪去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论答案B解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是
9、25,故a2a1.故选B.思维升华由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等(2013山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示: 则7个剩余分数的方差为()A. B. C36 D.答案B解析由题意知91,解得x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2(16910190
10、).题型三用样本的数字特征估计总体的数字特征例3甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价来源:中国教育出版网思维启迪(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价解(1)由题图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分甲13,乙13,s(1013)2(1313)2(1213)2(1413)2(1613)24,s(1313)2(1413)2(1213)2(
11、1213)2(1413)20.8.(2)由ss可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小(1)(2012山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A众数 B平均数 C中位数 D标准差(2)甲、乙两名射击运动
12、员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10899来源:9乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是_答案(1)D(2)甲解析(1)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变(2)甲乙9环,s(109)2(89)2(99)2(99)2(99)2,s(109)2(109)2(79)2(99)2(99)2s,故甲更稳定,故填甲高考中频率分布直方图的应用典例:(5分)为了研究大学生就业后的收入问题,一个研究机构调查了在2009年已经就业且工作满两年的10 000人,并根据所得数据画了样本的频率
13、分布直方图(如图所示)为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方法抽出200人作进一步调查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,则应在低收入者和高收入者中分别抽取的人数是()来源:中_国教_育出_版网A1 000,2 000 B40,80C20,40 D10,20思维启迪根据频率分布直方图的意义,分别计算出低收入者和高收入者的频率即可,为方便直接计算,这个频率分布直方图也可以看作是200个样本的频率分布直方图解析低收入者的频率是0.000 25000.1,故从低收入者中抽取2000.120人;高收入者的频率是(0.0
14、00 30.000 1)5000.2,故从高收入者中抽取2000.240人故选C.答案C温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意方法与技巧1用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计2茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有
15、样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作3若取值x1,x2,xn的频率分别为p1,p2,pn,则其平均值为x1p1x2p2xnpn;若x1,x2,xn的平均数为,方差为s2,则ax1b,ax2b,axnb的平均数为ab,方差为a2s2.失误与防范频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.A组专项基础训练一、选择题1(2013重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区
16、间22,30)内的概率为() 来源:中教网A.0.2 B0.4 C0.5 D0.6答案B解析10个数据落在区间22,30)内的数据有22,22,27,29共4个,因此,所求的频率为0.4.故选B.2(2013辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45 B50 C55 D60答案B解析由频率分布直方图,知低于60分的频率为(0.010.005)200.3.该班学生人数n50.3(2012陕西) 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如
17、图所示),则该样本的中位数、众数、极差分别是()A46,45,56 B46,45,53C47,45,56 D45,47,53答案A解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为681256.4为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为,则()Amemo BmemoCmemo Dmome
18、答案D来源:zzs解析30个数中第15个数是5,第16个数是6,所以中位数me5.5,众数mo5,平均值.5若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则()A.5,s22C.5,s25,s22答案A解析考查样本数据的平均数及方差(x1x2x8)5,(x1x2x85)5,5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,s22,故选A.二、填空题6(2013湖北)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为_;(2)命中环数的标准差为
19、_答案(1)7(2)2解析(1)(78795491074)7.(2)s2(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,命中环数的标准差为2.来源:中*国教*育出*版网7(2012山东)如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为
20、_答案9解析结合直方图和样本数据的特点求解最左边两个矩形面积之和为0.1010.1210.22,总城市数为110.2250,最右边矩形面积为0.1810.18,500.189.8将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为234641,且前三组数据的频数之和等于27,则n_.答案60解析第一组至第六组数据的频率之比为234641,前三组频数和为n27,故n60.三、解答题9(2012安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结
21、果发现有50件不合格品计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组频数频率3,2)0.102,1)来源:z|zs|8(1,20.50(2,310(3,4合计501.00(1)将上面表格中缺少的数据填在相应位置;来源:(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品据此估算这批产品中的合格品的件数解(1)如下表所示频率分布表.分组频数频率3,2)50.102,1)80.16(1,2250.50(2,3来源:中*国教*育出*版网100.20(3
22、,420.04合计501.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的概率约为0.500.200.70.(3)设这批产品中的合格品数为x件,依题意,解得x201 980.所以该批产品的合格品件数大约是1 980件10(2012广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如
23、下表所示,求数学成绩在50,90)之外的人数.分数段来源:中.教.网z.z.s.tep50,60)60,70)70,80)80,90)xy11213445解(1)由频率分布直方图知(2a0.020.030.04)101,解得a0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为550.00510650.0410750.0310850.0210950.0051073(分)(3)由频率分布直方图知语文成绩在50,60),60,70),70,80),80,90)各分数段的人数依次为0.005101005,0.041010040,0.031010030,0.021010020.由题中给
24、出的比例关系知数学成绩在上述各分数段的人数依次为5,4020,3040,2025.故数学成绩在50,90)之外的人数为100(5204025)10.B组专项能力提升1(2013四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()来源:中国教育出版网答案A解析由于频率分布直方图的组距为5,排除C、D,又0,5),5,10)两组各一人,排除B,应选A.2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示由于不慎将
25、部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A0.27,78 B0.27,83C2.7,78 D2.7,83答案A解析由题意,知4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则有60.2715d10.010.030.09,解得d0.05,从而求得b78.3某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是(
26、)A70,75 B70,50C75,1.04 D62,2.35答案B解析因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得:s2(x170)2(x270)2(8070)2(7070)2(x4870)2,而更正前有75(x170)2(x270)2(5070)2(10070)2(x4870)2,化简整理得s250.4在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列an,已知a22a1,且样本容量为300,则小长方形面积最大的一组的频数为_答案160解析小长方形的面积由小到大构成等比数列an,且a22a1,样本的频率构成一个等比数列
27、,且公比为2,来源:中&教&网z&z&s&tepa12a14a18a115a1300,a120,小长方形面积最大的一组的频数为8a1160.5从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知a_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_答案0.0303解析小矩形的面积等于频率,除120,130)外的频率和为0.700,a0.030.由题意知,身高在120,130),130,140),140,150内的学生分别为30
28、人,20人,10人,由分层抽样可知抽样比为,在140,150中选取的学生应为3人6某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下表所示.组号分组频数频率第1组160,165)50.050第2组165,170)来源:0.350第3组170,175)30第4组175,180)200.200第5组180,185100.100合计来源:z|zs|1001.00(1)请先求出频率分布表中、位置相应数据,再完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、
29、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A考官进行面试,求:第4组至少有一名学生被考官A面试的概率解(1)由题意可知,第2组的频数为0.3510035,第3组的频率为0.300,频率分布直方图如图所示:(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为第3组:63人,第4组:62人,第5组:61人所以第3、4、5组分别抽取3人、2人、1人(3)设第3组的3位同学为A1,A2,A3,第4组的2位同学为B1,B2,第5组的1位同学为C1,则从六位同学中抽两位同学有15种可能如下:(A1,A2),(A1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),(B1,B2),(B1,C1),(B2,C1)来源:z&zs&其中第4组的2位同学至少有一位同学入选的有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),(B1,C1),(B2,C1)9种可能,所以第4组的2位同学至少有一位同学入选的概率为.专心-专注-专业