《2022届高三数学一轮复习(原卷版)第4节 概率与统计、统计案例的综合问题 教案.doc》由会员分享,可在线阅读,更多相关《2022届高三数学一轮复习(原卷版)第4节 概率与统计、统计案例的综合问题 教案.doc(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四节概率与统计、统计案例的综合问题考点1概率与统计的综合问题破解概率与统计图表综合问题的“三步曲”经过多年的努力,炎陵黄桃在国内乃至国际上逐渐打开了销路,成为炎陵部分农民脱贫致富的好产品为了更好地销售,现从某村的黄桃树上随机摘下了100个黄桃进行测重,其质量分别在区间200,500内(单位:克),统计质量的数据作出其频率分布直方图如图所示:(1)按分层抽样的方法从质量落在350,400),400,450)的黄桃中随机抽取5个,再从这5个黄桃中随机抽2个,求这2个黄桃质量至少有一个不小于400克的概率;(2)以各组数据的中间数值代表这组数据的平均水平,以频率代表概率,已知该村的黄桃树上大约还有
2、100 000个黄桃待出售,某电商提出两种收购方案:A所有黄桃均以20元/千克收购;B低于350克的黄桃以5元/个收购,高于或等于350克的以9元/个收购请你通过计算为该村选择收益最好的方案(参考数据:225×0.05275×0.16325×0.24375×0.3425×0.2475×0.05354.5)解(1)由题得黄桃质量在350,400)和400,450)的比例为32,应分别在质量为350,400)和400,450)的黄桃中各抽取3个和2个记抽取质量在350,400)的黄桃为A1,A2,A3,质量在400,450)的黄桃为B1,
3、B2,则从这5个黄桃中随机抽取2个的情况共有以下10种:A1A2,A1A3,A2A3,A1B1,A2B1,A3B1,A1B2,A2B2,A3B2,B1B2.其中质量至少有一个不小于400克的有7种情况,故所求概率为.(2)方案B好,理由如下:由频率分布直方图可知,黄桃质量在200,250)的频率为50×0.0010.05,同理,黄桃质量在250,300),300,350),350,400),400,450),450,500的频率依次为0.16,0.24,0.3,0.2,0.05.若按方案B收购:黄桃质量低于350克的个数为(0.050.160.24)×100 00045 0
4、00个,黄桃质量不低于350克的个数为55 000个收益为45 000×555 000×9720 000元若按方案A收购:根据题意各段黄桃个数依次为5 000,16 000,24 000,30 000,20 000,5 000,于是总收益为(225×5 000275×16 000325×24 000375×30 000425×20 000475×5 000)×20÷1 000709 000(元)方案B的收益比方案A的收益高,应该选择方案B.解答本例第(2)问时,方案A需要算出黄桃的总质量,方案B
5、需要求出黄桃质量低于350克和不低于350克的个数教师备选例题(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例解(1)根据频率分布直方图可
6、知,样本中分数不小于70的频率为(0.020.04)×100.6,所以样本中分数小于70的频率为10.60.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)×100.9,分数在区间40,50)内的人数为100100×0.955,所以总体中分数在区间40,50)内的人数估计为400×20.(3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)×10×10060,所以样本中分数不小于70的男生人数为60×
7、30,所以样本中的男生人数为30×260,女生人数为1006040,所以样本中男生和女生人数的比例为604032,所以根据分层抽样原理,估计总体中男生和女生人数的比例为32.(2019·泰安模拟)2018年的政府工作报告强调,要树立绿水青山就是金山银山理念,以前所未有的决心和力度加强生态环境保护某地科技园积极检查督导园区内企业的环保落实情况,并计划采取激励措施引导企业主动落实环保措施,下图给出的是甲、乙两企业2012年至2017年在环保方面投入金额(单位:万元)的柱状图(1)分别求出甲、乙两企业这六年在环保方面投入金额的平均数;(结果保留整数)(2)园区管委会为尽快落实环保
8、措施,计划对企业进行一定的奖励,提出了如下方案:若企业一年的环保投入金额不超过200万元,则该年不奖励;若企业一年的环保投入金额超过200万元,不超过300万元,则该年奖励20万元;若企业一年的环保投入金额超过300万元,则该年奖励50万元分别求出甲、乙两企业这六年获得的奖励之和;现从甲企业这六年中任取两年对其环保情况作进一步调查,求这两年获得的奖励之和不低于70万元的概率解(1)由柱状图可知,甲企业这六年在环保方面的投入金额分别为150,290,350,400,300,400,其平均数为×(150290350400300400)315(万元);乙企业这六年在环保方面的投入金额分别为
9、100,200,300,230,500,300,其平均数为×(100200300230500300)272(万元),(2)根据题意可知,企业每年所获得的环保奖励t(x)(单位:万元)是关于该年环保投入x(单位:万元)的分段函数,即t(x)所以甲企业这六年获得的奖励之和为:02050502050190(万元);乙企业这六年获得的奖励之和为:0020205020110(万元)由知甲企业这六年获得的奖励数如下表:年份2012年2013年2014年2015年2016年2017年奖励(单位:万元)02050502050奖励共分三个等级,其中奖励0万元的只有2012年,记为A;奖励20万元的有2
10、013年,2016年,记为B1,B2;奖励50万元的有2014年,2015年和2017年,记为C1,C2,C3,故从这六年中任意选取两年,所有的情况为:(A,B1),(A,B2),(A,C1),(A,C2),(A,C3),(B1,B2),(B1,C1),(B1,C2),(B1,C3),(B2,C1),(B2,C2),(B2,C3),(C1,C2),(C1,C3),(C2,C3),共15种其中奖励之和不低于70万元的取法为:(B1,C1),(B1,C2),(B1,C3),(B2,C1),(B2,C2),(B2,C3),(C1,C2),(C1,C3),(C2,C3),共9种故所求事件的概率为P.考
11、点2概率与线性回归分析的综合问题在求两变量相关系数和两变量的回归方程时,由于r和的计算公式比较复杂,求它们的值时计算量比较大,因此为了计算准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度(2019·黄山模拟)由于往届高三年级数学学科的学习方式大都是“刷题讲题再刷题”的模式效果不理想,某市一中的数学课堂教改采用了“记题型刷题检测效果”的模式,并记录了某学生的记题型时间t(单位:h)与检测效果y的数据如表所示:记题型时间t/h1234567检测效果y2.93.33.64.44.85.25.9(1)据统计表明,y与t之间具有线性相关关系,请用相关系数r加
12、以说明(若|r|0.75,则认为y与t有很强的线性相关关系,否则认为没有很强的线性相关关系);(2)建立y关于t的回归方程,并预测该学生记题型8 h的检测效果;(3)在该学生检测效果不低于3.6的数据中任取2个,求检测效果均高于4.4的概率参考公式: 回归直线x中斜率和截距的最小二乘估计分别为,相关系数r解(1)由题得4,941014928,7.08,y与t有很强的线性相关关系 4.30.5×42.3.y关于x的线性回归方程0.5t2.3,当t8时,0.5×82.36.3.预测该学生记题型8 h的检测效果约为6.3.(3)由题意,该学生检测效果不低于3.6的数据有5个,任取
13、2个数据有:(3.6,4.4),(3.6,4.8),(3.6,5.2),(3.6,5.9),(4.4,4.8),(4.4,5.2),(4.4,5.9),(4.8,5.2),(4.8,5.9),(5.2,5.9)共10种情况,其中检测效果均高于4.4的有:(4.8,5.2),(4.8,5.9),(5.2,5.9)共3种结果故所求概率P.在计算r或时,要充分利用题目中给出的数据,结合所给公式,分析哪些数据已知,哪些未知某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的
14、发芽数,得到如下资料:日期4月1日4月7日4月15日4月21日4月30日温差x/101113128发芽数y/颗2325302616(1)从这5天中任选2天,求这2天发芽的种子数均不小于25的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另外三天的数据,求出y关于x的线性回归方程x;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为解(1)由题意,设这两天发芽的种子数分别为m,n,m,n的所有取值有(23,2
15、5),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个,设“m,n均不小于25”为事件A,则事件A包含的基本事件有(25,30),(25,26),(30,26),共3个,所以P(A),故从这5天中任选2天,发芽的种子数均不小于25的概率为.(2)由数据得12,27,3 972,32432.,27×123,y关于x的线性回归方程为x3.(3)当x10时,×10322,|2223|2,当x8时,×8317,|1716|2.故所得到的线性回归方程是可靠的考点3概率与
16、独立性检验的综合问题解决概率与统计案例综合问题的四步骤(2019·大同模拟)“微信运动”是一个类似计步数据库的公众账号,现从“微信运动”的60个好友(男、女各30人)中,记录了他们某一天的走路步数,并将数据整理如表:02 000步2 0015 000步5 0018 000步8 00110 000步10 000步男(人数)246108女(人数)171093P(K2k)0.100.050.0100.0050.001k2.7063.8416.6357.87910.828附:K2.(1)若某人一天的走路步数超过8 000步被系统评定为“积极型”,否则评定为“懈怠型”根据题意完成下面的2
17、15;2列联表,并据此判断能否有90%的把握认为“评定类型”与“性别”有关?积极型懈怠型总计男(人数)女(人数)总计(2)现从被系统评定为“积极型”好友中,按男女性别分层抽样,共抽出5人,再从这5人中,任意抽出3人发一等奖,求发到一等奖的3人中恰有一名女性的概率解(1)根据题意填写列联表如下:积极型懈怠型总计男(人数)181230女(人数)121830总计303060计算K22.42.706,所以没有90%的把握认为“评定类型”与“性别”有关(2)按男女性别分层抽样,抽出5人中3男2女,分别设为a,b,c,D,E,从这5人中任意抽出3人,所有结果为abc,abD,abE,acD,acE,aDE
18、,bcD,bcE,bDE,cDE共10种,其中恰有1名女性的基本事件有abD,abE,acD,acE,bcD,bcE共6种,故所求的概率为P.解答本例第(1)问的关键是正确列出2×2列联表教师备选例题某研究型学习小组调查研究“中学生使用智能手机对学习的影响”,部分统计数据如下表:使用智能手机人数不使用智能手机人数总计学习成绩优秀人数4812学习成绩不优秀人数16218总计201030参考数据:P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.(1)试根据
19、以上数据运用独立性检验思想,指出有多大把握认为中学生使用智能手机对学习有影响?(2)研究小组将该样本中使用智能手机且成绩优秀的4位同学记为A组,不使用智能手机且成绩优秀的8位同学记为B组,计划从A组推选的2人和B组推选的3人中,随机挑选2人在学校升旗仪式上作“国旗下讲话”分享学习经验求挑选的2人恰好分别来自A,B两组的概率解(1)由题易求得K210,因为7.879<K2<10.828,所以有99.5%的把握认为中学生使用智能手机对学习有影响(2)记A组推选的2名同学为a1,a2,B组推选的3名同学为b1,b2,b3,则从中随机选出2名同学包含如下10个基本事件:(a1,a2),(a
20、1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(b1,b2), (b1, b3), (b2, b3)记挑选的2人恰好分别来自A,B两组为事件Z,则事件Z包含如下6个基本事件:(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3)故P(Z),即挑选的2人恰好分别来自A,B两组的概率是.(2019·洛阳模拟)某学校为调查高三年级学生的身高情况,按随机抽样的方法抽取100名学生,得到男生身高情况的频率分布直方图(图1)和女生身高情况的频率分布直方图(图2)已知图1中身高在170175 cm的男生人数有16
21、人图1图2(1)试问在抽取的学生中,男、女生各有多少人?(2)根据频率分布直方图,完成下列的2×2列联表,并判断能有多大(百分之几)的把握认为“身高与性别有关”?170 cm170 cm总计男生身高女生身高总计(3)在上述100名学生中,从身高在175185 cm之间的男生和身高在170175 cm之间的女生中间按男、女性别分层抽样的方法,抽出6人,从这6人中选派2人当旗手,求2人中恰好有一名女生的概率参考公式:K2参考数据:P(K2k)0.0250.0100.0050.001k5.0246.6357.87910.828解(1)直方图中,因为身高在170175 cm的男生的频率为0.
22、4,设男生数为n1,则0.4,得n140.由男生的人数为40,得女生的人数为1004060.(2)男生身高170 cm的人数(0.080.040.020.01)×5×4030,女生身高170 cm的人数0.02×5×606,所以可得到下列列联表:170 cm170 cm总计男生身高301040女生身高65460总计3664100K244.01010.828,所以能有99.9%的把握认为身高与性别有关(3)在175185 cm之间的男生有12人,在170175 cm之间的女生人数有6人按分层抽样的方法抽出6人,则男生占4人,女生占2人设男生为A1,A2,A
23、3,A4,女生为B1,B2.从6人中任选2名有:(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2)共15种可能2人中恰好有一名女生:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2)共8种可能,故所求概率为P.课外素养提升数据分析统计图表中的信息提取及数据处理概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、分析数
24、据、处理数据、得出有用的结论几个复杂过程如果这几个过程书写步骤缺失则会造成丢分;如果数据处理不当则会陷入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据,然后根据统计思想对数据进行相关处理、运算,并按照一定的书写步骤准确无误书写出来,做到步骤不缺失、表述准确无误,下面就如何从概率统计综合问题中迅速提取数据,并作出正确处理及模型构建提供典例展示统计图中数据的提取、处理及运算【例1】(2016·全国卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元在机器使用期间,如果备件不足再购买,则每个50
25、0元现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数(1)若n19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解(1)当
26、x19时,y3 800;当x>19时,y3 800500(x19)500x5 700,所以y与x的函数解析式为y(xN)(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为(3 800×704 300×204 800×10)4 000.若每台机器在购机同时都购买20个易损零件,则这100台机器中
27、有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为(4 000×904 500×10)4 050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件评析(1)根据题意写出分段函数的解析式(2)根据柱状图结合频率的概念,求n的最小值(3)分别计算两种情况下的平均数,并比较大小,作出决策【素养提升练习】12019年的“国庆节”期间,高速公路车辆较多某调查公司在一服务区从七座以下小型汽车中按进服务区的先后每间隔50辆就抽取一辆的抽样方法抽取40名驾驶员进行询问调查,将他们在某段高速公路的车速(km/
28、h)分成六段:60,65),65,70),70,75),75,80),80,85),85,90)后得到如图的频率分布直方图(1)求这40辆小型车辆车速的众数和中位数的估计值;(2)若从车速在60,70)的车辆中任抽取2辆,求车速在65,70)的车辆恰有一辆的概率解(1)众数的估计值为最高的矩形的中点,即众数的估计值等于77.5.设中位数的估计值为x,则0.01×50.02×50.04×50.06×(x75)0.5,解得x77.5,即中位数的估计值为77.5(2)从图中可知,车速在60,65)的车辆数为:m10.01×5×402,车速在
29、65,70)的车辆数为:m20.02×5×404.将车速在60,65)的车辆设为a,b,车速在65,70)的车辆设为c,d,e,f,则所有的基本事件有:(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),共15种,其中车速在65,70)的车辆恰有一辆的事件有:(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),共8种所以,车速在65,70)的车辆恰有一辆的概率为P.统计数表中的信息提取与数据处理【例2】(
30、2017·全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得 i9.97,s0.212,18.439, (xi)(i8.5)2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数r,
31、并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,n)的相关系数r解(1)由样本数据得(xi,i)(i1,2,16)的相关系数由于
32、|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)(i)由于9.97,s0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(3s,3s)以外,因此需对当天的生产过程进行检查()剔除离群值,即第13个数据,剩下数据的平均数为(16×9.979.22)10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.16×0.212216×9.9721 591.134,剔除第13个数据,剩下数据的样本方差为(1 591.1349.22215×10.022)0.008,这条生产线当天生产的零件尺寸的标
33、准差的估计值为0.09.评析(1)利用相关系数r的公式求出r进行判断(2)认真分析题目给出的信息,对照已知数据,找出异常值,剔除异常值,求出零件尺寸的均值与标准值【素养提升练习】2某项科研活动共进行了5次试验,其数据如下表:特征量第1次第2次第3次第4次第5次x555559551563552y601605597599598(1)从5次特征量y的试验数据中随机地抽取两个数据,求至少有一个大于600的概率;(2)求特征量y关于x的线性回归方程x;并预测当特征量x为570时,特征量y的值解(1)记“从5次特征量y的试验数据中随机地抽取两个数据,至少有一个大于600”为事件A.从5次特征量y的试验数据中随机地抽取两个数据有601,605,601,597,601,599,601,598,605,597,605,599,605,598,597,599,597,598,599,598,共10种情况其中至少有一个数据大于600的有601,605,601,597,601,599,601,598,605,597,605,599,605,598,共7种情况P(A).(2)556,600.0.3. 6000.3×556433.2,线性回归方程为0.3x433.2.当x570时,0.3×570433.2604.2.当x570时,特征量y的估计值为604.218