《2019版理科数学一轮复习高考帮试题:第14章第2讲 变量间的相关关系与统计案例(考题帮.数学理) .docx》由会员分享,可在线阅读,更多相关《2019版理科数学一轮复习高考帮试题:第14章第2讲 变量间的相关关系与统计案例(考题帮.数学理) .docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二讲 变量间的相关关系与统计案例题组1回归分析1.2017山东,5,5分理为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a,已知i=110xi=225,i=110yi=1 600,b=4.该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.1702.2015湖北,4,5分已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相
2、关D.x与y负相关,x与z正相关3.2014重庆,3,5分理已知变量x与y正相关,且由观测数据算得样本平均数x-=3,y-=3.5,则由该观测数据算得的线性回归方程可能是()A.y=0.4x+2.3 B.y=2x-2.4 C.y=-2x+9.5 D.y=-0.3x+4.44.2014湖北,4,5分理根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y=bx+a,则()A.a0,b0B.a0,b0 C.a0D.a0,b05.2015 新课标全国,19,12分理某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和
3、年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到图14-2-1所示的散点图及一些统计量的值.图14-2-1xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)(yi-y)i=18(wi-w)(yi-y)46.65636.8289.81.61 469108.8表中wi=xi,w=18i=18wi.()根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)()根据()的判断结果及表中数据,建立y关于x的回归方程;()已知这种产品的年利润z与x,y的关系
4、为z=0.2y-x.根据()的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为=i=1n(ui-u)(vi-v)i=1n(ui-u)2,=v-u.题组2独立性检验在实际问题中的应用6.2014安徽,17,12分某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).()
5、应收集多少位女生的样本数据?()根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图14-2-2所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率;图14-2-2()在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2k0)0.100.050.0100.005k02.7063.841
6、6.6357.8797.2014辽宁,18,12分某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100 ()根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;()已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品.现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附: 2=n(n11n22-n12n21)2n1+n2+n+1n+2,P(2k)0.1000.0500.010k2.7063.8416.635 A组基础题1
7、.2018惠州市二调,7某商场为了了解毛衣的月销售量y(单位:件)与月平均气温x(单位:)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x/171382月销售量y/件24334055由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温为6 ,据此估计该商场下个月毛衣销售量为()A.46件B.40件C.38件D.58件2.2018湖南省五市十校联考,3下表提供了某工厂节能降耗技术改造后,一种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据:x/吨3456y/吨 2.5t44.5根据上表提供的数据,求得y关于x的线性
8、回归方程为y=0.7x+0.35,那么表格中t的值为()A.3B.3.15C.3.25D.3.53.2018广东省百校联盟第二次联考,3下表是我国某城市在2017年1月份至10月份期间各月最低温度与最高温度(单位:)的数据一览表.月份12345678910最高温度/59911172427303121最低温度/-12-31-271719232510已知该城市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是()A.最低温度与最高温度为正相关B.每月最高温度与最低温度的平均值在前8个月逐月增加C.月温差(最高温度减最低温度)的最大值出现在1月D.1月至4月的月温差(最高温度减最低温
9、度)相对于7月至10月,波动性更大4.2017长沙市五月模拟,5为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:购买食品的年支出费用x/万元2.092.152.502.842.92购买水果和牛奶的年支出费用y/万元1.251.301.501.701.75根据上表可得回归直线方程y=bx+a,其中b=0.59,a=y-bx,据此估计该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用为()A.1.795万元B.2.555万元 C.1.915万元D.1.945万元5.2018成都市高三摸底测试,18某医疗
10、科研项目组对5只实验小白鼠体内的A,B两项指标数据进行收集和分析,得到的数据如下表:指标1号小白鼠2号小白鼠3号小白鼠4号小白鼠5号小白鼠A57698B22344(1)若通过数据分析,得知A项指标数据与B项指标数据具有线性相关关系.试根据上表,求B项指标数据y关于A项指标数据x的线性回归方程y=bx+a;(2)现要从这5只小白鼠中随机抽取3只,求其中至少有一只小白鼠的B项指标数据高于3的概率.参考公式:b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx.B组提升题6.2018惠州市一调,19近年来,随着我国在教育科研上的投入
11、不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.伴随着国内市场增速放缓,国内有实力的企业纷纷进行海外布局,第二轮企业出海潮到来.如在智能手机行业,国产品牌已在赶超国外巨头,某品牌手机公司一直默默拓展海外市场,在海外共设30多个分支机构,需要国内公司外派大量70后、80后中青年员工.该企业为了解这两个年龄层员工是否愿意被外派工作的态度,按分层抽样的方法从70后和80后的员工中随机调查了100位,得到的数据如下表:愿意被外派不愿意被外派总计70后20204080后402060总计6040100 (1)根据调查的数据,是否有90%以上的把握认为“是否愿意被外派与年龄有关”,并说明理
12、由;(2)该公司欲举行参观驻海外分支机构的交流体验活动,拟安排6名参与调查的70后、80后员工参加.70后员工中有愿意被外派的3人和不愿意被外派的3人报名参加,从中随机选出3人,记选到愿意被外派的人数为x;80后员工中有愿意被外派的4人和不愿意被外派的2人报名参加,从中随机选出3人,记选到愿意被外派的人数为y.求xy的概率.参考数据:P(K2k0)0.150.100.050.0250.0100.005k02.0722.7063.8415.0246.6357.879参考公式:K2 = n(ad - bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.7.2017桂林、百色、
13、梧州、崇左、北海五市联考,18某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销售量y(单位:万件)之间的关系如下表.x1234y12284256 (1)在图14-2-3中画出表中数据的散点图;图14-2-3(2)根据散点图选择合适的回归模型拟合y与x的关系(不必说明理由);(3)建立y关于x的回归方程,预测第5年的销售量.参考公式:回归直线的斜率和截距的最小二乘估计分别为b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nx yi=1nxi2-nx2,a=y-bx.8.2017四川省重点中学高三第二次学习情况评估,18 某课题组
14、对全班45名同学的饮食习惯进行了一次调查,并用如图14-2-4所示的茎叶图表示45名同学的饮食指数.说明:饮食指数低于70的人被认为喜食蔬菜,饮食指数不低于70的人被认为喜食肉类.图14-2-4(1)根据茎叶图,完成下面22列联表,并判断是否有90%的把握认为“喜食蔬菜还是喜食肉类与性别有关”,说明理由;喜食蔬菜喜食肉类总计男同学女同学总计 (2)用分层抽样的方法按照喜食蔬菜、喜食肉类从全班同学中随机抽取15名同学进行进一步调查,记抽到的喜食肉类的女同学的人数为,求的分布列和数学期望E().附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2k0)0.100.050.0
15、1k02.7063.8416.635答案1.C由题意可知y=4x+a,又x=22.5,y=160,则160=22.54+a,解得a=70,所以y=4x+70.当x=24时,y=424+70=96+70=166.2.C因为y=-0.1x+1,x的系数为负,所以x与y负相关;而y与z正相关,故x与z负相关.故选C.3.A依题意知,相应的回归直线的斜率应为正,排除选项C,D.且直线必过点(3,3.5),代入选项A,B中的方程可得A正确.选A.4.B根据题中表内数据画出散点图(图略),由散点图可知b0,故选B.5.()由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.()令
16、w=x,先建立y关于w的线性回归方程.由于d=i=18(wi-w)(yi-y)i=18(wi-w)2=108.81.6=68,c=y-dw=563-686.8=100.6,所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x.()(i)由()知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,年利润z的预报值z=576.60.2-49=66.32.(ii)根据()的结果知,年利润z的预报值z=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z取得最大值.故年宣传
17、费为46.24千元时,年利润的预报值最大.6.()3004 50015 000=90,所以应收集90位女生的样本数据.()由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.()由()知,300位学生中有3000.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计2109030
18、0结合列联表可算得K2的观测值k=300(-2 250)27522521090=100214.7623.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.7.()将22列联表中的数据代入公式计算,得2=n(n11n22-n12n21)2n1+n2+n+1n+2=100(6010-2010)270308020=100214.762.由于4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.()从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间=(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,
19、b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3),其中ai表示喜欢甜品的学生,i=1,2.bj表示不喜欢甜品的学生, j=1,2,3.由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A=(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3).事件A由7个基本事件组成,因而P(A)=710.A组基础题1.A由题中数据,得x=10,y=38,回归直线y=
20、bx+a过点(x,y),且b=-2,所以a=58,则回归方程为y=-2x+58,所以当x=6时,y=46,故选A.2.Ax=3+4+5+64=4.5,y=2.5+t+4+4.54=11+t4,线性回归方程过样本点的中心(x,y),所以11+t4=0.74.5+0.35,解得t=3,选A.3.B将最高温度、最低温度、温差列表如下,月份12345678910最高温度/59911172427303121最低温度/-12-31-271719232510温差度/171281310787611由表格可知,最低温度大致随最高温度的增大而增大,A正确;每月最高温度与最低温度的平均值在前8个月不是逐月增加,B错
21、;月温差的最大值出现在1月,C正确;1月至4月的月温差相对于7月至10月,波动性更大,D正确.故选B.4.Ax=2.09+2.15+2.50+2.84+2.925=2.50(万元),y=1.25+1.30+1.50+1.70+1.755=1.50(万元),又b=0.59,所以a=y-bx=0.025,y=0.59x+0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为y=0.593.00+0.025=1.795万元.5.(1)由题意,可得x=7,y=3,i=15xiyi=110,i=15xi2=255,b=i=15xiyi-5x yi=15xi2-5x2=12.a=y-b
22、x,a=-12.所求线性回归方程为y=12x-12.(2)设1号至5号小白鼠依次为a1,a2,a3,a4,a5,则在这5只小白鼠中随机抽取3只的抽取情况有a1a2a3,a1a2a4,a1a2a5,a1a3a4,a1a3a5,a1a4a5,a2a3a4,a2a3a5,a2a4a5,a3a4a5,共10种.随机抽取的3只小白鼠中至少有一只的B项指标数据高于3的情况有a1a2a4,a1a2a5,a1a3a4,a1a3a5,a1a4a5,a2a3a4,a2a3a5,a2a4a5,a3a4a5,共9种.从这5只小白鼠中随机抽取3只,其中至少有一只小白鼠的B项指标数据高于3的概率为910.B组提升题6.(
23、1)有90%以上的把握认为“是否愿意被外派与年龄有关”,理由如下:由题意可知,K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100(2020-4020)2604060402.7782.706,所以有90%以上的把握认为“是否愿意被外派与年龄有关”.(2)“xy”包含“x=0,y=1”“x=0,y=2”“x=0,y=3”“x=1,y=2”“x=1,y=3”“x=2,y=3”六个事件,且P(x=0,y=1)=C30C33C63C41C22C63=4400,P(x=0,y=2)=C30C33C63C42C21C63=12400,P(x=0,y=3)=C30C33C63C
24、43C20C63=4400,P(x=1,y=2)=C31C32C63C42C21C63=108400,P(x=1,y=3)=C31C32C63C43C20C63=36400,P(x=2,y=3)=C32C31C63C43C20C63=36400,所以P(xy)=4+12+4+108+36+36400=200400=12.即xy的概率为12.7.(1)作出的散点图如图D 14-2-2所示:图D 14-2-2(2)根据散点图可知,可以用线性回归模型拟合y与x的关系.(3)观察(1)中散点图可知各点大致分布在一条直线附近,列出表格:ixiyixi2xiyi1112112222845633429126
25、4456162241013830418可得x=52,y=692,所以b=i=14xiyi-4x yi=14xi2-4x2=418-45269230-4(52)2=735,a=y-b x=692-73552=-2.故回归直线方程为y=735x-2.当x=5时,y=7355-2=71.故预测第5年的销售量为71万件.8.(1)根据茎叶图,完成的22列联表如下,喜食蔬菜喜食肉类总计男同学19625女同学17320总计36945计算得K2的观测值为k=45(193-617)23692025=0.562 52.706,所以没有90%的把握认为“喜食蔬菜还是喜食肉类与性别有关”.(2)因为从喜食肉类的同学中抽取的人数为91545=3,所以的可能取值有0,1,2,3.P(=0)=C63C93=521,P(=1)=C62C31C93=1528,P(=2)=C61C32C93=314,P(=3)=C33C93=184.所以的分布列为0123P5211528314184所以的数学期望E()=0521+11528+2314+3184=1.