《第63讲 变量间的相关关系、统计案例(达标检测)(教师版).docx》由会员分享,可在线阅读,更多相关《第63讲 变量间的相关关系、统计案例(达标检测)(教师版).docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变量间的相关关系.统计案例达标检测A组一应知应会1. (2020春河南月考)已知呈线性相关的变量不与y的部分数据如表所示()X24568y34.5m7.59若其回归直线方程是y=1.05x+0.85,则m=()A. 5.5B. 6C. 6.5D. 7【分析】由已知求得样本点的中心的坐标,代入线性回归方程即可求得加值.【解答】解:由题意可得?4(2+4+5+6+8) = 5y-(3+4. 5+m+7. 5+9)华鱼, bb则样本点的中心为(5,生空),5则华支=1.05X5+0. 8E,解得根=6.55故选:C.2.(2020新课标I )某校一个课外学习小组为研究某作物种子的发芽率y和温度x (
2、单位:C)的关系,0102030在20个不同的温度条件下进行种子发芽实验,由实验数据(为,y) (z=l, 2,,20)得到下面的散点40温度/七由此散点图,在10至40之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A. y=a+hxA. y=a+hxB. y=a+hjC. y=a+bexD. y=a+blnx15,(2020吉林模拟)2019年末至2020年初,某在线教育公司为了适应线上教学的快速发展,近5个月加大了对该公司的网上教学使用软件的研发投入,过去5个月资金投入量x (单位:百万元)和收益y (单位:百万元)的数据如下表:月份2019年11月2019年
3、12月2020年1月2020年2月2020年3月资金投入量/百万元2481012收益/百万元14.2120.3131.1837.8344.67若y与x的线性回归方程为y=3x+m则资金投入量为16百万元时,该月收益的预报值为 百万元.【分析】求出样本中心,代入回归直线方程,求出m代入x=16,得到预报值即可.解答解:由题意得,x= 2+4+8+10+12 =7.2, 14. 21+20. 31+31. 18+37. 83+44.包=29.64, 55A所以 a=y- b=29.64 - 3X7.2 = 8.04.A所以y关于X的回归方程为y=3X+8.04.A把x=16代入回归方程得y=3X
4、16+8.04=56.04,故预报值为56.04百万元.故答案为:56.04.16.(2020春九江期末)针对“中学生追星问题。某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的工,男生追星的人数占男生人数的工,女生追星的人数占女生人数 23的2,若有95%的把握认为中学生追星与性别有关,则男生至少有 人.3参考数据及公式如下:P (犬2%)0.0500.0100.001ko3.8416.63510.828心一广-._a.(a+b) (c+d) (a+c) (b+d)【分析】设男生人数为X,由题意得列联表,计算K2,对照临界值列出不等式,求出X的取值范围.【解答】
5、解:设男生人数为X,由题意得列联表如下;喜欢追星不喜欢追星合计男生1. X 32X3X女生1 . X 31 . X61 . X2合计2 .X35 X63 X23,11 21 /2X k3X 6X 3X 3X; _ 3%3 841x12 5x 20x 236解得x206.635,n(ad-bc)2 100X (64X 1Q-16X IQ)-(a+b)(c+d) (a+c)(b+d)80X 20X 74X 26P (KN6.635) =0.01;故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关,(2020新课标川)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公
6、园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0, 200(200, 400(400, 6001(优)216252 (良)510123 (轻度污染)6784 (中度污染)720(1)分别估计该市一天的空气质量等级为1, 2, 3, 4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人
7、次400空气质量好空气质量不好附:片=n(ad-bc) 2(a+b) (c+d) (a+c) (b+d)P (非土)0.0500.0100.001k3.8416.63510.828【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1, 2, 3, 4的概率;(2)采用频率分布直方图估计样本平均值的方法可得得答案;(3)由公式K2(3)由公式K2n(ad-bc)2(a+b) (c+d) (a+c) (b+d)计算女的值,从而查表即可,【解答】解:(1)该市一天的空气质量等级为1的概率为:2+16+25 _ 43该市一天的空气质量等级为2的概率为:1001005+10+12 _ 2
8、7100100该市一天的空气质量等级为3的概率为:6+7+8 . 21该市一天的空气质量等级为4的概率为:1001007+2+0 _ 9100 loo(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:x= 100X0.20+300X0.35+500X0.45 =350;人次W400人次400总计空气质量好333770空气质量不好22830总计5545100(3)根据所给数据,可得下面的2义2列联表,由表中数据可得:k2=n(ad-bc)2 100X (33X8-37X22)2(a+b) (c+d) (a+c) (b+d)70X 30X 55X 45,所以有95%的把握认为一天中到该公园
9、锻炼的人次与该市当天的空气质量有关.B组一强基必备1.(2020沈阳三模)已知x与y之间的几组数据如表:X1234y1mn4如表数据中y的平均值为25若某同学对2赋了三个值分别为1.5, 2, 2.5,得到三条线性回归直线方程分别为y=hix+ai,y=b2x+42,y=03x+3,对应的相关系数分别为n,3下列结论中错误的是()n _ (x-x)(y.-y) AAXXAA参考公式:线性回归方程y=bx+a中,其中b二以七-,a=y-b.相关系数r= (xx)2i=ln _ (xt-x)(y.-y) i=lA.三条回归直线有共同交点B.相关系数中,门最大C. b /?2D. aa2【分析】由题
10、意可得m+ = 5,分别取相与的值,得到加,Q1,匕2,Q2,9,的值,逐一分析四 个选项得答案.【解答】解:由题意,1+根+4=10,即加+=5若加=1.5,则 =3.5,此时 x= 1+2+3+4 二2 5, y=2. 5.44_ (x-7) (y -y)=(1-2.5) (1 - 2.5) + (2-2.5) (1.5 - 2.5)i=l 11+ (3 - 2.5) (3.5 - 2.5) + (4-2.5) (4-2.5) =5.5,4_ (x.G) 2= ( - 1.5) 2+ ( - 0.5) 2+0.52+1.52=5, i=l 14_ (y. -y) 2= ( - 1.5) 2
11、+ ( - 1) 2+l2+1.52 = 6.5.i=l 1则ai=2.5 - 1.1X2.5= -0.25, r若 z=2,则=3,此时?= 1+2+3+4 =2 5, y=2. 5.44_ (x.G) (y-y)=(1-2.5) (1 - 2.5) + (2-2.5) (2-2.5) + (3 - 2.5) (3 - 2.5) + (4-2.5) (4 i=l 11-2.5) =5,4_4_ (x -x) 2=5, (y .-y) 2= ( - 1.5) 2+ ( - 0.5) 2+0.52+1.52=5.i=l 1i=l 1b2=4 = l乙Db2=4 = l乙D。2=2.5 - 1X2
12、.5 = O,若m=2.5,则 =2.5,此时彳= 1+2+3+45, y=2. 5.4,4_ (x-彳)(y -y)=(1 - 2.5) (1 - 2.5) + (2 - 2.5) (2.5 - 2.5)i=l 11+ (3 - 2.5) (2.5 -2.5) + (4-2.5) (4-2.5) =4.5,-1.5) 2+1.52=4.5,一 二 ? 力A 行4_4_E 区彳)2=5, (y,-y)2= i=li=l由样本点的中心相同,故A正确;由以上计算可得,相关系数中,9最大,加历,410)元.甲团队研发的药物每次接种后产生抗体的概率为p, 根据以往试验统计,甲团队平均花费为-2m/+6
13、机;乙团队研发的药物每次接种后产生抗体的概率为私 每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第 二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若=2/从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?P (烂2%)0.100.050.010.0050.001ko2.7063.8416.6357.87910.828附:K2=(a+b) (c+d) (a+c) (b+d)【分析】(1)根据题意填写列联表,计算犬7.879,从而求出z的值;n(ad-bc)2(2)计算甲研发试验品花费的数学期望E (X),乙研发试验品花费的
14、数学期望E (丫), 计算E(Y) - (X),讨论q的取值范围,求出 (X)与 (丫)的大小.【解答】解:(1)根据题意填写列联表如下;I型病n型病合计男5z 6z ?z女2z 34z 32z合计3z 23z 23z若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,22z 7.879,3c /5z 4z z 2z x 九(石石瓦二) 则片=0一0c 3z 3zz2z丁 丁解得 z11.8185,由ZeN*,且三6N*,所以Z的最小值为12,即男性患者至少有12人;63(2)设甲研发试验品花费为X,则E (X) = - 2mp2+6m;设乙研发试验品花费为匕 则y的可
15、能取值为3/小6m,所以 P ( Y=3m)(1-q) +3= - 2q3+3q2,P (丫=6加=1+2/-3/,所以 E (D =3( - 2/+3才)+6加( 1+2夕3 - 3才)=&向-9mq2+6m;因为 p=2q,所以 E(y) - E (X) = 6mcf - 9mq2+6m+2mp2 - 6m=6mq - 9mq2+lmp2 = 6mq - mq1 = mq1(6q - 1 );当04时,6q- lO,所以/阳2 (6t?- i) E (K),乙团队试验 6的平均花费较少,所以选择乙团队进行研发;当VqVl时,6q- 10,因为根0,所以z/ (6-1) 0,所以 (X) E
16、 (K),甲团队试验 6的平均花费较少,所以选择甲团队进行研发;当4=时,加/(6g- 1) =0,所以E (X) =E (7),甲团队试验的平均花费和乙团队试验的平均 6费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.【分析】直接由散点图结合给出的选项得答案.【解答】解:由散点图可知,在10c至40C之间,发芽率y和温度X所对应的点(x, y)在一段对数函数的曲线附近,结合选项可知,y=a+hlnx可作为发芽率y和温度x的回归方程类型.故选:D.3.(2020春龙凤区校级期中)一组数据如表所示:X1234yee6已知变量y关于x的回归方程为了二巳bxKL5,若
17、工=5,则预测y的值可能为()1113A. /B.aC. p2-D. e1【分析】令2=/y,求得X, Z间的数据对照表,结合样本点的中心满足线性回归方程求得江再令X = 5 即可预测y的值.【解答】解:由v=Rb奸。.5,得仇=以+0.5,令z=ln$ 7 DJJ得 z=Z?x+0.5.根据已知表格中的数据,得到X, 2的取值对应如下:X1234z1346由上述表格可知:21+2+3+45,由/+3+4+644则 3.5 = 2.5+0.5,即=1.2.z= 1.2尤+0.5,13进而得到y = J2x刊5,将X=5代入,可得y=p65=T.故选:C.4. (2020春安徽期末)某车间加工零
18、件的数量x与加工时间y的统计数据如表.现已求得如表数据的回归方程y二bx+a中的b值为。9,则据此回归模型可以预测,加工80个零件所需要的加工时间约为()零件数x (个)102030加工时间y (分钟)213039A. 84分钟B. 94分钟C. 102分钟D. 112分钟【分析】求出样本数据的中心坐标,代入回归直线方程,求出a,得到回归直线方程,然后求解加工80 个零件所需要的加工时间.【解答】解:由题意得:(10+20+30) =20, y= (21+30+39) =30, 33AA故=丫一 b=30- 0.9X20=12,AA故 y=0.9x+12, x=80 时:y=84,故选:A.5
19、. (2020春越秀区期末)设某大学的女生身高y (单位:cm)与体重x (单位:kg)之间具有线性相关关A系,根据一组样本数据,用最小二乘法建立的回归方程为y=L 18X+101,则下列结论中不正确的是()A. y与x具有正的线性相关关系B.回归直线经过样本点的中心(W,y)C.若该大学某女生体重为50依,则其身高必为160cmD.若该大学某女生体重每增加1依,则其身高平均增加1.18cm【分析】结合回归直线方程,判断线性关系判断A;回归直线的性质判断B;回归方程只能进行预测,但不可断定,判断。的正误;回归直线的估计值,判断。;【解答】解:设某大学的女生身高y (单位:cm)与体重x (单位
20、:依)之间具有线性相关关系,根据一A组样本数据,用最小二乘法建立的回归方程为y=L 18X+101,y与X具有正的线性相关关系,所以A正 确;回归直线经过样本点的中心G,y),所以8正确;若该大学某女生体重为50依,则其身高约为160cm,不是一定,所以。不正确;若该大学某女生体重每增加1依,则其身高平均增加1.18cm,满足回归直线的性质,所以。正确;故选:C.6. (2020河南模拟)某生物研究所在新冠病毒19)疫苗的研制过程中,为验证疫苗的治疗效果,进行了动物的对比试验,现对20。只小白鼠进行试验,得到如表数据:未发病发病合计未接种疫苗206080接种疫苗8040120合计1001002
21、00附.滔二 n(ad-bc) 2(a+b) (c+d) (a+c) (b+d)P (犬2公)0.050.010.0050.001ko3.8416.6357.87910.828则下列说法正确的是()A.至少有99.9%的把握认为“发病与没接种疫苗有关“B.至多有99%的把握认为“发病与没接种疫苗有关”C.至多有99.9%的把握认为“发病与没接种疫苗有关”D. “发病与没接种疫苗有关”的错误率至少有0.01%【分析】根据所给表格的数据,计算观测值,对照附表得出结论.【解答】解:根据所给表格的数据,结合片计算公式,可得其观测值为柞喘嗑等新二詈】。.皿所以至少有99.9%的把握认为“发病与没接种疫苗
22、有关”.故选:A.7. (2020衡水模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特 点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示.年份20152016年份代码X01年销量y/万件1015201720182019234203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为片6.5x+t,则可以预测2020年该型号无 人机的销量大约为()A. 40万件B. 41.5万件C. 45万件D. 48万件【分析】求出样本中心坐标,代入回归直线方程,求出3然后预测2020年该型号无人机的销量.解答解:=。+1+2+3+4=2, J= 10+
23、15+20+30+35=22. 55又因为直线y=6.5x+t过点(2, 22), 故 6.5X2+1=22,解得,=9.故预测2020年该型号无人机的销量大约为y=6. 5X5+9=41,E (万件),故选:B.8.(2020春兴庆区校级期末)“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到“光A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘行动与性别无关”C.有90%以上的把握认为“该市居民能否做到光盘行动与性别有关”D.有90%以上的把握认为“该市居民能否做到光盘行动与性别无关
24、”【分析】根据题目所给的数据填写2X2列联表,计算K的观测值玄,对照题目中的表格,得出统计结 论.【解答】解:根据题目所给数据得到如下2又2的列联表:根据题目所给数据得到如下2X2的列联表:做不到“光盘”行动能做到“光盘”运动总计男451055女301545总计7525100斫以 2-lOOX (45 X 15-30X 10) 2 nA55X 45X 75X 25所以有90%以上的把握认为“该市居民能否做到光盘行动与性别有关”,故选:C.9.(多选)(2020滨州三模)2020年3月12日,国务院新闻办公室发布会重点介绍了改革开放40年,特 别是党的十八大以来我国脱贫攻坚、精准扶贫取得的显著成
25、绩,这些成绩为全面脱贫初步建成小康社会 奠定了坚实的基础.如图是统计局公布的2010年2019年年底的贫困人口和贫困发生率统计表.则下 面结论正确的是()【年底贫困人口的线性回归方程为y二.1609.9x+1576& (其中工=年份一 2。9),贫困发生率的线性回归方程为y=l. 6729x+16. 3醛(其中产年份-2009)】年底贫困人口(万人)年底贫困人口(万人)18000160001400012000100008000 600040002000 0贫困发生率(%)A. 2010年2019年十年间脱贫人口逐年减少,贫困发生率逐年下降B. 2012年2019年连续八年每年减贫超过1000万
26、,且2019年贫困发生率最低C. 2010年2019年十年间超过1.65亿人脱贫,其中2015年贫困发生率低于6%D.根据图中趋势线可以预测,到2020年底我国将实现全面脱贫【分析】根据统计表计算出每年脱贫的人口,由此判断出正确选项.【解答】解:每年脱贫的人口如下表所示:期初期末脱贫人口2009年底至2010年底165662010年底至2011年底165661223843282011年底至2012年底12238989923392012年底至2013年底9899824916502013年底至2014年底8249701712322014年底至2015年底7017557514422015年底至201
27、6年底5575433512402016年底至2017年底4335304612892017年底至2018年底3046166013862018年底至2019年底16605511109由于缺少2009年年底数据,故无法统计十年间脱贫人口的数据,故A,。选项错误.根据上表可知:2012年2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低,故8选项正确.根据上表可知,2012年2019年连续八年每年减贫超过1000万,2019年年底,贫困人口 551万,故预计到2 020年底我国将实现全面脱贫,故。选项正确.综上所述,正确的选项为3D故选:BD.10. (多选)(2020春济南期末)在
28、一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如表所示:晕机不晕机合计男n15n+女6222+合计n十12846则下列说法正确的是()附:参考公式:K2=7一5吗 W一其中一(a+c) (b+d) (a+b) (c+d)独立性检验临界值表:P (非,如)0.100.050.0250.010ko2.7063.8415.0246.635A.也nl+ n2+B. 2,706C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关【分析】由列联表中数据计算22、几2+、和11、几+1,填表后分析选项中的说法是否正确.【解答】解
29、:由列联表中数据,得22=28 - 15 = 13,几2+=1 + 13=19, i+=46 - 19 = 27,7111=27 - 15=12, 7?+i = 12+6=18;填表如下:晕机不晕机合计12121527女61319合计182846所以E旦=22, -=, 11一二,所以a 正确; n1+ 27 n2+ 19 38 n1+ n2+计算 非二亚 X (12 X 13-6 X 15产=0 7750V2.7O6,所以 B 正确;18X 28X 27X 19对照附表知,没有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关,所以C错误;由独立性检验原理知,没有理由认为,在恶劣气候
30、飞行中,晕机与否跟男女性别有关,所以。正确.故选:ABD.11. (2020春滨海县校级期末)某公司统计了第X年(2013年是第一年)的经济效益为y (千万元),得到 如表表格:X3456y2.5344.5若由表中数据得到的线性回归方程是9=3+0. 35,则可预测2020年经济效益大约是 千万元.【分析】求出样本中心坐标,代入回归直线方程,求出3然后代入x=8,即可推出结果.【解答】解:由表格中的数据求得?/+4+5+6 乂 5,1二2.5+3+4+4.5:3 5, 44所以样本点的中心坐标为(4.5, 3.5),代入?二mx+0.35,得3.5=4.5/72+0.35,解得m=0.7.线性
31、回归方程为?=0.7x+0. 35,取x=8,得?二5. 95,故答案为:5.95.12. (2020春合肥期末)已知x与y之间的一组数据如表,已求得关于y与x的线性回归方程丫= L2x+, 则a的值为.X0246y2357【分析】求出样本中心坐标,代入回归直线方程求解即可.【解答】解:由题意可知x=2(0+2+4+6) =3, 4y= (2+3+5+7),44因为回归直线结果样本中心,所以:立=1 2义3+&,4解得(7=0.65.故答案为:0.65.13 .(2020春吉林月考)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5次试验,得到5组数据(为,yi),(孙丁2),(孙
32、3),(X4,4),(%5, )5),根据收集到的数据可知y =60,由最小 A二乘法求得回归直线方程为y=0. 6x+48,则Xl+X2+X3+A4+X5 =.【分析】回归直线经过样本点的中心,将;=60代入回归方程解得7=20,进而得出答案.【解答】解:将9=60代入回归方程得,60 = 0.6+48,解得7=20,所以 XI+X2+X3+X4+X5 =5 X= 100.故答案为:100.14 .(2020春吉林期末)某次国际会议为了搞好对外宣传工作,会务组选聘了 50名记者担任对外翻译工作, 在如表“性别与会外语”的2X2列联表中,。+。+4=.会外语不会外语总计男ah20女6d总计1850【分析】由列联表求出。、仄d的值,再求和.【解答】解:由题意填写列联表如下,会外语不会外语总计男12820女62430总计183250所以 =12, b=8, d=24, +b+d= 12+8+24=44.故答案为:44.