《第63讲 变量间的相关关系、统计案例(达标检测)(教师版)(1).docx》由会员分享,可在线阅读,更多相关《第63讲 变量间的相关关系、统计案例(达标检测)(教师版)(1).docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变量间的相关关系.统计案例达标检测A组一应知应会A. 5.5B. 6C. 6.5D. 71. (2020春河南月考)已知呈线性相关的变量x与y的部分数据如表所示()X24568y34.5m7.59若其回归直线方程是y=L05x+0.85,则机=()0102030A. y=a+bxB. y=a+bjC. y=aJt-bexD. y=a+hlnx【分析】由已知求得样本点的中心的坐标,代入线性回归方程即可求得加值.【解答】解:由题意可得?(2+4+5+6+8) = E, 5y-(3+4. 5+m+7. 5+9)华鱼, bb则样本点的中心为(5,生空),5贝ij华支=1.05X5+0. 8”解得根=6
2、.5.5故选:C.2.(2020新课标I )某校一个课外学习小组为研究某作物种子的发芽率y和温度x (单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(刘,”)(i=l, 2,,20)得到下面的散点40温度/七由此散点图,在10至40C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()15.(2020吉林模拟)2019年末至2020年初,某在线教育公司为了适应线上教学的快速发展,近5个月加大了对该公司的网上教学使用软件的研发投入,过去5个月资金投入量x (单位:百万元)和收益),(单位:百万元)的数据如下表:月份2019年11月2019年12月20
3、20年1月2020年2月2020年3月资金投入量/百万元2481012收益/百万元14.2120.3131.1837.8344.67若y与x的线性回归方程为y=3x+m则资金投入量为16百万元时,该月收益的预报值为 百万元.【分析】求出样本中心,代入回归直线方程,求出m代入x=16,得到预报值即可.解答解:由题意得,彳=2+4+8+10+12 =7 2, 14. 21+20. 31+31. 18+37. 83+44. =29.64, 55A所以 a= y - bW=29.64 - 3X7.2 = 8.04.所以y关于x的回归方程为y=3x+8.04.把x=16代入回归方程得y=3X 16+8.
4、04=56.04,故预报值为56.04百万元.故答案为:56.04.16. (2020春九江期末)针对“中学生追星问题。某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的工,女生追星的人数占女生人数23的2,若有95%的把握认为中学生追星与性别有关,则男生至少有人.3参考数据及公式如下:P (片ko)0.0500.0100.001ko3.8416.63510.828犬=n(ad-bc) ?(a+b) (c+d) (a+c) (b+d)【分析】设男生人数为X,由题意得列联表,计算玄,对照临界值列出不等式,求出X的取值范围.【解答】解:设男
5、生人数为X,由题意得列联表如下;喜欢追星喜欢追星不喜欢追星合计男生女生9计算K2-9计算K2-236又 x=6k,蛇N,所以 Xmin = 30,即有95%的把握认为中学生追星与性别有关时,男生至少有30人.故答案为:30.17. (2020新课标H)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该 地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取 20个作为样区,调查得到样本数据(孙y) (i=l, 2,,20),其中制和w分别表示第,个样区的植202020_物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得羽=60,”
6、=1200,(制- x)220-= 80, (y- y)i=l20-= 80, (y- y)i=l20_=9000, (制- x)(V- y) =800.i=l(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平 均数乘以地块数);(2)求样本(孙y) (i=l, 2,,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生 动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. (xx)(力一了)付:相关系数n721.414.、忙(Xj-x)2- (yi-y)2 V
7、 i=li=l【分析】(1)由已知数据求得20个样区野生动物数量的平均数,乘以200得答案;(2)由已知直接利用相关系数公式求解;(3)由各地块间植物覆盖面积差异很大可知更合理的抽样方法是分层抽样.20【解答】解:(1)由已知, y. = 1200,i=l 11 2020个样区野生动物数量的平均数为y. = 1200=60,20 i=i 1,该地区这种野生动物数量的估计值为60X200= 12000;20_20_20_(2) (xx)2=80, (yy) 2=9000, (xx) (yy)=800,i=li=li=ln _ (xx) (Vj-y)尸一=8008002V2L _、2告,_、2 M
8、ox 9000 6OOV2 3 U-a X (xx) X (yj-y) V i=li=l(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽 样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆 盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本 结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.18. (2020海南)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2
9、浓度(单位:ng/m3),得下表:SO2PM2.50, 50(50, 150(150, 4750, 3532184(35, 756812(75, 1153710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且S。浓度不超过150”的概率;(2)根据所给数据,完成下面的2X2列联表:SO20, 150(150, 475(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与S3浓度有关?附.n (ad-be产(a+b) (c+d) (a+c) (b+d)P (院k)0.0500.0100.001k3.8416.63510.828【分析】(1)用频率估计概率,
10、从而得到“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率;(2)根据题目所给的数据填写2X2列联表即可;(3)计算K的观测值K2,对照题目中的表格,得出统计结论.【解答】解:(1)用频率估计概率,从而得到“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过 150” 的概率 P= 32X+b+X =0.64;100(150, 4750, 150502n(ad-bc)2(2)根据所给数据,可得下面的2义2列联表:(a+b) (c+d) (a+c) (b+d)80X 20X 74X 26= 100X(64X 10-16X 1Q=74846j635P (产26.635
11、) =0.01;故有99%的把握认为该市一天空气中PM2.5浓度与S。浓度有关,(2020新课标m)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0, 200(200, 400(400, 6001 (优)216252 (良)510123 (轻度污染)6784 (中度污染)720(1)分别估计该市一天的空气质量等级为1, 2, 3, 4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为
12、3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联表,判断是否有95%的把 握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次W400人次400空气质量好空气质量不好附.n(ad-be) 2(a+b) (c+d) (a+c) (b+d)P (片2%)0.0500.0100.001k3.8416.63510.828【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1, 2, 3, 4的概率;(2)采用频率分布直方图估计样本平均值的方法可得得答案;(3)由公式K2(3)由公式K2n(ad-bc)?(a+b) (c+d) (a+c) (b+d
13、)计算攵的值,从而查表即可,【解答】解:(1)该市一天的空气质量等级为1的概率为:2+16+25 =/1100100该市一天的空气质量等级为2的概率为:5+10+12 =上二100100该市一天的空气质量等级为3的概率为:史上电=_2L;100100该市一天的空气质量等级为4的概率为:卫2坦=,;100100(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:X= 100X0.20+300X0.35+500X0.45 = 350;(3)根据所给数据,可得下面的2义2列联表,人次W400人次400总计空气质量好333770空气质量不好22830总计5545100由表中数据可得:k2 =n(
14、ad-bc) 2(a+b) (c+d) (a+c) (b+d)= 100X(33 X8- 37义22)25820“841,70X 30X 55X 45所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.B组一强基必备1. (2020沈阳三模)已知x与y之间的几组数据如表:X1234y1mn4如表数据中y的平均值为25若某同学对相赋了三个值分别为1.5, 2, 2.5,得到三条线性回归直线方程分别为y=bx+ayy=,y=h3x+a3,对应的相关系数分别为r, n, n,下列结论中错误的是()n _4 (x4-x)(y.-y) AAXTAA参考公式:线性回归方程y=b/a中,
15、其中二,软三_0相关系数 尸 (xx)2i=ln _ (xx) (yy) i=lA.三条回归直线有共同交点B.相关系数中,最大C. b /?2D. a a2【分析】由题意可得相+=5,分别取力与的值,得到加,a, b2, ci2, r, n, r3的值,逐一分析四 个选项得答案.【解答】解:由题意,1+2+4=10, BP m+n5.若加=1.5,则=35 此时二 1+2+3+4 二2 5,7=2. 5.44_ (x-7) (y .-y)= 1 - 2.5) (1 - 2.5) + (2-2.5) (1.5 - 2.5)i=l 11+ (3 - 2.5) (3.5 - 2.5) + (4-2.
16、5) (4-2.5) =5.5,4_ ( x -x ) 2=( - 1.5)(-0.5) 2+0.52+1.52=5,i=l 14_ (y. _y) 2=( _ 1.5)2+(7)2+i2+i.52=6.5.i=l 1则 b=Ll, 1=2.5 - 1.1X2.5= - 0.25, r若加=2,则=3,此时= 1+2+3+4 =2 5, y=2. 5.44_ (x.G) (y.-y)= 及=2.5-1*2.5 = 0,工2=亚义m=1;若2=2.5,贝ij=25 此时彳= 1+2+3+4 二、5,7=2. 5.44_ (x.G) (y.-y)= bi, a0)元.甲团队研发的药物每次接种后产生
17、抗体的概率为p, 根据以往试验统计,甲团队平均花费为-2/秋2+6加乙团队研发的药物每次接种后产生抗体的概率为g 每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第 二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若=2/从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发? R/4 2 n(ad-bc)2(a+b) (c+d) (a+c) (b+d)P (片攵0)0.100.050.010.0050.001九)2.7063.8416.6357.87910.828【分析】(1)根据题意填写列联表,计算K27.879,从而求出z的
18、值;(2)计算甲研发试验品花费的数学期望 (X),乙研发试验品花费的数学期望E (X), 计算E(y) - E (X),讨论q的取值范围,求出E(X)与E(Y)的大小.【解答】解:(1)根据题意填写列联表如下;I型病n型病合计男5z 6z ?z女2z 34z 32z合计3z3z3z若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,2n 7.879,2 c /5z 4z z 2z x SZM 石瓦丁)贝 片=0一0c 3z 3zz2z丁 丁解得 zlL8185,由ZeN*,且三6N*,所以z的最小值为12,即男性患者至少有12人;63(2)设甲研发试验品花费为X,则 (
19、X) = - 2mp2+6m;设乙研发试验品花费为匕 则y的可能取值为3/72、6m,所以 P (Y=3m)(l-q) +/= - 2八3/P (Y6m) =1+23-3/,所以 E (7) =3m*( - 2+3/)+6加(1+2夕- 3/)=6矽3 _ 9m2+6m;因为p=2q,所以 *(y) - E (X) =6妁3 - 9/7i2+6/?z+2/np2 - 6m6mq3 - 9mq2+2mp2 6mcp - mq1mq1(6夕-1);当0夕时,6q- 10,所以/%/ (6夕-1) E (K),乙团队试验6的平均花费较少,所以选择乙团队进行研发;当自0,因为根0,所以2/(6夕-1)
20、 0,所以E(X) E (K),甲团队试验6的平均花费较少,所以选择甲团队进行研发;当彳=时,加/(6g - 1) =0,所以E (X) =E (D,甲团队试验的平均花费和乙团队试验的平均6费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.【分析】直接由散点图结合给出的选项得答案.【解答】解:由散点图可知,在10C至40之间,发芽率y和温度x所对应的点(x, y)在一段对数函数的曲线附近,结合选项可知,y=ablnx可作为发芽率y和温度x的回归方程类型.故选:D.3.(2020春龙凤区校级期中)一组数据如表所示:X1234yee4e6已知变量y关于x的回归方程为y
21、二巳bxKL5,若1=5,则预测y的值可能为()1113A/B. 0 2C. 0 2D. e1【分析】令Z=2y,求得X, Z间的数据对照表,结合样本点的中心满足线性回归方程求得再令尤=5 即可预测y的值.【解答】解:由好产他5,得仇=bx+0.5,令z=ln2, y 口jj得 z=x+0.5.根据已知表格中的数据,得到X, Z的取值对应如下:x1234z1346由上述表格可知:r1+2:3+4=25 . = 1+3:4+6=3.5. 44则3.5 = 2.5匕+0.5,即匕=1.2.Az = 1.2x+0.5.13进而得到v= J2x刊5,将尸5代入,可得产 J5 T.故选:C.4.(202
22、0春安徽期末)某车间加工零件的数量x与加工时间y的统计数据如表.现已求得如表数据的回归 A AAA方程y=bx+a中的b值为。9,则据此回归模型可以预测,加工80个零件所需要的加工时间约为()零件数x (个)102030加工时间y (分钟)21加工时间y (分钟)213039A. 84分钟B. 94分钟C.102分钟D. 112分钟【分析】求出样本数据的中心坐标,代入回归直线方程,求出得到回归直线方程,然后求解加工80 个零件所需要的加工时间.【解答】解:由题意得:-x= (10+20+30) =20, y= (21+30+39) =30,33AA故2=丫一 匕;=30 - 0.9X20=12
23、,AA故 y=0.9x+12, x=80 时:y=84,故选:A.5 .(2020春越秀区期末)设某大学的女生身高y (单位:cm)与体重x (单位:kg)之间具有线性相关关A系,根据一组样本数据,用最小二乘法建立的回归方程为y=L lgx+101,则下列结论中不正确的是()A. y与x具有正的线性相关关系B.回归直线经过样本点的中心(W, y)C.若该大学某女生体重为50依,则其身高必为160c机D.若该大学某女生体重每增加1依,则其身高平均增加L18c2【分析】结合回归直线方程,判断线性关系判断4回归直线的性质判断B;回归方程只能进行预测,但不可断定,判断C的正误;回归直线的估计值,判断。
24、;【解答】解:设某大学的女生身高y (单位:cm)与体重x (单位:依)之间具有线性相关关系,根据一A组样本数据,用最小二乘法建立的回归方程为y=L 18X+101,y与X具有正的线性相关关系,所以A正 确;回归直线经过样本点的中心 G,y),所以8正确;若该大学某女生体重为50依,则其身高约为160C772,不是一定,所以C不正确;若该大学某女生体重每增加1依,则其身高平均增加1.18。必 满足回归直线的性质,所以。正确;故选:C.6 . (2020河南模拟)某生物研究所在新冠病毒(COV/O- 19)疫苗的研制过程中,为验证疫苗的治疗效果,进行了动物的对比试验,现对200只小白鼠进行试验,
25、得到如表数据:未发病发病合计未接种疫苗206080附.10. 828, 3所以至少有99.9%的把握认为“发病与没接种疫苗有关”.故选:A.7.(2020衡水模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特 点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示.年份20152016201720182019年份代码X01234年销量w万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为片6.5x+t,则可以预测2020年该型号无人机的销量大约为()A. 40万件B. 41.5万件C. 45万件D. 48万件【分析】求出样本中心
26、坐标,代入回归直线方程,求出3然后预测2020年该型号无人机的销量.解答解:7=0+1+2+3+4名-10+15+20+30+35 =2255又因为直线y=6.5x+t过点(2, 22), 故 6.5X2+1=22,解得 1=9.故预测2020年该型号无人机的销量大约为y=6. 5 X 5+9=41. E (万件),故选:B.8 .(2020春兴庆区校级期末)“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到“光 盘”行动,得到了如表列联表,下列结论正确的是()做不到“光盘”行动能做到“光盘”运动男4510女3015p=n(ad-bc)2(a+b) (c+d) (a+c) (b+
27、d)A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘行动与性别无关”C.有90%以上的把握认为“该市居民能否做到光盘行动与性别有关”D.有90%以上的把握认为“该市居民能否做到光盘行动与性别无关”【分析】根据题目所给的数据填写2义2列联表,计算K的观测值总,对照题目中的表格,得出统计结 论.【解答】解:根据题目所给数据得到如下2X2的列联表:根据题目所给数据得到如下2X2的列联表:做不到“光盘”行动能做到“光盘”运动总计男451055女301545总计7525100所以 100X(45X 15-30
28、X 1Q)33o27O655X 45X 75X 25所以有90%以上的把握认为“该市居民能否做到光盘行动与性别有关”,故选:C.9 .(多选)(2020滨州三模)2020年3月12日,国务院新闻办公室发布会重点介绍了改革开放40年,特 别是党的十八大以来我国脱贫攻坚、精准扶贫取得的显著成绩,这些成绩为全面脱贫初步建成小康社会 奠定了坚实的基础.如图是统计局公布的2010年2019年年底的贫困人口和贫困发生率统计表.则下 面结论正确的是()【年底贫困人口的线性回归方程为y=.1609.9x+1576& (其中工=年份一 2。9),贫困发生率的线性回归方程为y=L 6729x+16.3醛(其中工=
29、年份- 2009)】贫困发生率(%)年底贫困人口 (万人)2 201”20“年制】2”2013彳2014*301520162017“黑1,彳*1218000160001400012000100008000600040002000 0Mfic 利次刘1 年初日joimoiwamww30n* awA. 2010年2019年十年间脱贫人口逐年减少,贫困发生率逐年下降B. 2012年2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低C. 2010年2019年十年间超过1.65亿人脱贫,其中2015年贫困发生率低于6%D.根据图中趋势线可以预测,到2020年底我国将实现全面脱贫【分析】
30、根据统计表计算出每年脱贫的人口,由此判断出正确选项.【解答】解:每年脱贫的人口如下表所示:期初期末脱贫人口2009年底至2010年底165662010年底至2011年底165661223843282011年底至2012年底12238989923392012年底至2013年底9899824916502013年底至2014年底8249701712322014年底至2015年底7017557514422015年底至2016年底5575433512402016年底至2017年底4335304612892017年底至2018年底3046166013862018年底至2019年底16605511109由于
31、缺少2009年年底数据,故无法统计十年间脱贫人口的数据,故4。选项错误.根据上表可知:2012年2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低,故8选项正确.根据上表可知,2012年2019年连续八年每年减贫超过1000万,2019年年底,贫困人口 551万,故预计到2 020年底我国将实现全面脱贫,故。选项正确.综上所述,正确的选项为3D故选:BD.10.(多选)(2020春济南期末)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如表所示:晕机不晕机合计男nil151+女6222+合计+12846则下列说法正确的是()附:参考公式:K2=7一5吗 W一其中一
32、(a+c)(b+d) (a+b)(c+d)独立性检验临界值表:P (大2ko)0.100.050.0250.010ko2.7063.8415.0246.635A,也,nl+ n2+B.犬2.706C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关【分析】由列联表中数据计算22、2+、和m1、+1,填表后分析选项中的说法是否正确.【解答】解:由列联表中数据,得22 = 28 - 15 = 13,n2+= 1+13= 19, m+=46 - 19 = 27,nii=27 - 15 = 12, +i = 12+6=18;填表如下
33、:晕机不晕机合计121215271319合计182846所以也=2,所以A正确;n1+ 27 n2+ 19 38 n1+ n2+计算 K2=46X (12X13-6 义 15)2p0 77502.706,所以 3 正确;18X 28X 27X 19对照附表知,没有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关,所以C错误;由独立性检验原理知,没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关,所以。正确. 故选:ABD.11. (2020春滨海县校级期末)某公司统计了第x年(2013年是第一年)的经济效益为y (千万元),得到 如表表格:X3456y2.5344.5若由表中数据
34、得到的线性回归方程是/1nx+0. 35,则可预测2020年经济效益大约是 千万元.【分析】求出样本中心坐标,代入回归直线方程,求出相,然后代入x=8,即可推出结果.【解答】解:由表格中的数据求得?/+4+5+6 5,5+3+4+4.5:3 5,44所以样本点的中心坐标为(4.5, 3.5),代入?二mx+0,35,得3.5=45%+0.35,解得m=0.7.线性回归方程为?=0. 7x+0. 35,取X=8,得9=5. 95故答案为:5.95.12. (2020春合肥期末)已知x与y之间的一组数据如表,已求得关于y与x的线性回归方程丫= L2x+a, 则a的值为.X0246y2357【分析】
35、求出样本中心坐标,代入回归直线方程求解即可.【解答】解:由题意可知(0+2+4+6) =3,4- 117y= (2+3+5+7)=,44因为回归直线结果样本中心,所以:立=1 2义3+&,4解得 3),(X4, 4),(尤5, ”),根据收集到的数据可知y =60,由最小 A二乘法求得回归直线方程为y=0.6x+48,则XI+X2+X3+X4+X5 =【分析】回归直线经过样本点的中心,将;=60代入回归方程解得W=20,进而得出答案.【解答】解:将;=60代入回归方程得,60=0.6+48,解得W=20,所以 Xl+X2+X3+X4+X5 = 5 X= 100.故答案为:100.14 .(2020春吉林期末)某次国际会议为了搞好对外宣传工作,会务组选聘了 50名记者担任对外翻译工作, 在如表“性别与会外语”的2X2列联表中,。+d=.会外语 不会外语 总计男4h20 女6d总计1850【分析】由列联表求出。、b、d的值,再求和.【解答】解:由题意填写列联表如下,会外语不会外语总计男12820女62430总计183250所以。=12, b=8, d=24, a+b+d= 12+8+24=44.故答案为:44.