《第八章 成对数据的统计分析 单元检测(尖子生)(解析版).docx》由会员分享,可在线阅读,更多相关《第八章 成对数据的统计分析 单元检测(尖子生)(解析版).docx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章成对数据的统计分析章末检测3 (难)第I卷(选择题)一、单选题(每小题5分,共40分)1 .有几组变量:汽车的重量和汽车每消耗1升汽油所行驶的平均路程;平均日学习时间和平均学习 成绩;立方体的棱长和体积.其中两个变量成正相关的是()A.B.C.D.【答案】C【解析】【分析】利用相关关系和函数关系的概念分析解答.【详解】汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关关系;平均日学习时间和平均学习成绩是正相关关系;立方体的棱长和体积是函数关系,不是相关关系.故选:C.某种产品的广告支出费用x (单位:万元)与销售量y (单位:万件)之间的对应数据如下表所示:根据表中的数据可得回归直线
2、方程$,= 2.27.lI.O8, R、0.96,以下说法正确的是()广告支出费用X2.22.64.05.35.9销售量y3.85.47.011.612.2A.第三个样本点对应的残差a =7,回归模型的拟合效果一般.第三个样本点对应的残差a=1,回归模型的拟合效果较好C.销售量的多少有96%是由广告支出费用引起的D.销售量y的多少有4%是由广告支出费用引起的【答案】C【解析】【分析】利用回归模型可计算残差,结合相关指数可判断AB的正误,根据相关指数的意义可判断CD的正误. 因为相关系数0.9360.75,靠近1,销售额与年份序号x线性相关显著,B错误.根据三次函数回归曲线的相关指数().999
3、 0.936,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确; 由三次多项式函数 y = 0.07/ + 29.3 x2 - 33.09% +10.44,当x = 10时,2680.54亿元,D正确;故选:ACD第H卷(非选择题)三、填空题(每小题5分,共20分)13.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人 一年中的感冒记录作比较,提出假设这种血清不能起到预防感冒的作用,利用2x2列联表计算得Kh3.918,经查对临界值表知P(K3.841卜0.05.则下列结论中,正确结论的序号是.在犯错误的概率
4、不超过5%的前提可认为“这种血清能起到预防感冒的作用;若某人未使用该血清,则他在一年中有95%的可能性得感冒:这种血清预防感冒的有效率为95%;有95%的把握认为这种血清不能起到预防感冒的作用.【答案】【解析】【分析】根据独立性检验的概念即可得到答案.【详解】计算 3.918,由 P( 3.841 b 0.05;对于,在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用,正确;对于,若某人未使用该血清,不能说他在一年中有95%的可能性得感冒,错误;对于,这种血清有95%的可能性预防感冒,不是有效率为95%,错误;对于,有95%的把握认为这种血清能起到预防感冒的作用,所以错误.故答
5、案为:.14.为了研究某班学生的听力成绩x (单位:分)与笔试成绩)(单位:分)的关系,从该班随机抽取202020名学生,根据散点图发现X与y之间有线性关系,设其回归直线为加意+3已知Z%=400, 尸1580, 1-1l-la=-i,若该班某学生的听力成绩为26,据此估计其笔试成绩约为.【答案】103【解5【分析】根据所给数据求出系数出/;的值,求出回归方程的解析式,将*=26代入回归方程,求出y的估计值即可.【详解】2020因为Z%=400, 2=1580, i=li=l1-1所以 x =-x400 = 20,y =-xl580 = 79, 2020所以4 = 79-5x20,又 =-1,
6、解得分=4,故二4天一1,将x = 26代入|可归方程,解得y = 103,故若该班某学生的听力成绩为26,据此估计其笔试成绩约为103.故答案为:103.15 .已知一种植物一年生长的高度y与发芽期的平均温度x的关系可以用模型 =。声(其中e为自然对数的底数)拟合,设z = lny,其变换后得到一组数据:X2023252730Z22.4334.6由上表可得线性回归方程为2 = 0.21+,则当x = 35时,估计该植物一年生长的高度y的值为.【答案】e5【解析】【分析】利用回归直线过样本中心可得2 = 0.2x-2,进而可得$,= e2E,即求.【详解】由表格数据可得 二 :x(20 + 2
7、3 + 25 + 27 + 30)= 25, 5 = gx(2 + 2.4 + 3 + 3 + 4.6) = 3 ,代入 2 = 0.2x+,得 a = 3-0.2x25 = -2,所以2 = 0.21-2,即lny = 0.2x-2,从而有$ = e2*-2,当 x = 35 时,y = e5.故答案为:e5 .16 .针对“中学生追星问题、某校团委对“学生性别和中学生追星是否有关作了一次调查,其中女生人数是 男生人数的男生追星的人数占男生人数的;,女生追星的人数占女生人数的,若有95%的把握认为中 学生追星与性别有关,则男生至少有 人.参考数据及公式如下:网片认)0.0500.0100.0
8、013.8416.63510.8282n(ad-bc)2K = ! , n = a+b+c+d.(a + b)(c+d)(a + c)(b + d)【答案】30【解析】【分析】设男生人数为“,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行 比较,列不等式即可得出结论.【详解】设男生人数为工,依题意可得列联表如卜.:喜欢追星不喜欢追星总计男生X32xTX女生X3X6X2总计2xT5x 63x 2若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,贝卜23.841,由题知X应为6的整数倍,,若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,
9、则男生至少有30人,故答案为:30.三、解答题(第17题10分,18-22题每题12分,共70分)17.小强5次考试的数学与物理成绩(满分100分)如下表,由散点图可知,小强的数学成绩x与物理成绩y之间线性相关.数学成绩X6768707273物理成绩y6463666567求y关于X的线性回归方程;(2)利用(1)中的回归方程,小强第6次考试数学成绩是78分,请估计小强的物理分数.附:回归直线的斜率和截距的最小二乘估计公式分别为:3 = 二,a = y-bx(苍-工r=l【答案】(1)9 = 0.51+ 30;(2)69.【解析】【分析】(1)由表格数据,结合最小二乘法公式求回归参数&/;,即可
10、得回归方程.(2)由(1)所得回归方程,令x = 78估计小强的物理分数即可.,- 67 + 68 + 70 + 72 + 73 ” - 64 + 63 + 66 + 65 + 67 公由题设,x = 70, y = 65 ,X(% T)(% - y) = 2(%y)-5%y = 13, E(xf -x)2 = 26 ,r-1Mi-1所以/; = 0.5,则4 = 65 - 0.5 x 70 = 30,故线性回归方程为=。&+30.(2)由(1),令x=78,则物理分数为0.5x78+30 = 69分.18.从某居民区随机抽取2021年的10个家庭,获得第i个家庭的月收入者(单位:千元)与月储
11、蓄川单位:10101010千元)的数据资料,计算得,=80,,= 2(),WJ = 184,X0判断: (3)将x=7代入回归方程求解.由题意知1 A 80。-1 W 20 c =10, x =10, x=而1*=历=&),=而=),广正=2,nZzy 一X),_ _则 b = - = 0.3,4 = y-bx = -0.4,1=1所以所求I可归方程为),=0.3x-0.4.(2)因为否=0.30,所以变量歹的值随x的值增加而增加,故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为),=0.3x70.4 = L7(千元).19. 2021年11月4日,第四届中国国际进口博
12、览会在上海开幕,共计2900多家参展商参展,420多项新 产品,新技术,新服务在本届进博会上亮相.某投资公司现从中选出20种新产品进行投资.为给下一年度投资 提供决策依据,需了解年研发经费对年销售额的影响,该公司甲、乙两部门分别从这20种新产品中随机地 选取10种产品,每种产品被甲、乙两部门是否选中相互独立.y12.10*8 . J6 . 42 2 4 6 8 10 *101010./=110,ZU-【答案】*) r=110,(七一3)-r=l657520587732016求20种新产品中产品A被甲部门或乙部门选中的概率;甲部门对选取的10种产品的年研发经费(单位:万元)和年销售额y(i =
13、L2,10)(单位:十万元)数据作了初步处理,得到下面的散点图及一些统计量的值.根据散点图现拟定 关于x的回归方程为y = B(x-3) +.求、A的值(结果精确到0.1) .别为6=附:对于一组数据(匕,)、(岭,2)、匕、(匕,“),其回归直线 =。+价的斜率和截距的最小二乘估计分-麻 2016-205x7.5292016-65x7.5 1019,*=一仍 8773-205x20.5 一诟8773-65x6.5 - 5567【解析】【分析】(1)利用组合计数原理、占典概型的概率公式以及对立事件的概率公式可求得所求事件的概率;(2)令,=(x-3)2,计算出7、G的值,利用最小二乘法公式结合
14、表格中的数据可求得、A的值;20种新产品中产品A没有被甲部门和乙部门同时选中的概率夕=穿穿= :; = ;,。20 do 2 241 3所以产品A被甲部门或乙部门选中的概率为1 -t =4 4110,_110令f = (x3)2,由题中数据得f = 7;Z(E-3)-=20.5,广京2%=7.5, 1U r-11U r-11010c1010七一3)-A =2016,力;=之(%-3) =8773,r=1 i=li=l i=l10_y/TO 2016-205x7.529. _ r _ 29 _ _ . _b = = - = - 0.1, a = y-bt- 7.5x 20.5 = 5.4.举,2
15、 F 8773-205x20.5 2777277型T。/ /=120.数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9x9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3x3)内的数字均含1-9,不重复.数独爱好者小明打算报 名参加丝路杯全国数独大赛初级组的比赛.赛前小明在某数独力尸P上进行一段时间的训练,每天的解题平均速度M秒)与训练天数M天)有关,经统 计得到如表的数据:M天)1234567M秒)990990450320300240210现用),= + 作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天 X解题的平均速度
16、y约为多少秒?小明和小红在数独力PP上玩”对战赛,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为|,已知在前3局中小明胜2局,小红胜1局.若每局不 存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中/:=): Xi7以凹,二|t小2 r可Ml18450.370.555参考公式:对于一组数据(小片),(/),(“,匕),其回归直线S = a + 的斜率和截距的最小二乘估匕-计公式分别为:夕二一一一7一. av-p-u. 一川广,=1【答案】与二幽+ 130, 150: x沙625【解析】【分析】(1)令/二 一,设y关于f的线性回归方程为
17、),= +,则。二号1, a = y-bt,据此即可求出回归,9 - 7-r=1方程,将x=50代入方程即可预测50天后的速度乃(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行4局就有胜负.小明获胜的概率为P(X=2)+P(X=3) + P(X=4).一 I由题意,y = -(990+990 + 450 + 320 + 300 + 240 + 210) = 5()0,令”5,设y关于/的线性回归方程为y = G + a,1845-7x0.37x5001845-7x0.37x5000.55= 1000,贝必= 500 1000 x 0.37 = 130.
18、国),=1000/ + 130,又/= 一,取关于X的回归方程为 =四型+ 130, x故 x = 50 时,y = 150.团经过50天训练后,每天解题的平均速度J,约为150秒.设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行4局就有胜负.3 39当 X=2时,小明 4: 1 胜,EP(X=2) = -x- = ; D J J当 X=3 时,小明 4: 2 胜,0P(X=3)= Cx|xfl-|lx| = -;o /q、2 q 1 qo当 X=4 时,小明 4: 3 胜,EP(X=4)= C;x-x 1- x- = .5 5 J 5 625团小明最终血得
19、比赛的概率为鲁盘+镖=斐.12? 623 oZd21.为推动实施健康中国战略,树立大卫生、大健康理念,某单位组织职工参加“万步有约健走激励大赛活 动,旦每月评比一次,对该月内每日运动都达到一万步及以上的职工授予该月“健走先锋称号,其余参与的 职工均获得“健走之星称号,下表是该单位职工2021年1月至5月获得“健走先锋称号的统计数据:月份12345“健走先锋职工数1201051009580请利用所给数据求“健走先锋职工数V与月份工之间的I可归直线方程与=h+) 并预测该单位10月份的健走先锋职工人数:为进一步了解该单位职工的运动情况,现从该单位参加活动的职工中随机抽查70人,调查获得“健走先 锋
20、称号与性别的关系,统计结果如下:健走先锋健走之星男员工2416女员工1614能否据此判断有90%的把握认为获得“健走先锋”称号与性别有关?/ 2(七-工)(x - y) Z% - 参考公式:百=毛=丹,a = y-bx.力。,-君2储2 T相(曲一姐2(a+b)(c+d)(a + c)(b + d)(曲一姐2(a+b)(c+d)(a + c)(b + d)(其中 n = a+h+c+d)P(K.K0)0.150.100.050.0250.010%2.0722.7063.8415.0246.635【答案】g = _9x+127;约为37人;(2)没有90%的把握认为获得“健走先锋称号与性别有关.
21、【解析】【分析】(1)直接利用最小二乘法求出回归直线方程,再进行预测;(2)利用独立性检验求解.解:由表中的数据可知,1+2+3+4+5 .x = 3,120+105 + 100 + 95 + 80 皿、 =100 .故4 = y-Ar= 100-(-9)x3 = 127.1410-1500Xx,2 -5x255-45所以所求的回归直线方程为9 = -9x+127; 当x = 10时,y =-9x10 +127 = 37.所以该单位10月份的“健走先锋”职工人数约为37人.(2) 解:由表中数据可得,K、笔薪等琮3.841 ,所以通过对照表中数据得:在犯错误的可能性不超过0.050的前提下认为
22、X与y有关系,故选:B7 .为大力提倡“厉行节约,反对浪费“,某大学通过随机询问100名学生能否做到“光盘行动,得到如下列联表:单位:人性别“光盘行动做不到能做到女469男3114经计算:Z23.O4.附:a0.10.050.010.0050.001儿2.7063.8416.6357.87910.828参考附表,得到的正确结论是()A.依据a = 0.05的独立性检验,认为该校学生能否做到,光盘,行动与性别有关”8 .依据a = 0.01的独立性检验,认为“该校学生能否做到,光盘彳亍动与性别有关C.依据a = 0.1的独立性检验,认为“该校学生能否做到,光盘,行动与性别有关”D.依据a = 0
23、.l的独立性检验,认为“该校学生能否做到,光盘,行动与性别无关【答案】C【解析】【分析】依据独立性检验相关概念解题即可.【详解】由题意得3.04 2.706 = %,所以依据a = (M的独立性检验,认为该校学生能否做到,光盘彳亍动与性别 有关.故选:C.8 .某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机 调查部分中老年人,统计数据如下表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的 是()患糖尿病未患糖尿病坚持锻炼614不坚持锻炼725患糖尿病未患糖尿病坚持锻炼614不坚持锻炼725表3患高血压未患高血压坚持锻炼218不坚持锻炼1
24、121患冠心病未患冠心病坚持锻炼416不坚持锻炼923患关节炎未患关节炎坚持锻炼713不坚持锻炼626表4A.糖尿病B.高血压C.冠心病D.患关节炎【答案】B【解析】 【分析】根据独立性检验计算公,比较可得选项.【详解】解:由表 1 得:&2 = 52x(6x257x14)2-043,20x32x13x39由表 2 得:,2=52x(2x21-11x18)3920x32x13x39由表 3 得: = 52x(4x23-9xl6 = 0.43,20x32x13x39由表 4 得:F =52x(7x26-6x13)2之 1.73,20x32x13x39所以这四种慢性疾病可以通过坚持锻炼来预防的可能
25、性最大的是高血压, 故选:B.二、多选题(每小题5分,共20分).月亮公转与自转的周期都大约为27天,阴历是按月亮的月相周期安排的历法,人们根据长时间的观测, 统计了月亮出来的时刻)(简称月出时刻”,单位:h)与阴历日数x (xgN且x30)的有关数据如 表所示,并且根据表中数据,求得了关于工的经验回归方程为= 0.8x + 2X247101522y8.19.41214.418.524其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0: 00)才出来.则()A. ; = 10,亍=14.4B. 3 = 6.8C.预报月出时刻为16h的那天是阴历13日D.预报阴历27日的月出
26、时间为阴历28日早上4: 00【答案】AD【解析】【分析】A.利用平均数求解判断;B.将样本点代入回归直线方程求解判断:C.由9 = 08t + 6.4求解判断;将工=27, 代入= 0.8x + 6.4求解判断【详解】-2 + 4 + 7 + 10 + 15 + 22 ,八-8.1+9.4 + 12 + 14.4 + 18.5 + 24 卜e . 丁丁# = 10, y = 14.4 ,故选项 A 正确;OO将样本平均数=10, = 14.4代入S,= 0.8x + 4,得4 = 6.4,故选项B错误;5 = 0.8x+6.4,由 16 = 0.8x+6.4,得 x = 12,故选项 C 错
27、误;将x = 27,代入 = 0.8x+6.4,得5=28,所以月出时间应该为28日早上4: 00,选项D正确.故选:AD.10.将两个变量X,),的对样本数据(8,)1),(占,)2),(如%),(乙,”)在平面直角坐标系中表示为散点图,根据x,5满足一元线性【可归模型及最小二乘法,求得其经验I可归方程为,= /;x + 4,设,无)为回归直线上的 点,则下列说法正确的是()A.越小,说明模型的拟合效果越好r=1B.利用最小二乘法求出的线性|可归直线一定经过散点图中的某些点C.相关系数广的绝对值越接近于1,说明成对样本数据的线性相关程度越强D.通过经验回归方程进行预报时,解释变量的取值不能距
28、离样本数据的范围太远,求得的预报值不是响应 变量的精确值【答案】CD【解析】【分析】利用回归分析进行判断.【详解】A.当所有力时,S(Z-Z)0,当所有y = .时,(凹-”=。,显然后者拟合效果好,故错误; 1=1;=|B.利用最小二乘法求出的线性回归直线一定经过样本中心可,不一定经过散点图中的某些点,故错误;C.相关系数,的绝对值越接近于1,说明成对样本数据的线性相关程度越强,故正确;D.样本取值会影响回归方程的运用范围,求得的预报值不是响应变量的精确值,故正确;故选:CD11.针对时卜的“航天热,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调杳,其中被调查的男、 女生人数相同,男
29、生中喜欢航天的人数占男生人数的女生中喜欢航天的人数占女生人数的二,若依据 a = 0.05的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为()A. 25B. 45C. 60D. 75【答案】BCD【解析】【分析】设男生的人数为5(“wN。求出/=詈,解不等式竽2 3.841即得解.【详解】解:设男生的人数为5(),根据题意列出2x2列联表如下所示:单位:人喜爱度性别合计男生女生喜欢航天437 n不喜欢航天H2n3n合计5510则 2 _ 1 x(4 X 2n- 3 X_ 10/75x5x7x321町衣据a = 0.05的独立性检验,认为是否喜欢航天与学生性别有关,
30、回/ 23.841, 即当23.841,得28.0661,05240.3305,又回结合选项知B, C, D正确.故选:BCD.y=0.07x3 + 29.3 lx2- 33.09x + 10.4412.某电子商务平台每年都会举行“年货节商业促销狂欢活动,现在统计了该平台从2013年到2021年共9 年“年货节期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x (2013年作为第一年) 的函数.运用ewe/软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则卜.列说法正确的 是()2500200015001000500-O-500A.销售额y与年份序号x正相关B.销售额y与年份序号x线性关系不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2022年“年货节”期间的销售额约为2680.54亿元 【答案】ACD【解析】【分析】根据图象的走势左下到右上可判断A;由相关系数的绝对值越大拟合效果越好可判断B、C;令x = 10,代 入三次函数求出了值即可判断D.【详解】根据图象可知,散点从左下到右上分布,销售额与年份序号工呈正相关关系,故A正确;