《人教版高中数学高考一轮复习训练-- 成对数据的统计分析(word版含解析).docx》由会员分享,可在线阅读,更多相关《人教版高中数学高考一轮复习训练-- 成对数据的统计分析(word版含解析).docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、考点规范练53成对数据的统计分析一、基础巩固1.(2020全国,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+bln x2.某公司生产的某型号无人机以小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐.该型号无人机近5年的年销售量数据统计如表所示.年份2015201620
2、1720182019年份代码x01234年销售量y/万件1015203035根据表中的数据,用最小二乘法求得y关于x的经验回归方程为y=6.5x+t,则预测2021年该型号无人机的年销售量为()A.40万件B.41.5万件C.45万件D.48万件3.为了调查学生对网络课程的喜爱程度,研究人员随机调查了相同人数的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程.若依据小概率值=0.01的独立性检验,可以推断喜欢网络课程与性别有关;依据小概率值=0.001的独立性检验,可以推断喜欢网络课程与性别无关,则被调查的男、女学生的总人数可能为()附:2=n(ad-bc)2(a+b)
3、(c+d)(a+c)(b+d),其中n=a+b+c+d.0.10.050.010.001x2.7063.8416.63510.828A.130B.190C.240D.2504.(多选)已知成年儿子的身高y(单位:cm)与父亲的身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,n),用最小二乘法求得的经验回归方程为y=0.84x+28.96,则下列说法正确的是()A.y与x正相关B.经验回归直线过点(x,y),其中x=x1+x2+xnn,y=y1+y2+ynnC.若父亲身高为179 cm,则儿子身高约为179.32 cmD.若父亲身高为179 cm,则儿子身高必为17
4、9.32 cm5.已知变量x与y的部分数据如下:xx1x2x8yy1y2y8用最小二乘法得到y关于x的经验回归方程为y=-2x+4.若数据x1,x2,x8的平均数为1,则i=18yi=.6.对196名接受心脏搭桥手术的病人和196名接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,得到22列联表如表所示.手术心脏病合计又发作过心脏病未发作过心脏病心脏搭桥手术39157196血管清障手术29167196合计68324392依据小概率值=0.1的独立性检验,推断这两种手术对病人又发作心脏病的影响.(填“有差别”或“没有差别”)7.某研究性学习小组对春季昼夜温差大小与某花卉种子
5、发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5月每天的昼夜温差与实验室每天每100颗种子浸泡后的发芽数,所得数据如表所示.日期3月1日3月2日3月3日3月4日3月5日昼夜温差/101113128发芽数/颗2325302616(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率;(2)请根据3月2日至3月4日的三组数据,求出y关于x的经验回归方程y=bx+a;(3)若由经验回归方程得到的估计数据与实际数据的差的绝对值均不超过2,则认为得到的经验回归方程是可靠的,试用3月1日与3月5日的两组数据检验,判断(2)中所得的经验回归方程是否可靠
6、.参考公式:b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2,a=ybx.二、综合应用8.(多选)下列说法正确的是()A.成对样本数据的线性相关程度越强,样本相关系数r越接近1B.在回归分析模型中,残差平方和越小,说明模型的拟合效果越好C.若y关于x的经验回归方程为y=0.1x+10,则当x每增加1个单位时,y一定增加0.1个单位D.若根据两个分类变量的22列联表中的数据计算得2=13.079,则依据小概率值=0.001的独立性检验,推断这两个变量有关联正确的概率不低于99.9%9.某校团委对“学生性别和喜欢微电影是否有关”作了一次调查
7、,其中女生人数是男生人数的13,男生喜欢微电影的人数占男生人数的16,女生喜欢微电影的人数占女生人数的23.若依据小概率值=0.05的独立性检验,推断学生性别和喜欢微电影有关,则男生至少有人.附:0.050.010.001x3.8416.63510.82810.某校为调查高中生在校参加体育活动的时间,随机抽取了100名高中学生进行调查,其中男生、女生各占一半,下面是根据调查结果绘制的学生日均体育锻炼时间的频率分布直方图:将日均体育锻炼时间不低于40分钟的学生评价为“良好”,已知“良好”评价中有18名女生.学生性别是否良好合计非良好良好男女合计(1)请将列联表补充完整;(2)试依据小概率值=0.
8、01的独立性检验,分析高中生的性别是否与喜欢体育锻炼有关.参考公式:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.2独立性检验中常用的小概率值和相应的临界值:0.10.050.010.0050.001x2.7063.8416.6357.87910.82811.(2020全国,理18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积
9、(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=9 000,i=120(xi-x)(yi-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法.并说明理由.附:样本相关系数r=i=1n(xi-x)(yi
10、-y)i=1n(xi-x)2i=1n(yi-y)2,21.414.三、探究创新12.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到的频率分布直方图如图所示.25周岁以上(含25周岁)组25周岁以下组(1)从样本中日平均生产件数不足60的工人中随机抽取2
11、人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80者为“生产能手”,请你根据已知条件作出22列联表,依据小概率值=0.1的独立性检验,能否推断生产能手与工人所在的年龄组有关?考点规范练53成对数据的统计分析1.D结合题中散点图,由图象的大致走向判断,此函数应该是对数函数模型,故应该选用的函数模型为y=a+bln x.2.D由已知得x=0+1+2+3+45=2,y=10+15+20+30+355=22,则t=y-6.5x=22-6.52=9.故y=6.5x+9.故预测2021年该型号无人机的年销售量为6.56+9=48(万件).3.B设调查的男、女学生的人数均为5
12、x,根据题意,得到22列联表为性别网络课程合计喜欢不喜欢男4xx5x女3x2x5x合计7x3x10x则2=10x(8x2-3x2)25x5x3x7x=10x21.由题意可知6.63510x2110.828,即139.33510x0,所以y与x正相关,故A正确.经验回归直线必过样本点的中心(x,y),故B正确.当x=179时,y的预测值为y=0.84179+28.96=179.32,故C正确,D错误.5.16由已知得x=1,则y=-2x+4=-21+4=2.故i=18yi=8y=82=16.6.没有差别零假设为H0:这两种手术对病人又发作心脏病的影响没有差别.根据22列联表中的数据,计算得到2=
13、392(39167-29157)2683241961961.7792.706=x0.1.根据小概率值=0.1的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即这两种手术对病人又发作心脏病的影响没有差别.7.解 (1)由已知得这5天中有3天发芽的种子数不小于25,故事件“m,n均不小于25”的概率为C32C52=310.(2)依题意,x=11+13+123=12,y=25+30+263=27,i=13(xi-x)(yi-y)=(-1)(-2)+13+0(-1)=5,i=13(xi-x)2=(-1)2+12+0=2.则b=52,a=27-5212=-3.故y关于x的经验回归方程为y=5
14、2x-3.(3)当x=10时,y=5210-3=22,|22-23|2.当x=8时,y=528-3=17,|17-16|6.635=x0.01.根据小概率值=0.01的独立性检验,有充分证据推断H0不成立,即高中生的性别与喜欢体育锻炼有关,此推断犯错误的概率不超过0.01.11.解 (1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60200=12 000.(2)样本(xi,yi)(i=1,2,20)的相关系数r=i=120(xi-x)(yi-y)i=120(xi-x)2i=120(yi-y)2=800809 000=2230.94.(3)分层随机抽样
15、:先根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.12.解 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.故样本中日平均生产件数不足60件的工人中,25周岁以上(含25周岁)组工人有600.05=3(人),记为A1,A2,A3;25周岁以下组工人有400.
16、05=2(人),记为B1,B2.从中随机抽取2名工人,所有可能的结果共有10种,该试验的样本空间=(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).设事件A=“至少有1名25周岁以下组工人”,则A=(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P(A)=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有600.25=15(人),“25周岁以下组”中的生产能手有400.375=15(人),据此可得22列联表如下:组别是不是生产能手合计生产能手非生产能手25周岁以上(含25周岁)组15456025周岁以下组152540合计3070100零假设为H0:生产能手与工人所在的年龄组无关.2=100(1525-1545)2604030701.7862.706=x0.1.根据小概率值=0.1的独立性检验,没有证据推断H0不成立,因此可以认为H0成立,即认为生产能手与工人所在的年龄组无关.7