《备战2024年高考数学一轮复习人教a必修第二册第九章 统计、成对数据的统计分析第3节 成对数据的统计分析.docx》由会员分享,可在线阅读,更多相关《备战2024年高考数学一轮复习人教a必修第二册第九章 统计、成对数据的统计分析第3节 成对数据的统计分析.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3节成对数据的统计分析 选题明细表 知识点、方法题号散点图、回归分析1,2,3,4,6独立性检验5,7,9,10,11综合应用8,12,13,141.已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得经验回归方程可能为(A)A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4解析:由变量x与y正相关,排除C,D选项.将点(3,3.5)代入A,B选项的方程中可知,选项A成立.2.(多选题)(2022广东惠州月考)某种产品的价格x(单位:元/kg)与需求量y(单位:kg)之间的对应数据如表所示,x1015202530
2、y1110865根据表中的数据可得经验回归方程为y=bx+14.4,则以下结论正确的是(BC)A.y与x正相关B.y与x负相关C.经验回归直线过点(20,8)D.该产品价格为35元/kg时,日需求量大约为3.4 kg解析:由表格数据可知,随着价格x的增加,需求量y随之减小,所以y与x负相关.因为x=10+15+20+25+305=20,y=11+10+8+6+55=8,经验回归方程y=bx+14.4必过点(20,8),所以8=b20+14.4,解得b=-0.32,所以当x=35时,y=-0.3235+14.4=3.2,日需求量大约为3.2 kg.3.一只红铃虫的产卵数y和温度x有关,现收集了6
3、组观测数据,y(单位:个)与温度x(单位:)得到样本数据(xi,yi)(i=1,2,3,4,5,6),令zi=ln yi,并将(xi,zi)绘制成如图所示的散点图.若用非线性经验回归方程y=aebx对y与x的关系进行拟合,则(A)A.a1,b0 B.a1,b0C.0a0 D.0a1,b0.由经验回归方程图象可知,经验回归方程的纵截距大于0,即ln a0,所以a1.4.(2022辽宁大连二模)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得如下数据:色差x212325272931色度y151619202123已知该产品的色度y和色差x之间满足线性相关关系,且y=0.8x+a,现有一
4、对测量数据为(33,25.2),则该数据的残差为(A)A.0.6 B.0.4C.-0.4D.-0.6解析:由表中数据可得x=16(21+23+25+27+29+31)=26,y=16(15+16+19+20+21+23)=19,将(26,19)代入经验回归方程得a=-1.8.所以y=0.8x-1.8.将x=33代入,可得y=0.833-1.8=24.6,因此其残差为25.2-24.6=0.6.5.某机构为研究中老年人坚持锻炼与患糖尿病、高血压、冠心病、关节炎四种慢性疾病之间的关系,随机调查部分中老年人,统计数据如下表1至表4,则这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是(B)表1患糖
5、尿病未患糖尿病坚持锻炼614不坚持锻炼725表2患高血压未患高血压坚持锻炼218不坚持锻炼1121表3患冠心病未患冠心病坚持锻炼416不坚持锻炼923表4患关节炎未患关节炎坚持锻炼713不坚持锻炼626A.糖尿病B.高血压C.冠心病D.关节炎解析:由表1得12=52(625-714)2203213390.43,由表2得22=52(221-1118)220321339=3.9,由表3得32=52(423-916)2203213390.43,由表4得42=52(726-613)2203213391.73,所以这四种慢性疾病可以通过坚持锻炼来预防的可能性最大的是高血压.6.(2022陕西西安模拟)小
6、华为了研究数学名次和物理名次的相关关系,记录了本班五名同学的数学和物理的名次,如图.后来发现第四名同学数据记录有误,那么去掉数据D(3,10)后,下列说法错误的是(B)A.样本相关系数r变大B.残差平方和变大C.变量x,y的相关程度变强D.样本相关系数r越趋近于1解析:由散点图知,去掉D(3,10)后,y与x的线性相关程度变强,且为正相关,所以r变大,且样本相关系数r越趋近于1,去掉D(3,10)后,散点分布更均匀,残差平方和变小.故A,C,D正确,B错误.7.有两个分类变量X和Y,其中一组观测值为如表的22列联表:XY合计Y1Y2X1a15-a15X220-a30+a50合计204565其中
7、a,15-a均为大于5的整数,则a=时,依据小概率值=0.01的独立性检验,认为“X和Y之间有关系”.附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中,n=a+b+c+d).0.10.050.0250.010.005x2.7063.8415.0246.6357.879解析:由题意知26.635,则65a(30+a)-(20-a)(15-a)220451550=13(13a-60)25 4006.635,解得a8.65或a0.58,因为a5且15-a5,aN,所以8.65a10,aN,所以a=9.答案:98.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条
8、流水线上各抽取100件产品作为样本称出它们的质量(单位:mg),质量值落在(175,225的产品为合格品,否则为不合格品.统计数据如下列22列联表,质量流水线合计甲乙合格品9296188不合格品8412合计100100200(1)依据小概率值=0.15的独立性检验,能否认为产品的包装的合格性与流水线的选择有关联?附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.临界值表:0.150.10.050.025x2.0722.7063.8415.0240.010.0050.001x6.6357.87910.828(2)公司工程师抽取几组一小时生产的产品数据进行
9、不合格品情况检查分析,在数量为x(单位:百件)的产品中,得到不合格品数量y(单位:件)的情况汇总如表所示,x/百件147810y/件214243540求y关于x的经验回归方程y=bx+a,并预测一小时生产2 000件时的不合格品数.(精确到1)附:b=i=1nxiyi-nxyi=1nxi2-nx2=i=1n(xi-x)(yi-y)i=1n(xi-x)2;a=y-bx.解:(1)根据22列联表可得2=200(924-968)2100100188121.4183.841=x0.05,所以依据小概率值=0.05的独立性检验,能认为成绩与班级有关系.10.(2022安徽芜湖模拟)为了检验某种血清预防感
10、冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0;“这种血清不能起到预防感冒的作用”,利用22列联表计算的结果,根据小概率值=0.01的独立性检验,可以认为H0成立,那么2的一个可能取值为(A)0.050.0250.010.0050.001x3.8415.0246.6357.87910.828A.7.879 B.6.635 C.5.024 D.3.841解析:由题意,26.635,由选项知2的一个可能取值为7.879.11.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,为了考察某种疫苗预防效果,在试验时,得到如下统计数据
11、,疫苗传染病合计未发病发病未注射30注射40合计7030100附表及公式:0.050.010.0050.001x3.8416.6357.87910.8282=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则下列判断错误的是(D)A.注射疫苗发病的动物数为10B.从该试验未注射疫苗的动物中任取一只,发病的概率为 25C.能在犯错概率不超过0.05的前提下,认为疫苗有效D.该疫苗的有效率为80%解析:现从试验动物中任取一只,取到“注射疫苗”动物的概率为0.5,则注射疫苗发病的动物数为1000.5-40=1
12、0,故A正确;22列联表如下:疫苗传染病合计未发病发病未注射302050注射401050合计7030100从该试验未注射疫苗的动物中任取一只,发病的概率为2050=25,故B正确;因为2=100(3010-4020)2703050504.7623.841=x0.05,根据小概率值=0.05的独立性检验,认为疫苗有效,故C正确;对于D选项,未考虑未注射疫苗的动物中也有不发病的情况,故D错误.12.某二手车经销商对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到数据如表所示,使用年数x234567售价y201286.44.43z=ln y3.002.482.081.
13、861.481.10如图所示,z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用样本相关系数加以说明;(2)求y关于x的经验回归方程,并预测某辆A型号二手车使用年数为9年时售价约为多少;(b,a小数点后保留两位有效数字)(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的经验回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.参考公式:b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx,r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(y
14、i-y)2.参考数据:i=16xiyi=187.4,i=16xizi=47.64,i=16xi2=139,i=16(xi-x)24.18,i=16(yi-y)213.96,i=16(zi-z)21.53,ln 1.460.38,ln 0.711 8-0.34.解:(1)由题意知x=16(2+3+4+5+6+7)=4.5,z=16(3+2.48+2.08+1.86+1.48+1.10)=2,又i=16xizi=47.64,i=16(xi-x)24.18,i=16(zi-z)21.53,所以r47.64-64.524.181.53=-6.366.395 4-0.99,所以z与x的样本相关系数大约为
15、-0.99,说明z与x的线性相关程度很高.(2)b=47.64-64.52139-64.52=-6.3617.5-0.36,所以a=z-bx=2+0.364.5=3.62,所以z与x的经验回归方程是z=-0.36x+3.62,又z=ln y,所以y关于x的经验回归方程是y=e-0.36x+3.62.令x=9,得y=e-0.369+3.62=e0.38.因为ln 1.460.38,所以y1.46,即预测某辆A型号二手车使用年数为9年时售价约为1.46万元.(3)当y0.711 8,即e-0.36x+3.620.711 8=eln 0.711 8e-0.34时,则有-0.36x+3.62-0.34
16、,解得x11,因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.13.(多选题)某中学课外活动小组为了研究经济走势,根据该市19992021年的GDP(国内生产总值)数据绘制出下面的散点图.该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一:y=kx+b(k0,x0);模型二:y=kex+b(k0,x0),下列说法正确的是(AD)A.变量y与x正相关B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况C.若选择模型二,y=kex+b的图象一定经过点(x,y)D.当x=13时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1解析:根据散点图易得变
17、量y与x正相关,故A正确;由散点图可得y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误;若选择模型二y=kex+b,令t=ex,则图象经过点(t,y),故C错误;当x=13时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1,故D正确.14.某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(单位:h)都在30 h以上,其中不足50 h的有5周,不低于50 h且不超过70 h的有35周,超过70 h的有10周.根据统计,该基地的西红柿增加量y(单位:kg)与使用某种液体肥料的质量x(单位:kg)之间的对应数据如折线图
18、所示.(1)依据折线图计算样本相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y与x的关系;(若|r|0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如表所示的关系:周光照量X/ h30X70光照控制仪运行台数321对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元.若商家提供了3台光照控制仪,求商家在过去50周的周总利润的平均值.参考公式:r=i=1n(xi-x)(y
19、i-y)i=1n(xi-x)2i=1n(yi-y)2,参考数据:0.30.55,0.90.95.解:(1)由已知数据可得x=2+4+5+6+85=5,y=3+4+4+4+55=4.因为i=15(xi-x)(yi-y)=(-3)(-1)+0+0+0+31=6,i=15(xi-x)2=(-3)2+(-1)2+02+12+32=25,i=15(yi-y)2=(-1)2+02+02+02+12=2,所以样本相关系数r=i=15(xi-x)(yi-y)i=15(xi-x)2i=15(yi-y)2=6252=9100.95.因为|r|0.75,所以可用线性回归模型拟合y与x的关系.(2)由条件可得在过去的50周里,当X70时,共有10周,此时只有1台光照控制仪运行,每周的总利润为13 000-21 000=1 000(元).当50X70时,共有35周,此时有2台光照控制仪运行,每周的总利润为23 000-11 000=5 000(元).当30X50时,共有5周,此时3台光照控制仪都运行,每周的总利润为33 000=9 000元.所以过去50周的周总利润的平均值为1 00010+5 00035+9 000550=4 600(元),所以商家在过去50周的周总利润的平均值为 4 600元.