《2024年高考数学概率论专题1 线性回归方程.pdf》由会员分享,可在线阅读,更多相关《2024年高考数学概率论专题1 线性回归方程.pdf(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题1 1 线性回归方程1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率 x(每分钟鸣叫的次数)与气温 y(单位:C)存在着较强的线性相关关系某地观测人员根据如表的观测数据,建立了 y 关于 x 的线性回归方程y=0.25x+,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为()x(次数/分钟)2030405060y(C)2527.52932.536A.33CB.34CC.35CD.35.5C【解析】解:由题意,得x=20+30+40+50+605=40,y=25+27.5+29+32.5+365=30,则=y-0.25x=30-0.2540=20;当x=56时,y=34故选
2、:B2.已知下列说法:对于线性回归方程y=3-5x,变量x增加一个单位时,y平均增加5个单位;在线性回归模型中,相关指数R2越接近于1,则模型回归效果越好;两个随机变量的线性相关性越强,则相关系数就越接近1;互斥事件不一定是对立事件,对立事件一定是互斥事件;演绎推理是从特殊到一般的推理,它的一般模式是“三段论”其中说法错误的个数为()A.1B.2C.3D.4【解析】解:对于线性回归方程y=3-5x,变量x增加一个单位时,y平均减少5个单位,故不正确;在线性回归模型中,相关指数R2越接近于1,则模型回归效果越好,故正确;两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故不正确;互斥事
3、件不一定是对立事件,对立事件一定是互斥事件,所以正确;演绎推理是从一般到特殊的推理,它的一般模式是“三段论”所以不正确;故选:C3.变量 x,y 之间的一组相关数据如表所示:若 x,y 之间的线性回归方程为 y=bx+12.28,则 b的值为()x4567y8.27.86.65.4A.-0.92B.-0.94C.-0.96D.-0.98【解析】解:x=4+5+6+74=5.5,y=8.2+7.8+6.6+5.44=7,则样本点的中心的坐标为(5.5,7),代入y=bx+12.28,得7=5.5b+12.28,则b=-0.96故选:C4.我国5G技术研发试验在2016-2018年进行,分为5G关
4、键技术试验、5G技术方案验证和5G系统验证三个阶段实施 2020 年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升,某手机商城统计了近5个月来5G手机的实际销量,如表所示:月份2020年6月2020年7月2020年8月2020年9月2020年10月月份编号x123452024年高考数学概率论专题1 线性回归方程销量y/部5096a185227若y与x线性相关,且求得线性回归方程为y=45x+5,则下列说法正确的是()A.a=142B.y与x正相关C.y与x的相关系数为负数D.12月份该手机商城的5G手机销量约为365部【解析】解:根据表中数据,可得x=1+2+3+4+5
5、5=3,y=453+5=140,于是,50+96+a+185+227=1405=700,即a=142,故A正确;由回归方程中x的系数大于0,可知y与x正相关,且相关系数r0,故B正确,C错误;12月份时,x=7,y=457+5=320部,故D错误故选:AB5.已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程y=2.3x+0.85,则m的值为0.5【解析】解:x=0+1+2+34=32,y=m+3+5.5+74=m+15.54,这组数据的样本中心点是32,m+15.54,关于y与x的线性回归方程y=2.1x+0.85,m+15.54=2.132+0.85,解得m=
6、0.5,m的值为0.5故答案为:0.56.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城 5 家商场的某件商品在 7 月 15号一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:价格x8.59m1111.5销售量y12n675已知销售量y与价格x之间有较强的线性相关关系,其线性回归方程是y=-3.2x+40,且m+n=20,则其中的m=10【解析】解:依题意x=40+m5,y=30+n5,代入回归直线方程得30+n5=-3.240+m5+40,根据题意m+n=20,解组成的方程组得m=n=10,故答案为:107.已知一组数据点:xx1x2x8
7、yy1y2y8用最小二乘法得到其线性回归方程为y=-2x+4,若数据x1,x2,x8的平均数为1,则8i=1yi=16【解析】解:由题意,x=1,设样本点的中心为(1,y),又线性回归方程为y=-2x+4,则y=-21+4=2,8i=1yi=82=16故答案为:168.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得20i
8、=1xi=80,20i=1yi=4000,20i=1(xi-x)2=80,20i=1(yi-y)2=8000,20i=1(xi-x)(yi-y)=7000(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;(2)求y关于x的线性回归方程;(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:使用年限台数款式1年2年3年4年5年甲款520151050乙款152010550某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?参考公式:相关系数r=ni=1(xi
9、-x)(yi-y)ni=1(xi-x)ni=1(yi-y)2对于一组具有线性相关关系的数据(xi,yi)(i=1,2,n),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2,a=y-bx【解析】解:(1)由题意知相关系数r=20i=1(xi-x)(yi-y)20i=1(xi-x)220i=1(yi-y)2=700808000=78=0.875,因为y与x的相关系数接近1,所以y与x之间具有较强的线性相关关系,可用线性回归模型进行拟合(2)由题意可得,b=20i=1(xi-x)(yi-y)20i=1(xi-x)2=70080=8.
10、75,a=y-bx=400020-8.75 8020=200-8.754=165,所以y=8.75x+165(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用 X(单位:万元)的分布列为X-50050100P0.10.40.30.2E(X)=-500.1+00.4+500.3+1000.2=30(万元)购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用Y(单位:万元)的分布列为:Y-302070120P0.30.40.20.1E(Y)=-300.3+200.4+700.2+1200.1=25(万元)因为E(X)E(Y),所以该县城选择购买一台甲款垃圾处理机器更划算9.近年
11、来,高铁的发展逐渐改变了人们的出行方式,我国2015-2019年高铁运营里程的数据如表所示年份20152016201720182019年份代码x12345高铁运营里程y(万千米)1.92.22.52.93.5()求y关于x的线性回归方程;()每一年与前一年的高铁运营里程之差即为该年新增的里程,若用 20162019年每年新增里程的频率代替之后每年新增相应里程的概率,求2023年中国高铁运营里程大于或等于5万千米的概率附:线性回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为:b=ni=1xiyi-nxyni=1xi2-nx2,a=y-bx【解析】解:()x=15(1+2+3+4+5)=3
12、,y=15(1.9+2.2+2.5+2.9+3.5)=2.6,5i=1xiyi=11.9+22.2+32.5+42.9+53.5=42.9,5i=1xi2=1+4+9+16+25=55,b=42.9-532.655-532=0.39,a=2.6-0.393=1.43y关于x的线性回归方程为:y=0.39x+1.43()设每年新增高铁运营里程为x万千米,由条件知X的分布列为:X0.30.40.6P121414若2023年中国高铁运营里程小于5万平方千米,则20202023年每年新增的高铁运营里程有三种情况:0.34,0.33+0.4,0.32+0.42,相应的概率为P=124+C1412314+
13、C24122142=9322023年中国高铁运营里程大于或等于5万千米的概率为93210.某地区2013年至2019年居民纯收入y(单位:千元)的部分数据如表所示:年份2013201420152016201720182019年份代号t1234567人均纯收入y3.94.34.65.45.82018 和2019 年的居民纯收入 y(单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.52019年抽取的居民纯收入(单位:千元)数据:6.2
14、 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7()求y关于t的线性回归方程;()当地政府为了提高居民收入水平,现从 2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择 3 人进行座谈,了解其工作行业及主要收入来源设 X 为选出的 3 人中 2018 年纯收入高于7.0千元的人数,求随机变量X的分布列和数学期望附:回归直线的斜率和截距的最小二乘法估计公式分别为:b=ni=1(ti-t)2(yi-y)ni=1(ti-t)2,a=y-bt【解析】解:()根据 2018 年的抽样数据可得 2018 年的人均纯收入为110(5.2+4.8+6.5+5.6
15、+6.0+7.1+6.1+7.3+5.9+7.5)=6.2 千元,根据 2019 年的抽样数据可得 2019 年的人均纯收入为110(6.2+7.8+6.6+5.8+7.1+6.8+7.2+7.9+5.9+7.75)=6.9千元,由所给的数据得 t=17(1+2+3+4+5+6+7)=4,y=17(3.9+4.3+4.6+5.4+5.8+6.2+6.9)=5.3,7i=1(ti-t)2=9+4+1+0+1+4+9=28,7i=1(ti-t)(yi-y)=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14,b=7i=1(ti-t)(yi-y
16、)7i=1(ti-t)2=1428=0.5,则a=y-bt=5.3-0.54=3.3,则所求y关于t的线性回归方程为y=0.5t+3.3;()由 2018 年和 2019 年的抽样数据可知,2018 年居民纯收入高于 7.0 千元的有 3 人,2019 年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X的可能取值为0,1,2,3,则P(X=0)=C35C38=528,P(X=1)=C13C25C38=1528,P(X=2)=C23C15C38=1556,P(X=1)=C33C38=156,随机变量X的分布列为则X的分布列为:X0123P52815281556156则E(X)=0528+
17、11528+21556+3156=9811.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量某地车牌竞价的基本规则是:“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额某人拟参加2020年12月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告统计了最近 5个月参与竞拍的人数(见表):月份2020.072020.082020.092020.102020.11月份编号t12345竞拍人数y(万人)0.50.611.41.7(1)由收集数据的散点图发现1可用
18、线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系请用最小二乘法求y关于t的线性回归方程:y=bt+a,并预测2020年12月份参与竞拍的人数(2)某市场调研机构对200位拟参加2020年12月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:报价区间(万元)1,2)2,3)3,4)4,5)5,6)6,7频数206060302010()求这200为竞拍人员报价 X的平均数值x和样本方差s2(同一区间的报价可用该价格区间的中点值代替);()假设所有参与竞价人员的报价 X可视为服从正态分布N(,2),且 与2可分别由()中所求的样本平均数x及s2估值若2020年12月份实
19、际发放车牌数量是 3174,请你合理预测(需说明理由)竞拍的最低成交价参考公式及数据:回归方程y=bx+a,其中b=ni=1xiyi-xyni=1xi2-nx2,a=y-bx;5i=1t2i=55,5i=1tiyi=18.8,1.7 1.3;若随机变量 Z 服从正态分布 N(,2),则 P(-Z +)=0.6826,P(-2 Z +2)=0.9544,P(-3Z+3)=0.9974方差S2=1nni=1(xi-x)2=ni=1(xi-x)2Pi【解析】解:(1)由题意得 t=1+2+3+4+55=3,y=0.5+0.6+1+1+1.75=1.04,5i=1t2i=55,5i=1tiyi=18.
20、8,b=ni=1xiyi-xyni=1xi2-nx2=18.8-531.0455-532=0.32,a=y-bx=1.04-0.323=0.08,y关于t的线性回归方程为y=0.32t+0.08当t=6时,y=0.326+0.08=2预测2020年12月份参与竞拍的人数为2万人(2)(i)依题意可得这200人报价的平均值为:x=1.50.1+2.50.3+3.50.3+4.50.15+5.50.1+6.50.05=3.5这200人报价的方差为:S2=(1.5-3.5)20.1+(2.5-3.5)20.3+(3.5-3.5)20.3+(4.5-3.5)20.15+(5.5-3.5)20.1+(6
21、.5-3.5)20.05=1.7(ii)2020年12月份实际发放车牌数量是3174,根据竞价规则,报价在最低成交价以上人数占总人数比例为317420000100%=15.87%,根据假设报价X可视为服从正态分布N(,2),=3.5,2=1.7,=1.7 1.3,P(x+)=1-P(-x+)2=0.1587,P(X4.8)=0.1587,预测竞拍的最低成交价为4.8万元12.某医疗专家组为了研究新冠肺炎病毒在特定环境下一周内随时间变化的繁殖情况,得到如下的实验数据:天数t(天)1234567繁殖个数y(千个)1123446(1)由如表数据可知,可用线性回归模型拟合y与t的关系,求y关于t的线性
22、回归方程;()若由线性回归方程得到的估计数据与实验数据的误差不超过 0.5,则该实验数据是“理想数据”,现从实验数据中随机抽取3个,求“理想数据”的个数X的分布列和数学期望参考公式:回归方程y=bt+a中斜率和截距的最小二乘估计公式分别为 b=ni=1(ti-t)(yi-y)ni=1(ti-t)2,a=y-bt【解析】解:()由题意,t=4,y=3,7i=1tiyi=107,7i=1ti2=140,b=7i=1tiyi-7ty7i=1ti2-7t2=107-84140-112=2328,a=y-bt=3-23284=-27y关于t的线性回归方程为y=2328t-27;()由题意将估计数据与实验
23、数据列表:天数t(天)1234567繁 殖 个数y(千个)1123446估 计 个数y(千个)152819146128310728651415328由列表和题意可知该实验数据为“理想数据”的有5个,故X的所有可能取值为1,2,3P(X=1)=C15C22C37=17,P(X=2)=C25C12C37=47,P(X=3)=C35C37=27“理想数据”个数X的分布列为:X123P174727则E(X)=117+247+327=15713.在线教育的发展,有利于弥补乡村教育短板,为我国各地区教育均衡发展提供了条件.2019年 政府工作报告 明确提出发展“互联网+教育”促进优质资源共享下面是 201
24、5-2019 年我国在线教育网络使用率的统计表:年份t20152016201720182019使用率y(%)1618.820.124.327.2其散点图如图:设日期代码x=t-2017()求y关于x的线性回归方程;()根据线性回归方程,预测2025年我国在线教育网络使用率约达到多少?附:回归直线y=bx+a中斜率和截距的最小二乘估计公式:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2,a=x-bx【解析】解:()由x=t-2017,得5组对应数据为(-2,16),(-1,18.8),(0,20.1),(1,24.3),(2,27.2)
25、,则x=15-2+(-1)+0+1+2=0,y=15(16+16.8+20.1+24.3+27.2)=21.28,求出5i=1x2i=10,5i=1xiyi=27.9,所以:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2=27.9-5021.2810-502=2.79,a=x-bx=21.28-2.790=21.28,所以y关于x的线性回归方程为y=bx+a=2.79x+21.28()当t=2025时,x=2025-2017=8,此时y=2.798+21.28=43.6,所以预测2025年我国在线教育网络使用率约达到43.6%14.学
26、校食堂统计了最近 5 天到餐厅就餐的人数 x(百人)与食堂向食材公司购买所需食材(原材料)的数量y(袋),得到如下统计表:第一天第二天第三天第四天第五天就餐人数x(百人)13981012原材料y(袋)3223182428(1)根据所给的5组数据,求出y关于x的线性回归方程y=y=bx+a;(2)已知购买食材的费用C(元)与数量y(袋)的关系为C=400y-20,0y36(xN)380y,y36(yN),投入使用的每袋食材相应的销售单价为 700 元,多余的食材必须无偿退还食材公司,据悉下周一大约有 1500 人到食堂餐厅就餐根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大
27、利润,最大利润是多少?(注:利润L=销售收入-原材料费用)参考公式:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1x2i-nx2,a=y-bx参考数据:5i=1xiyi=1343,5i=1x2i=558,5i=1y2i=3237【解析】解:(1)由所给数据可得:x=13+9+8+10+125=10.4,y=32+23+18+24+285=25,b=5i=1xiyi-5xy5i=1xi2-5x2=1343-510.425558-51042=2.5,a=y-bx=25-2.510.4=-1,y关于x的线性回归方程为y=2.5x-1;(2)由(1)中求出
28、的线性回归方程知,当x=15时,y=2.515-1=36.5,即预计需要购买食材36.5袋C=400y-20,0y36(xN)380y,y36(yN),当y14607,即3040710i=1(yi-y)21460710i=1(yi-y)2,即1-3040710i=1(yi-y)21-1460710i=1(yi-y)2,R120,b0)两边取自然对数,得lny=blnx+lna;令vi=lnxi,ui=lnyi,i=1,2,3,n;得u与v具有线性相关关系,计算b=5i=1viui-5vu5i=1vi2-5v2=0.921.6=0.575,lna=u-bv=145-0.5751=2.225,b0
29、.6,lna2.2,u=0.6v+2.2,故y关于x的回归方程为y=e0.6lnx+2.2,即y=e2.2x0.6;(2)在(1)的回归方程中,y=e0.6lnx+2.2,高铁密度超过30千米/万平方千米;即e0.6lnx+2.230,6lnx+2.2ln303.4,lnx2xe27.4,即x=8时,高铁密度超过30千米/万平方千米;所以预测2019年,高铁密度超过30千米/万平方千米3.某公司生产一种产品,从流水线上随机抽取 100 件产品,统计其质量指数并绘制频率分布直方图(如图1):产品的质量指数在50,70)的为三等品,在70,90)的为二等品,在90,110的为一等品,该产品的三、二
30、、一等品的销售利润分别为每件1.5,3.5,5.5(单位:元),以这100件产品的质量指数位于各区间的频率代替产品的质量指数位于该区间的概率.(1)求每件产品的平均销售利润;(2)该公司为了解年营销费用x(单位:万元)对年销售量y(单位:万件)的影响,对近5年的年营销费用xi和年销售量yi(i=1,2,3,4,5)数据做了初步处理,得到的散点图(如图2)及一些统计量的值.5i=1ui5i=1vi5i=1ui-uvi-v5i=1ui-u216.3024.870.411.64表中ui=lnxi,vi=lnyi,u=155i=1ui,v=155i=1vi根据散点图判断,y=axb可以作为年销售量y(
31、万件)关于年营销费用x(万元)的回归方程.()建立y关于x的回归方程;()用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用,取e4.159=64)参考公式:对于一组数据:(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小乘估计分别为=ni=1(ui-u)(vi-v)ni=1(ui-u)2,=v-u【解析】(1)设每件产品的销售利润为元,则的所有可能取值为1.5,3.5,5.5由直方图可得:一、二、三等品的频率分别为0.4,0.45,0.15,所以P=1.5=0.15,P=3.5=0.45,P=5.5=0.
32、4,所以:随机变量的分布列为:1.53.55.5P0.150.450.4所以,E=1.50.15+3.50.45+5.50.4=4故每件产品的平均销售利润为4元.(2)()由y=axb得,lny=ln axb=lna+blnx,令u=lnx,v=lny,c=lna,则v=c+bu,由表中数据可得,b=ni=1ui-uvi-vni=1ui-u2=0.411.64=0.25,则c=v-bu=24.875-0.2516.305=4.159所以,v=4.159+0.25u,即lny=4.159+0.25lnx=ln e4.159x14因为e4.159=64,所以y=64x14故所求的回归方程为y=64
33、x14()设年收益为z万元,则z=Ey-x=256x14-x设t=x14,f t=256t-t4,则 f t=256-4t3=4 64-t3当t 0,4时,f t0,f t在 0,4单调递增,当t 4,+时,f t60,点P会受到巢声污染的干扰.7.某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量 x(单位:亿元)对年销售额y(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:y=+x2,y=ex+t,其中,t均为常数,e为自然对数的底数现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,12,并对这些数据作了初步处理,得到了右侧的散点
34、图及一些统计量的值令ui=x2i,vi=lnyi(i=1,2,12),经计算得如下数据:xy12i=1(xi-x)212i=1(yi-y)2uv20667702004604.2012i=1(ui-u)212i=1(ui-u)(yi-y)12i=1(vi-v)212i=1(xi-x)(vi-v)3125000215000.30814(1)设 ui和 yi的相关系数为r1,xi和 vi的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);(ii)若下一年销售额y需达到90亿元,预测下一年的研发资金投入
35、量x是多少亿元?附:相关系数r=ni=1(xi-x)(yi-y)ni=1(xi-x)2ni=1(yi-y)2,回归直线y=a+bx中斜率和截距的最小二乘估计公式分别为:b=ni=1(xi-x)(yi-y)ni=1(xi-x)2,a=y-bx;参考数据:308=477,90 9.4868,e4.499890【解析】解:(1)r1=12i=1(ui-u)(yi-y)12i=1(ui-u)212i=1(yi-y)2=215003125000200=2150025000=4350=0.86,r2=12i=1(xi-x)(vi-v)12i=1(xi-x)212i=1(vi-v)2=147700.308=
36、14770.2=10110.91,则 r10,z(x)单调递增;当x(27,+)时,z(x)0,z(x)单调递减所以当x=27千万元时,年利润z取得最大值,且最大值为z(27)=54千万元.答:要使年利润取最大值,预计下一年度投入27千万元.10.近年来随着互联网的高速发展,旧货交易市场也得以快速发展.某网络旧货交易平台对 2018年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图,和如图所示的散点图.现把直方图中各组的频率视为概率,用x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格.(1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台
37、,现从这100台设备中,按分层抽样抽取使用时间x 12,20的4台设备,再从这4台设备中随机抽取2台,求这2台设备的使用时间都在12,16的概率.(2)由散点图分析后,可用y=ebx+a作为此网络旧货交易平台上该种机械设备的平均交易价格y关于其使用时间x的回归方程.表中z=lny,z=11010i=1zi(i)根据上述相关数据,求y关于x的回归方程;(ii)根据上述回归方程,求当使用时间x=15时,该种机械设备的平均交易价格的预报值(精确到0.01).附:对于一组数据 u1,v1,u2,v2,un,vn,其回归直线v=+u的斜率和截距的最小二乘估计分别为=ni=1uivi-nuvni=1u2i
38、-nu2,=v-u参考数据:e0.55=1.733,e-0.95=0.3867,e-1.85=0.1572.【解析】(1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x 12,16的台数为10040.03=12,使用时间x 16,20的台数为10040.01=4,按分层抽样所抽取4台中,使用时间x 12,16的设备有3台,分别记为A,B,C;使用时x16,20的设备有1台,记为d,从这4台设备中随机抽取2台的结果为 A,B,A,C,A,d,B,C,B,d,C,d,共有6种等可能出现的结果,其中这2台设备的使用时间x都在 12,16结果为 A,B,A,C,B,C,共有3种
39、,:所求事件的概率为36=12;(2)(i)由题意得z=lny=lnebx+a=bx+a,b=10i=1xizi-10 xz10i=1x2i-10 x2=79.75-105.51.9385-105.52=-0.3a=z-bx=1.9+0.35.5=3.55,z关于x的线性回归方程为z=-0.3x+3.55y关于x的回归方程为y=e-0.3x+3.55,(ii)由(i)当使用时间x=15时,该种机械设备的平均交易价格的预报值为y=e-0.950.39万元.,专题3 3 频率分布直方图1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩
40、在120,140)之间的学生中用分层抽样的方法抽取 5人,应从120,130)间抽取人数为b,则()A.a=0.2,b=2B.a=0.025,b=3C.a=0.3,b=4D.a=0.030,b=3【解析】解:由题得10(0.005+0.035+a+0.020+0.010)=1,所以a=0.030在120,130)之间的学生人数为:100100.030=30人,在130,140)之间的学生人数为:100100.020=20人,在120,140)之间的学生人数为:100(100.030+0.020)=50人,又用分层抽样的方法在120,140)之间的学生50人中抽取5人,即抽取比例为:110,所以
41、成绩在120,130)之间的学生中抽取的人数应,30110=3,即b=3,故选:D2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组70,80)80,90)90,100)100,110)110,120)频数1420361812估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)()A.100B.98.8C.96.6D.94.4【解析】解:平均数x=0.1475+0.2085+0.3695+0.18105+0.12115=94.4故选:D3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥
42、优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是()A.86%B.83%C.90%D.84%【解析】解:利用求加权平均数的公式解得:3071%+4085%+5091%30+40+50=0.84=84%,故选:D4.已知样本数据x1,x2,xn(nN N*)的平均数与方差分别是a和b,若yi=-2xi+3(i=1,2,n),且样本数据y1,y2,yn的平均数与方差分别是b和a,则a-b=()A.1B.2C.3D.4【解析】解:由题意得:-2a+3=ba=4b,解
43、得:a=43b=13 ,故a-b=1,故选:A5.下面定义一个同学数学成绩优秀的标志为:“连续 5次考试成绩均不低于120分”现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):甲同学:5个数据的中位数为127,众数为120;乙同学:5个数据的中位数为125,总体均值为127;丙同学:5个数据的中位数为135,总体均值为128,总体方差为19.8则可以判定数学成绩优秀同学为()A.甲、乙B.乙、丙C.甲、丙D.甲、乙、丙【解析】解:在中,甲同学:5个数据的中位数为127,众数为120,所以前三个数为120,120,127,则后两个数肯定大于127,故甲同学数学成绩优秀,
44、故成立;在中,5个数据的中位数为125,总体均值为127,可以找到很多反例,如:118,119,125,128,145,故乙同学数学成绩不优秀,故不成立;在中,5个数据的中位数为135,总体均值为128,总体方差为19.8设x1x2x3120,丙同学数学成绩优秀,故成立数学成绩优秀有甲和丙2个同学故选:C6.若数据x1,x2,xn的平均数x=3,方差s2=1,则数据2x1+3,2x2+3,2xn+3的平均数和方差分别为()A.6,6B.9,2C.9,6D.9,4【解析】解:由题意若数据x1,x2,xn的平均数x=3,方差s2=1,可得x1+x2+xn=3n,则:2x1+3+x2+3+xn+3=
45、2(x1+x2+xn)+3n=9n,所以数据2x1+3,2x2+3,2xn+3的平均数为9又S2=1n(x1-3)2+(x2-3)2+(xn-3)2=1,所以(x1-3)2+(x2-3)2+(xn-3)2=n,所以1n(2x1+3-9)2+(2x2+3-9)2+(2xn+3-9)2=4n(x1-3)2+(x2-3)2+(xn-3)2=4,则数据2x1+3,2x2+3,2xn+3的平均数和方差分别为9,4故选:D7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了 40个住户,
46、根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B区住户满意度评分的频率分布表B区住户满意度评分的频率分布表满意度评分分组50,60)60,70)70,80)80,90)90,100频数4610128()在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);()根据住户满意度评分,将住户和满意度分为三个等级:满意度评分低于 70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意试估计哪个地区住户的满意度等级为不满意的概率
47、大?若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?说明理由【解析】解:()作出如图所示的频率分布直方图,B区住户满意度评分的频率分布直方图如图所示A区住户满意度评分的平均值为450.1+550.2+650.3+750.2+850.15+950.05=67.5;B区住户满意度评分的平均值为550.1+650.15+750.25+850.3+950.2=78.5通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而 A区住户满意度评分比较分散()记D表示事件:“A区住户的满意度等级为不满意”,记 E表示事件:“B区住户的满意度等级
48、为不满意”,则P(D)=(0.010+0.020+0.030)10=0.6,P(E)=(0.010十0.015)10=0.25,所以A区住户的满意度等级为不满意的概率较大若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的 2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组65,75),第二组75,85),第八组135,145,如图是按上述分组方法得到的频率分布直方图
49、的一部分(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取 2名,求他们的分差的绝对值小于 10 分的概率【解析】解:(1)由频率分布直方图得第七组的频率为:1-(0.004+0.012+0.016+0.030+0.020+0.006+0.004)10=0.08完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:700.00410+800.01210+900.01610+1000.03010+1
50、100.02010+1200.00610+1300.00810+1400.00410=102(3)样本成绩属于第六组的有0.0061050=3人,样本成绩属于第八组的有0.0041050=2人,从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数n=C25=10,他们的分差的绝对值小于10分包含的基本事件个数m=C23+C22=4,他们的分差的绝对值小于10分的概率p=mn=410=259.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准 x,用水量不超过 x 的部分按平价收费,超出 x